Vous êtes sur la page 1sur 118

UNIVERSITE DE PARIS IV SORBONNE

CELSA
Ecole des hautes tudes en sciences de linformation et de la communication

MASTER 2
me
anne

Mention : Information et Communication
Spcialit : Mdias et Communication
Parcours : Mdias Informatiss et Stratgies de Communication



Comment lanalyse des conversations en ligne peut permettre de
questionner nouveau la notion dopinion publique ?
Les enjeux de lopinion mining dans les tudes dopinion


Prpar sous la direction du Professeur Vronique RICHARD

Marie Morin
Promotion : 2013-2014
Option : Mdias et Communication
Soutenu le : 1
er
octobre 2014
Note du mmoire : 15,5/20
Mention : Bien





Remerciements

Je tiens remercier en premier lieu Alban Martin, mon rapporteur professionnel,
pour son suivi et ses encouragements pendant la rdaction de ce mmoire. Je
remercie galement Bertrand Horel, mon rapporteur universitaire, pour ses conseils
et ses retours sur mon travail.
Je remercie galement mes collgues de Bouygues Telecom, pour leur soutien et
leurs encouragements pendant la rdaction de ce mmoire, et en particulier Adrien et
Alexandre qui ont manifest un intrt particulier pour mon sujet.
Enfin, je remercie toutes les personnes qui ont contribu de prs ou de loin
llaboration de mon sujet ainsi qu la relecture de ce travail universitaire en
particulier : Anne, Paulette, Alain, Lucie, Xavier, Odile et Michel.

1

Table des matires
Introduction ......................................................................................................................... 3
I. Imaginaires de la cyberdmocratie : le rseau, un espace plus dmocratique que
lespace public traditionnel ? ............................................................................................14
A. Dcloisonnement de lespace public : entre rallocation de lautorit et
dsinformation du citoyen ..................................................................................... 17
1. La fin du paternalisme mdiatique ........................................................... 17
2. Lre de la dsinformation ........................................................................ 21
B. Slection des informations en ligne : la part prescriptive de la technique 25
1. Algorithmes, les nouveaux gate-keepers ? ........................................ 25
2. Les hasards de lorganisation sociale de linformation ............................. 29
C. Diffusion des informations sur Internet : la viralit nest pas un processus
galitaire ............................................................................................................... 32
1. Dconstruire la prsupposition dgalit ................................................... 32
2. La mtaphore de la viralit en question .................................................... 36
II. Discours promotionnels : un frein dpasser pour lgitimer la fouille dopinion 42
A. Libration des subjectivits : comment reconnatre une opinion ? ........... 44
1. Le nouveau partage du sensible .............................................................. 44
2. Lopinion, un objet ncessairement impalpable ? ..................................... 50
B. Des promesses opaques : les processus techniques dissimuls par des
discours promotionnels ......................................................................................... 52
1. La vise promotionnelle du discours de lgitimation ................................ 52
2. Des processus techniques enferms dans des boites noires ................... 59

2

C. Dvoiler les ajustements techniques : un cheminement ncessaire pour
mettre fin aux controverses ................................................................................... 62
1. Forces et faiblesses du traitement automatique des langues ........................ 62
2. La disparition des critres sociodmographiques .......................................... 64
III. Analyse et reprsentation des donnes : transformer la fouille dopinion en enjeu
de pouvoir par la rationalisation des mthodes ...............................................................68
A. Interprtation des noncs : limportance des mdiations techniques et du
contexte dnonciation .......................................................................................... 69
1. Lnonciation ditoriale, un lment indissociable de ses mdiations
techniques ......................................................................................................... 69
2. La ncessaire laboration de nouveaux critres dinterprtation ............. 72
B. Reprsentation des opinions : la recherche des ajustements qui
permettront dillustrer les diffrentes forces en prsence ...................................... 76
1. Lopinion publique, une simple addition des opinions individuelles ? ....... 76
2. Lopinion, un objet sans cesse ajust au contexte social dans lequel elle
sexprime ........................................................................................................... 79
C. Mise en forme du Web : un nouvel enjeu de pouvoir ? ..................................... 81
1. Cartographies du Web, des objets communicationnels crateurs de sens
81
2. Le Web, un nouveau laboratoire politique ? ............................................. 85
Conclusion ..........................................................................................................................90
Bibliographie ......................................................................................................................95
Annexes ............................................................................................................................ 102
Rsum ............................................................................................................................. 114
Mots cls ........................................................................................................................... 115

3





Introduction

En dcembre 2010, le mouvement contestataire que lon appellerait bientt le
Printemps Arabe mergeait pour la premire fois en Tunisie, inaugurant la vague
protestataire qui allait rapidement se propager dans une grande partie du monde
arabe. Si le bilan de ces mobilisations est aujourdhui mitig, ces manifestations ont
nanmoins permis de mettre en exergue le rle jou par Internet et en particulier par
les rseaux sociaux, pour contourner la censure et la propagande qui dominaient
dans les mdias traditionnels
1
dans des pays o la dissidence ntait pas autorise.
Bien quil convienne de ne pas se laisser emporter par un certain dterminisme
technique qui consisterait attribuer une autonomie ces technologies de
linformation et de la communication comme ont pu le suggrer les titres accrocheurs
de certains journaux tels que rvolution Facebook , e-rvolution ou encore
rvolution 2.0
2
, il est ncessaire de sinterroger propos du rle jou par Internet
pendant ces mobilisations, notamment en ce qui concerne la diffusion et la circulation
de linformation, ainsi que lexpression dopinions alternatives. En effet, si les usages
dInternet ne peuvent tre considrs comme tant lorigine du soulvement du
peuple tunisien n Sidi Bouzid suite limmolation dun jeune vendeur, Internet

1
LECOMTE, Romain, Rvolution tunisienne et Internet : le rle des mdias sociaux , LAnne du
Maghreb [disponible en ligne : http://anneemaghreb.revues.org/1288], publi le 01 septembre 2011,
consult le 28 juin 2014.
2
Ibid. Lauteur rappelle que lorigine de la rvolution tunisienne de 2010-2011 vient des populations
des rgions rurales de lintrieur du pays qui revendiquaient un droit au travail, la justice sociale,
la dignit . Bien que les jeunes tunisiens connects aient t des acteurs essentiels de la rvolution
tunisienne et que la Tunisie ait juste titre t remarque pour son dveloppement et ses avances
en matire de NTIC relativement au reste du continent africain et mme du monde arabe , le pays
est cependant marqu [d]importantes disparits rgionales en termes daccs et dutilisation
dInternet . Il est donc ncessaire de rappeler que si Internet a [..] pu faciliter ou acclrer la
propagation des rvoltes dans les zones les plus dfavorises du pays, le tlphone portable a
probablement constitu une arme communicationnelle bien plus dterminante dans cette extension .

4

en tant quespace alternatif difficilement contrlable, a permis de nombreux
Tunisiens connects de dcouvrir images lappui les vnements qui
secouaient dautres zones du pays, partager les informations avec leurs contacts,
mettre en commun un mcontentement grandissant
3
.
Ainsi, pendant le soulvement en Tunisie, le contrle des mdias traditionnels
4
par
le pouvoir, empchant la confrontation des ides et contribuant au verrouillage de
lespace public a t contourn par des activistes qui ont utilis Internet et les
rseaux sociaux comme canal de diffusion de linformation, ainsi que comme espace
public alternatif pour exprimer une opinion contestataire. Lexemple tunisien, ainsi
que celui des autres rvolutions arabes ayant eu lieu depuis ce premier
soulvement, illustrent bien comment, dans le cas dun espace mdiatique musel
par le pouvoir en place, Internet peut permettre de capter des mouvements dopinion
alternatifs qui navaient pas pu trouver leur place dans un espace public cloisonn.
Face ce constat, nous pouvons nous demander si en dmocratie, et en
particulier en France o lespace mdiatique est a priori libre, il existe une
fragmentation similaire entre la reprsentation de lopinion publique offerte par les
mdias traditionnels et lopinion publique qui circule en ligne ?
Ltude de lopinion publique ne peut se faire sans sinterroger propos de la
notion despace public. Dfinissant les fondements du concept, Habermas
caractrise lespace public bourgeois du XVII et XVIIIme sicle comme suit :

[Il sagit de] la sphre intermdiaire qui sest constitue historiquement, au moment des
lumires, entre la socit civile et ltat. Cest le lieu, accessible tous les citoyens, o un
public sassemble pour formuler une opinion publique. Lchange discursif de positions
raisonnables sur les problmes dintrts gnraux permet de dgager une opinion publique
5
.

Cette premire dfinition du concept assigne donc lespace public un rle de
mdiateur entre la socit et lEtat. La notion de publicit revt galement une
importance fondamentale dans le fonctionnement de cet espace. En effet, il sagit de

3
Ibid.
4
Par mdias traditionnels nous entendons la radio, la presse crite et la tlvision
5
Dfinition de lespace public par HABERMAS, Jrgen selon WOLTON, Dominique, Espace
public , Dominique Wolton [Disponible en ligne : http://www.wolton.cnrs.fr/spip.php?article67],
consult le 10 juillet 2014.

5

lgitimer la sphre publique et les dbats qui sy droulent par lusage public de la
raison qui permet de mettre en concurrence des arguments dans le but de trouver un
consensus qui pourra reprsenter lintrt gnral de la socit
6
, et ainsi donner un
moyen de pression aux citoyens pour contrer le pouvoir de lEtat. Dans cette
conception de lespace public, tous les propos ne mritent cependant pas dtre
ports la connaissance de tous car il faut que ceux-ci correspondent des
critres spcifiques qui leur confrent un intrt gnral
7
, ce qui dlimite ainsi le
primtre de la publicit.
Pour complter cette notion, Dominique Wolton caractrise lespace public dans
une dmocratie de masse cest--dire un espace beaucoup plus large
quautrefois, avec un nombre beaucoup plus grand de sujets dbattus, un nombre
beaucoup plus grand dacteurs intervenant publiquement, une omniprsence de
linformation, des sondages, du marketing et de la communication
8
:

Il sagit dun espace symbolique o sopposent et se rpondent les discours, la plupart
contradictoires, tenus par les diffrents acteurs politiques, sociaux, religieux, culturels,
intellectuels, composant une socit. Cest donc avant tout un espace symbolique, qui requiert
du temps pour se former, un vocabulaire et des valeurs communes, une reconnaissance
mutuelle des lgitimits ; une vision suffisamment proche des choses pour discuter, sopposer,
dlibrer
9
.

Ainsi dmatrialis, lespace public selon Dominique Wolton prend donc une
dimension symbolique, celle de la dmocratie et du dbat dides en train de se faire.
Cependant, pour pouvoir prendre la parole dans cet espace, il faut que la
lgitimit des acteurs qui participent au dbat soit reconnue. Cet espace nest
donc a priori pas ouvert tous.
Alban Martin, complte cette notion en y intgrant le rle des mdias en tant que
support la circulation et la formation dopinions :


6
BENRAHHAL SERGHINI, Zineb et MATUSZAK, Cline, Lire ou relire Habermas : lectures croises
du modle de lespace public habermassien , tudes de communication [Disponible en ligne :
http://edc.revues.org/868], publi le 02 septembre 2009, consult le 10 juillet 2014.
7
CARDON, Dominique, La dmocratie internet, promesses et limites , op. cit., p.35
8
WOLTON, Dominique, Espace public , op. cit.
9
Ibid.

6

Lopinion publique circule dans la sphre intermdiaire entre la socit civile et lEtat :
lespace public. Cest le lieu accessible thoriquement tous les citoyens, o lon trouve les
publications (publicare) qui concernent tout le monde (publicus), et qui sont destines tre
potentiellement discutes. Les mdias, au cur de lespace public, servent de support la
formation dopinions et leur circulation. Leur rle dinformateur, de filtre et dagrgateur des
diffrents courants dopinions y contribue beaucoup. A cette fin, ils crent et diffusent des
sondages, offrent une tribune aux experts, aux lus, aux responsables dorganisation
reprsentant un nombre plus ou moins grand de citoyens. Par ce biais, les hommes politiques,
lus ou candidats, ont accs lespace public, et contribuent directement ou indirectement la
formation de lopinion publique
10


Nous voyons bien ici, travers ces diffrentes conceptions de lespace public,
comment celui-ci va tre amen jouer un rle sur la formation de lopinion publique.
Lidal de lespace public est donc de permettre chacun, par confrontation
darguments et dides, de se forger une opinion personnelle. Les mdias jouent
aujourdhui un rle central dans la diffusion et la circulation des ides, offrant une
tribune permettant la confrontation des arguments. La recherche de lintrt gnral
doit alors permettre de dgager une opinion dite publique , cest--dire une
opinion concerte capable dmerger aprs confrontation des opinions personnelles
raisonnes de chacun des acteurs. Traditionnellement rvle par le biais de
sondages dopinions qui permettent travers des critres de reprsentativit de
rendre lopinion publique plus tangible, les reprsentants institutionnels vont chercher
travers elle asseoir leur lgitimit.
Cependant, nous avons vu avec lexemple de lespace public tunisien que lorsque
la libert de la presse est inexistante, les mdias sont en incapacit de jouer ce rle
de mdiateur qui permet de faire se confronter diffrents mouvements dopinions au
sein de lespace public. Or, lespace public nest cependant pas inexistant, puisque
lmergence dune opinion publique alternative reste possible par le biais des mdias
informatiss.
En effet, Internet a considrablement favoris llargissement de lespace public
en permettant le dsenclavement de lespace dexpression. La parole publique,
habituellement rserve par les mdias traditionnels aux journalistes, au personnel
politique ou aux experts considrs comme lgitimes, se voit ainsi ouverte de
nouveaux nonciateurs qui nhsitent pas sen servir. Rseaux sociaux, sites

10
MARTIN, Alban, Egocratie et Dmocratie. La ncessit de nouvelles technologies politiques ,
France, FYP ditions, Coll. Prsence / Essai , 2010, p.22-23

7

Internet, blogs deviennent des espaces o les opinions se publient, schangent, se
confrontent en permanence et sont accessibles tous sans aucune slection
pralable. Une certaine porosit semble dailleurs stre installe entre ce qui est
visible et ce qui est public , ce qui a permis de dmocratiser la prise de parole
et la critique en ligne
11
, mais aussi laccessibilit des formes dexpression plus
intimes et la mise en visibilit de soi. Sur le Web, des individus bavardent et ne
se proccupent gure de savoir qui peut les entendre ou les voir en dehors de leur
entourage numrique proche , comme nous lexplique Dominique Cardon :

Les nouveaux internautes, plus jeunes, moins diplms, plus divers sociologiquement, se
sont regroups dans des niches de proximit pour converser, se moquer, diffuser de
linformation tout en valorisant leur identit. [..] Cet Internet de la conversation a jou un rle
dcisif dans la dmocratisation des usages. Les nouveaux internautes ont profit du fait
quInternet tait non seulement une agora trs publique , mais aussi un boudoir o leurs
propos ne seraient pas soumis aux critres de slection traditionnels .

Les internautes ont galement pris pour habitude de consulter de nombreux avis
dposs par dautres personnes dans le but dtre aids par exemple prendre des
dcisions dachat. Les avis, les opinons intressent donc les internautes et ont
suscit des applications et services multiples, ce qui provoque un cercle vertueux
dencouragement donner son avis et mme se faire reconnatre comme donnant
des avis pertinents et suivis par les autres
12
.
Face lmergence de ces nouveaux territoires dexpression, des acteurs privs
semparent du sujet et promettent de concevoir, en sappuyant sur les conversations
des internautes, de nouveaux types dtudes dopinions qui reposent sur des
mthodes appeles par les anglo-saxons opinion mining , ou sentiment
analysis que lon peut traduire en franais par fouille dopinion . Lobjectif pour
ces entreprises est dextraire, partir de la masse de donnes textuelles disponible
sur Internet, des tendances, des avis ou des mouvements dopinions. Les marques
sont galement trs sensibles ces nouvelles formes dexpression et cherchent

11
CARDON, Dominique, La dmocratie internet, promesses et limites , op. cit., p.36
12
BOULLIER, Dominique et LOHARD, Audrey. Chapitre 1. Historique et tat du march
In Opinion mining et Sentiment analysis : Mthodes et outils [Disponible en ligne :
http://books.openedition.org/oep/204]. Marseille, OpenEdition Press, 2012. Publi en 2012, consult le
18 juin 2014

8

matriser leur identit numrique ainsi qu comprendre les attentes et les critiques
disperses sur le Web en provenance de leurs clients.
Inspir des concepts de data mining
13
et de text mining
14
, lopinion
mining consiste identifier, extraire puis analyser de faon automatise des
informations subjectives principalement prsentes sous forme de texte
15
diffuses
sur Internet. Les donnes rcoltes peuvent tre au format Web
16
, mais sont aussi
rgulirement issues dautres applications ayant un format propre, comme Twitter ou
Facebook. Lexpression opinion mining est rgulirement associe, comme
prcis plus haut, au terme sentiment analysis qui peut se traduire en franais
par analyse de sentiment ou analyse de tonalit . Cette seconde traduction
semble dailleurs plus juste car elle permet de prciser ce qui diffrencie lopinion
mining des autres mthodes de traitement du matriau linguistique, savoir lanalyse
de jugements de valeurs qui sont aujourdhui traits de faon polarise pour en
dfinir une tonalit positive ou ngative. Ainsi, lexpression analyse de tonalit
permet de lever lambigut associe au terme de sentiment puisque ce ne sont
pas des motions qui vont tre traites, mais bien des jugements explicites
17
.
Le march de la fouille dopinion est actuellement, et depuis quelques annes, en
pleine explosion. Bien que loffre ne soit pas encore tout fait mature (nous
reviendrons sur ce point au cours de ce mmoire), de nombreux acteurs se sont
positionns sur ce march et proposent des offres de service trs diversifies,

13
Le data mining, ou exploration de donnes en franais, peut tre dfini comme lapplication de la
technologie et des techniques de banques de donnes (comme lanalyse statistique et la
modlisation) dans le but de dcouvrir les structures caches et les relations subtiles entre donnes,
et den infrer des rgles permettant la prdiction de rsultats futurs Dfinition extraite de
ROUVROY, Antoinette et BERNS, Thomas, Le nouveau pouvoir statistique , Multitudes 1/ 2010 (n
40), p. 88-103 [Disponible en ligne : URL : www.cairn.info/revue-multitudes-2010-1-page-88.htm.]
Consult le 3 juillet 2014.
14
Le text mining ou fouille de textes en franais est une spcialisation de la fouille de donnes et fait
partie du domaine de l'intelligence artificielle. C'est un ensemble de traitements informatiques
consistant extraire des connaissances selon un critre de nouveaut ou de similarit dans des
textes produits par des humains pour des humains. Dans la pratique, cela revient mettre
en algorithmes un modle simplifi des thories linguistiques dans des systmes informatiques
d'apprentissage et de statistiques. Dfinition extraite de larticle wikipdia Fouille de textes
[Disponible en ligne : http://fr.wikipedia.org/wiki/Fouille_de_textes] Consult le 3 juillet 2014.
15
Il est galement possible de traiter des informations chiffres ou iconiques (par exemple le nombre
dtoiles accompagnant un avis). Les technologies cherchent aujourdhui galement intgrer leur
traitement dautres matriaux comme les images, le son ou les vidos en les convertissant en texte.
Dans ce mmoire, nous nous intresserons cependant uniquement au matriau textuel original brut.
16
Format HTML ou XML
17
BOULLIER, Dominique et LOHARD, Audrey. Chapitre 1. Historique et tat du march
In Opinion mining et Sentiment analysis : Mthodes et outils , op. cit.

9

entretenant une certaine confusion quant aux services vritablement disponibles
dans un secteur o le vocabulaire nest pas encore stabilis. Ainsi, les frontires sont
floues entre les diffrentes offres appeles coute de la conversation des
internautes , social mdia monitoring , analyse de sentiment ou encore
management de le-rputation . Mais dans tous les cas, lobjectif est de dtecter
et danalyser les opinions prsentes sur les rseaux sociaux et le Web, en utilisant
des techniques dextraction dinformation et en essayant de fournir aux clients des
indicateurs de leur prsence, de leur image, de celle de leurs concurrents
18
.
On dnombre aujourdhui trois types dacteurs principaux
19
positionns sur ce
march :
Historiquement, les diteurs de logiciels ont t les premiers se positionner sur
le march du traitement automatique des donnes textuelles issues du Web
20
. Leurs
solutions sont capables de traiter un volume trs important de donnes et de
proposer diffrents services comme la catgorisation automatique, la volumtrie,
lanalyse de tonalit, etc.
21

Les deuximes types dacteurs principaux sont les prestataires de services. Ces
prestataires sont majoritairement des agences de communication spcialises en
veille et e-rputation , social mdia monitoring ou des instituts dtude
qualitatifs. Ceux-ci ne disposent pas la plupart du temps de leurs propres
technologies mais proposent des services dalerte, de suivi en temps rel des
conversations ou danalyse partir des outils dvelopps par les diteurs de
logiciels. Ils proposent galement danalyser limpact de certaines campagnes de
marketing, les conversations gnres autour de celles-ci leur servant dindicateur.

18
Ibid.
19
Il existe galement des services internes aux entreprises qui se positionnent sur ce type dactivit.
Cependant, ces services internes sont souvent raliss de faon manuelle, le traitement des donnes
ntant pas automatis. Certains laboratoires de recherche sintressent galement lextraction
dopinions et travaillent mi-chemin entre lingnierie informatique et les sciences du langage dans le
but damliorer les outils logiciels existants. Cependant, ces laboratoires travaillent majoritairement sur
des corpus ferms et non sur des flux, comme cest le cas pour lanalyse des opinions sur le Web.
Source : BOULLIER, Dominique et LOHARD, Audrey. Chapitre 1. Historique et tat du march
In Opinion mining et Sentiment analysis : Mthodes et outils , op. cit.
20
ACHACHE, Gilles, Opinion mining : ces algorithmes qui dcryptent nos conversations [S3E5] ,
Social Mdia Club France, [Disponible en ligne : http://socialmediaclub.fr/2014/03/smc-talks-opinion-
mining-ces-algorithmes-qui-decryptent-nos-conversations-s3e5/] Publi le 28 mars 2014, consult le
24 juillet 2014.
21
BOULLIER, Dominique et LOHARD, Audrey. Chapitre 1. Historique et tat du march
In Opinion mining et Sentiment analysis : Mthodes et outils , op. cit.

10

Enfin, les instituts dtudes dopinions, encore peu nombreux, utilisent les
technologies de traitement automatique des langues pour suivre les mouvements
dopinions
22
que lon peut capter partir des conversations des internautes, dans le
but de produire des tudes dopinion dun nouveau genre. Cest ce troisime type
dacteurs que nous allons nous intresser au sein de ce mmoire.
En effet, si lanalyse des conversations en ligne a dj dmontr son utilit dans
les domaines du marketing et de la communication, la production dtudes dopinions
partir de matriaux linguistiques rcolts sur le Web pose aujourdhui de
nombreuses questions et anime les dbats quant la lgitimit de telles tudes. Les
diffrentes offres commerciales se confrontent ainsi aux travaux universitaires qui en
avancent les limites.
En effet, quid des catgories socio-dmographiques traditionnellement utilises
par les sondages pour assurer la reprsentativit des individus ? Est-il possible de
considrer le Web comme plus mme de faire circuler et se confronter tous types
dopinions que les mdias traditionnels ? Les opinions peuvent-elles tre
considres comme plus vraies lorsquelles sexpriment spontanment sur une
plateforme sans mdiation pralable ? Comment est-il possible de produire du sens
partir dune telle prolifration de conversations enchevtres ? Le Web peut-il tre
considr comme un laboratoire o il serait possible dobserver des opinions
mergentes, ou lobsession de la quantification nest-elle quun moyen de se rassurer
face limmensit dun flux dinformations que lon ne peut pas saisir du regard ?
Autant de questions que nous devrons traiter dans le prsent mmoire.

Positionnement thorique :
Pour dvelopper notre rflexion, nous nous appuierons largement sur les travaux
de Dominique Cardon propos des transformations de lespace public contemporain
en lien avec le dveloppement des technologies numriques, ce qui nous permettra
de comprendre comment se construit lespace public numrique en lien avec
lespace mdiatique traditionnel. Les rflexions menes par Dominique Cardon nous

22
ACHACHE, Gilles, Opinion mining : ces algorithmes qui dcryptent nos conversations [S3E5] ,
op. cit.

11

conduiront galement analyser les diffrentes formes dexpressions individuelles
qui circulent en ligne, ainsi que les nouveaux processus qui gouvernent la diffusion
des informations sur Internet. Les travaux de Dominique Boullier et dAudrey Lohard
sur ltat de lart de lopinion mining nous serviront galement de point dancrage
pour comprendre comment fonctionnent ces nouvelles mthodes danalyse ainsi que
les enjeux techniques quelles sous-tendent. La combinaison de ces deux approches
nous permettra ainsi de comprendre comment les instituts qui utilisent les mthodes
de fouille dopinion pour sonder lopinion publique parviennent lgitimer leur
dmarche, quelles en sont les limites et comment celles-ci pourraient parvenir se
rationnaliser pour transformer ces outils en objets politiques.

Problmatique :
Notre rflexion sarticulera autour de la question suivante :
Alors que les mthodes dites dopinion mining sappuient sur des discours
idologiques et promotionnels pour lgitimer leurs analyses, comment la mise en
visibilit des choix techniques utiliss a priori pour collecter, traiter et analyser les
donnes rcoltes pourrait-elle permettre lensemble de ces procds de dpasser
les controverses pour se rationnaliser, et se transformer en nouvel enjeu de
pouvoir ?
Trois hypothses viennent soutenir le dveloppement de cette rflexion :
Nous supposons dans un premier temps que, si Internet a permis un
dcloisonnement de la parole publique, lide convoque par les acteurs de la fouille
dopinion selon laquelle le rseau serait plus dmocratique que lespace public
traditionnel reste utopique et fait appel aux imaginaires de lInternet militant. Certains
filtres prdominent en effet la diffusion massive dune opinion qui demande de
surcroit une comprhension des codes de communication du rseau.
De plus, nous prsumons que, sous couvert dune dmarche communicationnelle,
les acteurs de lopinion mining enferment les enjeux smiotiques de la fouille
dopinion dans des boites noires. Si cette dmarche leur permet de se soustraire
tout processus de vrification des analyses proposes et de prserver leurs

12

mthodologies des concurrents, elle jette galement un certain discrdit sur ces
mthodes qui ne peuvent alors pas tre normalises et valides. Lopinion qui rsulte
de ces processus opaques ne peut alors pas tre crdibilise.
Enfin, nous supposons que llaboration par les acteurs de la fouille dopinion de
normes communes et de nouveaux critres dinterprtation prenant en compte les
mdiations techniques ainsi que le contexte nonciatif des messages, et assurant la
mise en visibilit des processus dapproximation utiliss, permettrait de crdibiliser
ces mthodes qui pourraient alors se transformer, terme, en enjeux de pouvoir.

Prsentation du corpus et dmarche mthodologique :
La fouille dopinion tant une discipline encore rcente, notamment en ce qui
concerne les tudes dopinion, nous avons d nous contenter pour notre recherche
dun corpus relativement restreint.
Afin de comprendre les enjeux en cours autour de cette thmatique, nous avons
choisi de nous appuyer sur les discours prsents sur les sites internet des instituts
dtudes qui proposent ce type danalyses. Pour cela, nous avons retenu trois dentre
eux, qui prsentent lintrt de justifier leurs dmarches et leurs mthodologies au
sein de plusieurs pages web, ce qui nous a permis de disposer pour notre analyse
dune quantit et dune qualit de matriaux textuels relles.
Pour dvelopper notre recherche, nous nous sommes donc appuys sur une
analyse de discours compare tablie partir des sites Internet des trois instituts
dtude suivants : Scan-Research
23
, Linkfluence
24
et Netscope
25
. Ainsi, nous avons
cherch comprendre comment ces acteurs, grce leurs discours, parvenaient
lgitimer leurs pratiques et justifiaient leur expertise sur le sujet de lanalyse des
conversations en ligne. Pour cela, nous avons tudi les modes dargumentation, les
modles nonciatifs, ainsi que les champs smantiques utiliss sur leurs sites
Internet. De plus, nous avons coupl cette recherche lanalyse smiologique dune
infographie prsentant la technologie utilise par lagence Linkfluence pour traiter les

23
SCAN RESEARCH [Disponible en ligne : www.scan-research.com] Consult le 5 juillet 2014
24
LINKFLUENCE [Disponible en ligne : http://linkfluence.com/fr/] Consult le 5 juillet 2014
25
NETSCOPE [Disponible en ligne : http://www.netscope.fr/institut] Consult le 5 juillet 2014

13

opinions mises sur le Web. Cette tude nous a ainsi permis de comprendre quels
taient les imaginaires convoqus par ces instituts pour lanalyse des opinions sur
Internet et la manire dont ceux-ci parvenaient justifier de leur mthodologie.

Prsentation du plan :
Il conviendra tout dabord de nous intresser aux modes de tri, de classement et
de mise en visibilit des informations sur le Web. Nous nous demanderons comment
le dcloisonnement de lespace public, conforme aux imaginaires de lInternet
militant, peut jouer sur la formation des opinions. Pour cela, nous devrons tudier les
diffrents formats que peut prendre lopinion sur le Web, et tudier les conditions de
sa circulation.
Dans une deuxime partie, nous verrons que la libration des subjectivits ayant
lieu sur le Web entrane des difficults quant la classification des opinions. Nous
tudierons alors les discours et les promesses des acteurs de lopinion mining afin de
dcrypter ce que cachent leurs discours promotionnels.
Enfin, une dernire partie nous permettra de nous interroger propos des
conditions de lgitimation de ces mthodes de fouille dopinion, et de comprendre
comment celles-ci pourraient terme se transformer en enjeux de pouvoir.


14





I. Imaginaires de la cyberdmocratie : le
rseau, un espace plus dmocratique que
lespace public traditionnel ?


Le mythe de la cyberdmocratie hante les imaginaires dInternet depuis que le
rseau a t rendu accessible au grand public. En effet, selon Howard Rheingold,
La force politique de linformatique communicante vien[drait] de sa capacit
concurrencer le monopole de la hirarchie politique existante sur les puissants
mdias de masse
26
. Au-del de limaginaire dune possible dmocratie alternative,
laccs ce dispositif de communication permettrait de favoriser le dbat
dmocratique et la diffusion des ides. Lmergence des rseaux sociaux a dailleurs
permis de ranimer les discussions autour de cette thmatique, puisque linternaute
a dsormais la possibilit de sexprimer encore plus facilement quauparavant
27
.
En effet, sur Internet, tout le monde peut prendre la parole de manire gale
contrairement aux mdias traditionnels sur lesquels rgne une autorit du statut.
Aucune distinction nest faite entre lmetteur et le rcepteur, cest pourquoi ce mdia
parait particulirement adapt llaboration du dbat dmocratique ainsi qu
lchange dopinions.

26
RHEINGOLD, Howard, The Virtual Community , cit par FLICHY, Patrice, 7. La fin du
politique , In L'imaginaire d'Internet , La Dcouverte, 2001, p. 195-222 [Disponible en ligne :
www.cairn.info/l-imaginaire-d-internet--9782707135377-page-195.htm.] Consult le 28 juin 2014
27
FLICHY, Patrice, Internet et le dbat dmocratique , Rseaux 4/2008 (n 150), 2008, p. 159-185
[Disponible en ligne : www.cairn.info/revue-reseaux-2008-4-page-159.htm] Consult le 28 juin 2014

15

Ainsi, Internet pourrait tre peru comme une agora publique qui permettrait de
revitaliser le systme dmocratique. Llargissement de lespace public permettrait
une dmocratisation de la diffusion des ides, et par l mme un largissement des
dbats conduisant llaboration de positions partages.
Cest sur cet imaginaire dun espace public accessible tous dans lequel les ides
et les opinions se formeraient, sexprimeraient et circuleraient de faon spontane et
sans filtre que sappuient les promoteurs de lopinion mining, comme le montrent les
discours publis sur leurs sites Internet
28
:
Ainsi, les mthodes de fouille dopinion permettraient [d]observer lopinion dans
son mouvement spontan sur Internet
29
. Cette spontanit semble dailleurs tre
un argument promotionnel important pour les acteurs de cette discipline, la promesse
tant donc de dcrypter lopinion qui se forme et sexprime spontanment sur le
Web social
30
. Ainsi, le consommateur est connect en permanence, [] interagit,
peut sexprimer librement sans tre ncessairement sollicit
31
.
Les instituts se positionnant sur le crneau de lanalyse dopinion en ligne
affirment galement, conformment lidal de lespace public en ligne, que le
Web 2.0 apparait dsormais comme un espace quasi-illimit de production et de
circulation des opinions
32
sur lequel il est possible de prendre en compte
lnorme quantit de messages et davis mis en ligne chaque jour par les Internautes
sur les rseaux sociaux, les forums consommateurs, les sites davis et de
commentaire
33
. Ainsi, ce seraient des millions de points de vue qui
sexprime[raient] tous les jours sur la toile
34
, permettant chacun de
communiquer, de sexprimer grande chelle
35
.

28
Les dtails de lanalyse de discours de ces Instituts peuvent tre consults dans lAnnexe 1 p 103.
Une analyse plus approfondie est galement disponible dans la partie II.B.1 La vise promotionnelle
du discours de lgitimation p.52.
29
SCAN RESEARCH [Disponible en ligne : www.scan-research.com] Consult le 5 juillet 2014
30
LINKFLUENCE [Disponible en ligne : http://linkfluence.com/fr/2009/10/19/observatoire-
politique-Web-social/] Consult le 5 juillet 2014
31
TNS SOFRES [Disponible en ligne : http://www.tns-sofres.com/notre-offre/nos-solutions/le-futur-
des-etudes] Consult le 5 juillet 2014
32
NETSCOPE [Disponible en ligne : http://www.netscope.fr/institut] Consult le 5 juillet 2014
33
SCAN RESEARCH, op. cit.
34
NETSCOPE, op. cit.
35
HO2S [Disponible en ligne : http://www.ho2s.com/fr/services-Web/surveillance-de-l-opinion/]
Consult le 5 juillet 2014

16

Les mthodes de fouille dopinion permettraient donc de suivre lvolution
constante et rapide de lopinion des consommateurs au rythme de leurs contributions
quotidiennes aux rseaux sociaux
36
, Internet tant devenu un lieu dexpression et
de circulation majeur de lopinion
37
. Cest donc grce cette multitude de points
de vues et dopinions qui sexpriment et circulent sur la toile [et qui] reprsentent un
formidable stock dinformations ltat virtuel
38
quil est possible de mieux
connaitre les opinions, mesurer ce qui produit ladhsion ou, au contraire, ce qui
suscite le rejet chez les citoyens internautes
39
.
Nous voyons bien ici que ces discours promotionnels sappuient largement sur les
imaginaires dcrits par les pionniers du net dans lesquels Internet peut tre
considr comme une nouvelle agora lectronique permettant chacun de faire
circuler massivement ses opinions, en opposition aux mdias traditionnels qui
slectionnent a priori les personnalits juges lgitimes pour sexprimer dans un
espace public cloisonn.
Face ces imaginaires, nous nous interrogerons dans cette premire partie
propos des conditions de la circulation des opinions, afin de dterminer si le rseau
des rseaux est bel et bien aussi dmocratique que ce que les discours sur lespace
public numrique le laissent supposer.
Ainsi, nous nous demanderons comment les opinions exprimes sur Internet
cohabitent avec lopinion vhicule par les mdias traditionnels et nous interrogerons
propos de ce qui les diffrencie. Le rseau peut-il vraiment tre considr comme
un lieu de dbat et de construction dopinions accessible tous ?
Nous nous interrogerons galement propos des logiques de traitement et de tri
de linformation propres au Web. En effet, sil nexiste pas de slection pralable
lexpression des opinions sur Internet, nexiste-t-il pas dautres formes de mdiations
propres Internet qui pourraient freiner la diffusion de certains contenus et en
favoriser dautres ?

36
SCAN RESEARCH, op. cit.
37
ACHACHE, Gilles, Opinion mining : ces algorithmes qui dcryptent nos conversations [S3E5] ,
Social Mdia Club France, op. cit.
38
NETSCOPE, op. cit.
39
Ibid.

17

Enfin, nous nous demanderons si tous les internautes sont vraiment mme de
faire circuler largement leurs opinions en permettant leurs ides de sexprimer haut
et fort, ou sil existe des limites cette circulation. Pour cela, nous nous interrogerons
propos de la notion de viralit .



A. Dcloisonnement de lespace public : entre
rallocation de lautorit et dsinformation du
citoyen

1. LA FIN DU PATERNALISME MEDIATIQUE

Les mdias traditionnels ont depuis longtemps instaur les rgles de publicit
permettant un contrle a priori des informations publies. Ainsi, les informations
rendues visibles sur ces mdias sont par nature publiques et ont fait lobjet dune
slection pralable fonde sur leur intrt gnral. Cette slection est effectue par
ce que Dominique Cardon nomme les gate-keepers , dont le rle consiste
rendre visible ce quils consid[rent] comme public
40
. Les professionnels des
mdias se sont donc depuis toujours rserv le droit de trier les informations qui
devaient tre rendues publiques. Avec la loi du 29 juillet 1881 sur la libert de la
presse, ils ont instaur dexigeantes rgles de publicit dfinissant un contrle a
priori des informations avant leur mise en visibilit
41
. Ainsi, lespace public pouvait
tre qualifi de public parce que les informations rendues visibles tous avaient fait
lobjet dune slection pralable par des professionnels soumis des normes
dontologiques
42
.

40
CARDON, Dominique, La dmocratie internet, promesses et limites , op. cit., p.36
41
Idem.
42
Idem.

18

Sur le Web, les notions de visibilit et de publicit sont dsormais dcouples. De
nombreux propos sont en effet visibles, sans pour autant avoir un caractre public. Il
nexiste plus aucun filtre la publication des informations et la frontire entre public
et priv devient poreuse. Il nexiste plus non plus de lgitimit du statut de journaliste,
de reprsentant ou dexpert qui limiterait les prises de paroles un public circonscrit.
Les internautes sont donc dsormais matres des informations quils vont publier,
mais galement de celles quils vont consulter. En effet, le Web a permis aux
internautes de saffranchir du paternalisme des mdias traditionnels :

Ce dplacement nous montre ce que lespace public traditionnel a de paternaliste. Au
fond, il sest toujours mfi du public et a inlassablement cherch le protger contre les
autres et surtout contre lui-mme. En le relguant dans un rle daudience, il lui te ses
capacits daction. En le filtrant, il domestique ses prises de parole. En privatisant son intimit, il
lui interdit de sengager corps et me. En faisant corriger ses connaissances par des experts
agrs, il professionnalise le savoir. En le consultant travers des sondages, il le
ventriloquise tout propos. Mais sils nont pas disparu, tous ces travers appartiennent
dsormais au pass de la dmocratie. Car, sur Internet et grce Internet, ce public sous
contrle sest mancip. Il prend la parole sans quon le lui demande. Il sexpose sans
vergogne pour crer de nouveaux liens sociaux. Il produit des connaissances sans sen
remettre dautres. Il dfinit lui-mme les sujets dont il veut dbattre. Il sorganise. [] Ce
paternalisme est de moins en moins tolrable dans des socits qui sindividualisent en
prescrivant la responsabilit, lautonomie et la diversit. Internet est un instrument de lutte
contre linfantilisation des citoyens dans un rgime qui est cens leur confier le pouvoir. En ce
sens, le Web incarne lavenir de la dmocratie
43


Ainsi, nous voyons bien ce que le Web, conformment aux imaginaires dInternet,
a de dmocratique. En se dbarrassant du paternalisme des mdias traditionnels, les
internautes sont dsormais libres de faire circuler tout type dopinions. Ces mdias
perdent alors le monopole de la cration des informations puisque chacun est
dsormais libre de se servir dInternet comme tribune pour vhiculer ses ides. Ils
perdent galement le contrle de la mdiation des informations puisque chaque
message peut dsormais circuler sans leur approbation sur des vecteurs qui leurs
sont extrieurs. Les mondes de la production et de la rception des informations
cohabitent dsormais dans un mme espace sans contrle a priori, entrainant une
perte de pouvoir des mdias traditionnels.
Dornavant, deux espaces publics cohabitent, se rpondent, sentremlent.
Toutefois, on constate que les mdias traditionnels jouent toujours un rle sur leffet

43
Ibid, p99-100

19

dagenda, cest--dire les thmes qui vont tre discuts dans lespace public. En
effet, si linfluence des mdias sur la formation des opinions peut tre dbattue, on
ne peut cependant pas nier que ceux-ci jouent un rle dcisif pour dterminer les
thmes autour desquels se cristallise[nt] les dbats dans la socit
44
.
Formalis en premier lieu par Maxwell McCombs et Donald Show le principe
dagenda-setting
45
met lide selon laquelle les mdias traditionnels vont
focaliser lattention de leur audience sur certains vnements tout en en ngligeant
dautres alors jugs moins importants. En effet, devant la multitude des informations
disponibles, il va tre ncessaire de choisir les informations qui vont tre diffuses,
ce qui va avoir des consquences la fois sur le calendrier des vnements qui vont
tre discuts, mais aussi sur leur hirarchisation. Ainsi, le rle des mdias
traditionnels ne serait pas de dire aux citoyens ce quils doivent penser, mais ce
quoi ils doivent penser. Les rseaux sociaux ont par exemple largement montr que
laccord dattention ddi par les mdias traditionnels certains sujets joue un rle
important quant aux sujets qui vont ensuite tre dbattus au sein de lespace public
numrique.
Mais linverse, le principe du buzz sur Internet est [galement] au cur de ce
mcanisme et finit par exercer une pression sur les mdias classiques eux-mmes
en focalisant lattention, par exemple, sur LA vido scandaleuse du moment
46
.
Ainsi, on constate que des sujets massivement diffuss sur le Web sont galement
capables dinfluer sur ce qui va tre discut au sein des mdias traditionnels.
Pour illustrer cela, il est par exemple possible de parler du mouvement nomm
bring back our girls (ou rendez-nous nos filles en franais) qui sest droul
sur les rseaux sociaux aprs que la secte islamiste Boko Haram ait enlev, le 14
avril 2014, deux cent soixante-seize lycennes au Nigria, et dont la chronologie
mdiatique peut interpeler.

44
ROSANVALLON, Pierre, La contre-dmocratie : La politique lge de la dfiance , Paris,
Editions du Seuil, coll. Les livres du nouveau monde , 2006, p.45
45
MCCOMBS, Maxwell et SHOW, Donald, The Agenda-Setting Function of Mass-Media , Public
Opinion Quaterly n36, 1972, p.176-187 [Disponible en ligne :
http://www.unc.edu/~fbaum/teaching/PLSC541_Fall06/McCombs%20and%20Shaw%20POQ%20197
2.pdf] Consult le 1er juillet 2014.
46
BOULLIER, Dominique, Les industries de l'attention : fidlisation, alerte ou immersion , Paris,
Rseaux, 2009/2 n 154, p. 239

20

Apparu sur les rseaux sociaux le 23 avril 2014 la suite dun tweet dIbrahim
Abdullahi, avocat nigrian
47
, le hashtag
48
#BringBackOurGirls a t largement
diffus avant dtre repris le 7 mai 2014 par Michle Obama qui va alors donner une
visibilit mondiale au mouvement. Le mot cl sera par la suite repris par de
nombreuses personnalits publiques et politiques, mais galement par de nombreux
anonymes, offrant alors une nouvelle visibilit au sujet.
En effet, sil avait t possible dobserver un lger traitement mdiatique de ce
sujet en France dans les mdias audiovisuels ds le 4 mai suite la publication
dune vido de lAgence France Presse, cest bien aprs la diffusion massive du
hashtag sur les rseaux sociaux que les mdias traditionnels vont rellement
semparer du sujet qui ne fera la une du journal de 20 heures diffus sur France 2
que le 10 mai 2014
49
.
Cet exemple nous permet de constater que, si les mdias traditionnels jouent un
rle sur leffet dagenda, cest--dire les sujets qui vont capter lattention de lopinion
et tre largement discuts dans la socit civile et sur le Web, les discussions se
produisant sur les rseaux sociaux peuvent galement avoir une influence sur ce qui
va tre discut au sein des mdias traditionnels.
Ainsi, conformment aux attentes de lInternet militant, lespace public lre
dInternet slargit, permettant de dsenclaver les espaces dexpression et
contribuant la diversification des opinions exprimes et accessibles tous. Les
citoyens sont alors capables de se mobiliser pour attirer lattention sur des sujets qui,
selon eux, mritent dtre dbattus au sein de lespace public, faisant fi du
paternalisme des mdias traditionnels et permettant de reprendre la main sur les
thmes qui mritent dtre dbattus au sein de lespace public.



47
LE SECRET DES SOURCES, Les ambigits mdiatiques sur les lycennes enleves au
Nigria , France Culture, [Disponible en ligne : http://www.franceculture.fr/emission-le-secret-des-
sources-les-ambiguites-mediatiques-sur-les-lyceennes-enlevees-au-nigeria-2014]. Publi le 17 mai
2014, Consult le 11 septembre 2014
48
Signals par le caractre # , les hashtags sont des mots cls balise qui permettent de
rsumer lobjet dun tweet.
49
LE SECRET DES SOURCES, Les ambigits mdiatiques sur les lycennes enleves au
Nigria , op. cit.

21

2. LERE DE LA DESINFORMATION

Si le dclin du paternalisme mdiatique a permis de dsenclaver les modalits de
la prise de parole, il est cependant possible de constater que les dbats se droulant
dans les diffrents espaces dexpression prsents sur le Web sont loin de voir
saffronter, comme lespraient les pionniers dInternet, des changes dides
prsentant des arguments rationnels conformes lidal de lespace public
habermassien, comme lexplique Patrice Flichy :

Les forums sont souvent le sige de ces guerres dinjures (flame wars) o les internautes
dfendent violemment des opinions dont ils ne veulent plus dmordre. Pour Mark Poster, les
dbats en ligne ne correspondent pas aux caractristiques de lespace public, savoir un dbat
entre gaux o les arguments rationnels prvalent et o on cherche laborer une position
commune. Internet ne rpond qu la premire caractristique. Les internautes peuvent
effectivement changer sur un pied dgalit. Par contre, lchange argument est loin dtre
toujours la rgle. Le dbat ne tend pas vers llaboration dune position commune, mais plutt
vers une multiplication de points de vue contradictoires
50
.

Ainsi, nous pouvons constater que si ce dsenclavement a bel et bien permis une
rallocation de lautorit des citoyens quant aux sujets qui mritent dtre dbattus
dans lespace public, en opposition au paternalisme des mdias traditionnels qui
infantilisait les citoyens en imposant les sujets qui mriteraient leur attention, les
nombreux dbats qui ont lieu sur Internet aboutissent rarement llaboration dune
position commune prenant en compte les intrts de chacun et susceptible alors
dtre qualifie dopinion publique. Cette premire constatation nous montre dj que
le mythe dune dmocratie numrique en ligne est loin dtre sur le point de devenir
ralit. Si les conditions de lmergence dun espace public informatis sont bien
runies, lchange sur le Web darguments rationnels permettant de faire avancer le
dbat public napparat pas, ce jour, dans les faits.
De ce fait, si nous devons admettre que dsormais, deux espaces publics
cohabitent et sinfluencent mutuellement, et quil nexiste plus de mdiation pralable
la diffusion dune information ou lexpression personnelle, force est de constater

50
FLICHY, Patrice, Internet et le dbat dmocratique , Rseaux 4/ 2008 (n 150), p. 159-185
[Disponible en ligne : www.cairn.info/revue-reseaux-2008-4-page-159.htm] Consult le 18 juillet 2014.

22

que toutes les subjectivits qui sexpriment sur la toile ne sont pas bnfiques
lespace public ni llaboration de ce qui pourrait tre qualifi dopinion publique.
De nouvelles formes dnoncs circulent aujourdhui sur la toile et le tri de ces
innombrables informations qui oscillent entre les frontires devenues floues du priv
et du public devient difficile. Si la disparition des gate-keepers a permis de rendre
lespace public plus dmocratique, elle a donc galement engendr une confusion
face aux informations qui mritent lattention de tous.
Dsormais, la slection et la hirarchisation des informations quil est possible de
consulter nest plus effectue par les professionnels des mdias, mais par
linternaute lui-mme qui choisit les informations quil souhaite examiner. Le
traitement a priori des informations par les professionnels des mdias permettait
cependant de ne faire circuler dans lespace public que des informations vrifies,
permettant de construire des opinions sur des faits avrs.
Lexercice du mtier de journaliste est en effet, comme nous lavons vu, soumis
certaines rgles dontologiques. La charte de Munich ou Dclaration des devoirs
et des droits des journalistes signe en 1971 Munich a t adopte par la
Fdration Europenne des journalistes puis la Fdration Internationale des
Journalistes et lOrganisation Internationale des Journalistes. Lensemble des
syndicats de journalistes franais, regroups au sein de lUnion Nationale des
Syndicats de Journalistes la galement adopte. Cette charte est devenue une
rfrence internationale en matire de dontologie journalistique et distingue dix
devoirs et cinq droits des journalistes dont :

1) respecter la vrit, quelles quen puissent tre les consquences pour lui-mme, et ce,
en raison du droit que le public a de connatre ;
[]
3) publier seulement les informations dont lorigine est connue ou les accompagner, si cest
ncessaire, des rserves qui simposent ; ne pas supprimer les informations essentielles et ne
pas altrer les textes et les documents ;
[]

23

8) sinterdire le plagiat, la calomnie, la diffamation, les accusations sans fondement ainsi que
de recevoir un quelconque avantage en raison de la publication ou de la suppression dune
information51

Ainsi, selon les rgles dontologiques des journalistes, les informations diffuses
dans lespace public traditionnel se doivent dtre vraies, vrifies et approuves par
des sources valides et connues.
Sur Internet, nous avons vu que le filtre journalistique avait dsormais disparu. Si
cela a pu engendrer une dmocratisation de lespace dexpression, cela nest pas
sans consquence quant la vracit des informations qui circulent sur Internet. En
effet, sur le Web, de fausses informations peuvent facilement circuler, ce qui peut
conduire une dsinformation voire une manipulation de lopinion.
Pour illustrer cela, retenons lexemple rcent de la rumeur sur la thorie du
genre lcole qui a entrain le retrait de lcole de centaines denfants les 24 et
27 janvier 2014 suite un appel au boycott lanc sur Internet et par SMS par Farida
Belghoul, militante dextrme droite proche de lessayiste Alain Soral. Cet appel
affirmait, entre autres, quune ducation sexuelle tait prvue en maternelle la
rentre 2014 avec dmonstration et apprentissage de la masturbation ds la crche
ou la halte-garderie
52
.
Ici, Guillaume Brossard, cofondateur de HoaxBuster
53
explique que les rseaux
sociaux et autres canaux viraux ont servi blanchir [lorigine de la rumeur]
54
. En
effet, la forme crite et la possibilit de voir qui sont les destinataires et les metteurs
des messages qui voquent la rumeur en question ont deux consquences. Tout
dabord, le support crit est trs persuasif parce quil est assimil une note
administrative, une circulaire officielle voire au procs-verbal dun vnement rel,

51
SYNDICAT NATIONAL DES JOURNALISTES, Dclarations des devoirs et des droits des
journalistes , Munich, 1971, [Disponible en ligne : http://www.snj.fr/spip.php?article2016] Consult le
7 aout 2014.
52
BATTAGLIA, Mattea et LE BARS, Stphanie, Thorie du genre : lappel au boycott qui alarme
lcole , Le Monde, [Disponible en ligne : http://www.lemonde.fr/societe/article/2014/01/29/l-appel-au-
boycott-qui-alarme-l-ecole_4356195_3224.html] Publi le 28 janvier 2014, Consult le 7 aout 2014.
53 HOAXBUSTER [Disponible en ligne : www.hoaxbuster.com] Consult le 7 aout 2014.
54
BROSSARD, Guillaume, Thorie du genre lcole : comment facebook et les SMS servent
blanchir la rumeur , Le plus Nouvel Obs [Disponible en ligne :
http://leplus.nouvelobs.com/contribution/1138487-theorie-du-genre-a-l-ecole-comment-les-reseaux-
sociaux-servent-a-blanchir-la-rumeur.html] Publi le 30 janvier 2014, Consult le 7 aout 2014.

24

donc son impact auprs des destinataires est plus profond
55
quune rumeur qui
circulerait par exemple loral. De plus, si dans le cas dune rumeur orale on ignore
le nombre dindividus qui ont eu connaissance, pour la rumeur lectronique, la
prsence des noms des destinataires successifs, cest--dire le fait que la rumeur a
dj touch du nombre, la fait basculer dans le domaine de l'irrfutable, car si l'on
peut contredire un interlocuteur unique, il devient plus difficile de ne pas sincliner
devant la profusion
56
. Ainsi, cest le fait mme quun nombre important dindividus
ait discut de cette rumeur sur les rseaux sociaux qui a suffi la crdibiliser, faisant
seffacer lorigine de linformation au profit de la masse.
Nous voyons donc ici que si Internet a autoris un dsenclavement de lespace
dexpression qui a permis de redonner une certaine autorit aux citoyens quant aux
sujets qui devaient tre dbattus, la perte du contrle des informations par les
mdias traditionnels a pu galement entraner des effets nfastes pour la
construction de lopinion publique. Tout dabord, lchange darguments rationnels
assurant de conduire une position commune est souvent loin dtre prsent dans
les dbats se droulant sur le Web. Ensuite, la perte du contrle a priori des
informations peut mener une dsinformation de lopinion qui peut avoir de relles
rpercussions politiques.
Ainsi, de nouveaux enjeux se dessinent aujourdhui sur Internet, pour le traitement
et lorganisation de ce dluge dinformations. Aussi, une sourde lutte sorganise
aujourdhui pour le contrle des outils permettant de hirarchiser a posteriori les
informations sur le Web
57
.


55
TAIEB, Emmanuel, Persistance de la rumeur , Rseaux 2/ 2001 p. 231-271
[Disponible en ligne : www.cairn.info/revue-reseaux-2001-2-page-231.htm.] Consult le 7 aout 2014.
56
Idem.
57
CARDON, Dominique, La dmocratie internet, promesses et limites , op. cit., p.100

25

B. Slection des informations en ligne : la part
prescriptive de la technique

1. ALGORITHMES, LES NOUVEAUX GATE-KEEPERS ?

La hirarchisation des informations sur Internet est au cur des dbats autour de
lespace public numrique. Le rseau a longtemps t peru comme le recours qui
permettrait de smanciper du contrle des lites mdiatiques sur les informations et
de ractiver les expressions individuelles des citoyens. Mais alors, il convient de se
demander comment sont justement classes et rendues accessibles les informations
publies sur lnternet.
Dans son ouvrage La richesse des rseaux , Yochai Benkler avance lide que
ce serait lensemble des internautes qui, en publiant et en se citant mutuellement,
permettraient de faire ressortir les informations pertinentes. Ces liens permettraient
en effet aux documents de qualit dtre reprs par des algorithmes
58
qui les
ordonneraient par la suite dans les moteurs de recherche. La visibilit des
informations serait donc le rsultat dune coproduction des internautes et des outils
de traitement informatique
59
.
Mais alors, comment distinguer la part du travail due la recommandation des
internautes de celle effectue par traitement automatique ? Quels sont les autres
soubassements techniques qui rgissent les modes de visibilit du Web ? Pour
rpondre ces questions, nous nous appuierons majoritairement sur les travaux de
Dominique Cardon.

58
Le terme dalgorithme a t popularis par la prsence de plus en massive du calcul informatique
dans nos socits. Il a vu, en mme temps, sa signification stendre. Il dsigne une suite
dinstructions et de processus requis pour raliser une tche. Initialement utilis par les
mathmaticiens pour dcrire une srie de calculs, le terme sest gnralis pour dsigner les tches
automatises de la programmation informatique. Dfinition par CARDON,
Dominique, Prsentation , Rseaux 1/ 2013 (n 177), p. 9-21
[Disponible en ligne : www.cairn.info/revue-reseaux-2013-1-page-9.htm] Consult le 7 aout 2014.
59
BENKLER, Yochai, La richesse des rseaux cit par CARDON,
Dominique, Prsentation , Rseaux 1/ 2013 (n 177), p. 9-21
[Disponible en ligne : www.cairn.info/revue-reseaux-2013-1-page-9.htm] Consult le 7 aout 2014.


26

Si linternaute joue un rle dans le classement des informations, ce sont bien les
moteurs de recherche qui, in fine, ont la main sur les procds techniques qui vont
gouverner et hirarchiser les informations prsentes sur le Web en dcidant que
certaines doivent tre rendues visibles et dautres non. Ainsi, en dcidant de ce qui
doit tre vu, ils encouragent ou dcouragent la confrontation et la discussion,
participent la construction de lagenda public et slectionnent les bons
interlocuteurs
60
.
Ainsi, les algorithmes qui permettent de hirarchiser les informations enferment
des principes de classement et de vision du monde
61
qui vont structurer la manire
dont les internautes vont pouvoir voir ces informations, ainsi que les itinraires
numriques quils vont tre amens emprunter. Avec le dveloppement des usages
et larrive de logiques marchandes, une vritable guerre la visibilit sest lance
sur Internet. Selon les intrts des uns et des autres, plusieurs critres peuvent
tre enferms dans les algorithmes : le mrite, laudience, la communaut et la
vitesse
62
.
Afin de comprendre limportance de la part prescriptive de la technique dans les
modes de reprsentation des utilisateurs, nous nous intresserons dans un premier
temps au PageRank de Google, cet algorithme qui analyse les liens et mesure la
popularit des pages Web dans le but de procder leur classement.
Sur les pages qui prsentent son entreprise, linstar des propos de Yochai
Benkler, la firme de Mountain View prsente le PageRank comme un processus
dmocratique qui fonctionnerait comme un systme de vote et permettrait dlire les
contenus jugs comme tant les plus pertinents sur Internet :

La dmocratie fonctionne sur le Web :
La recherche Google fonctionne, car sa technologie fait confiance aux millions dinternautes
qui ajoutent des liens sur leur site Web pour dterminer la valeur du contenu dautres sites.
Nous valuons limportance de chaque page Web partir de plus de 200 mesures et de

60
CARDON, Dominique, Prsentation , Rseaux 1/ 2013 (n 177), p. 9-21
[Disponible en ligne : www.cairn.info/revue-reseaux-2013-1-page-9.htm] Consult le 7 aout 2014
61
CARDON, Dominique, La dmocratie internet, promesses et limites , op. cit., p.95
62
Idem.

27

diverses techniques, dont notre algorithme brevet PageRank qui dtermine les sites "lus"
comme les meilleures sources dinformation via dautres pages du Web
63
.

Nous voyons bien ici comment, nouveau, Google convoque les imaginaires de la
dmocratie numrique pour lgitimer ses choix techniques, allant mme jusqu
comparer les modes de mise en visibilit du Web un processus lectoral.
Pourtant, nous pouvons considrer qu travers ces processus de lgitimation,
le PageRank est une machine morale [qui] enferme un systme de valeurs,
donnant la prminence ceux qui ont t jugs mritants par les autres
64
. Ainsi,
en analysant les discours autour du procd algorithmique qui rgit le classement
des pages indexes par Google, nous pouvons comprendre comment celui-ci a
impos au Web un mode de visibilit qui lui est propre et qui ne repose en rien sur un
processus dmocratique mais sur un jugement moral.
Ainsi, le moteur de recherche impose sa vision dun monde ditorial objectif et
neutre. Cette objectivit repose entirement sur un systme mcanique, mis en
opposition au jugement humain qui tait celui des gate-keepers dans lespace public
traditionnel jug comme irrmdiablement subjectif. Cette automatisation est donc
centrale pour Google qui se refuse effectuer des modifications la main qui
seraient juges comme partiales. Cest donc labsence de jugement possible de la
part des algorithmes qui est prsente comme garante de la neutralit du dispositif
65
.
Aux Webmasters qui interrogent le moteur de recherche pour savoir comment tre
mieux rfrenc, Google rpond seulement quils doivent dvelopper un site de
qualit
66
afin doptimiser les critres qui permettront aux robots dindexation de lire
facilement le contenu du site. Ainsi, le systme du PageRank impose sa vision dun
contenu de qualit en domestiquant les techniques dcritures propres au Web.

63
GOOGLE, Dix repres cls [Disponible en ligne :
http://www.google.com/about/company/philosophy/] Consult le 7 aout 2014.
64
CARDON, Dominique, Dans l'esprit du PageRank : Une enqute sur l'algorithme de Google ,
Rseaux, 2013/1 n 177, p. 63-95.
65
Ibid.
66
GOOGLE, Informations supplmentaires concernant la cration dun site de qualit , [Disponible
en ligne : https://sites.google.com/site/Webmasterhelpforum/informations-supplementaires-
concernant-la-creation-de-sites-de-qualite] Consult le 7 aout 2014.

28

Lexpression des personnes souhaitant tre entendues par le moteur doit sadapter
ce que les robots savent en lire
67
:

Ils ont appris la manire dont le robot parcourait les pages du Web : dabord, lURL, puis le
titre et les sous-titres, limportance des caractres en gras et en italique, le fait que le PageRank
ne garde que la premire ancre dun lien lorsquune mme page est cite plusieurs fois,
limportance des tags dans les fichiers images, limpossibilit de crawler les fichiers pdf, etc.
Cette intense familiarisation aux moindres procdures de lalgorithme est devenue un savoir-
faire dclin en formations, en guides de conseil, et en outils de mesure de la Google-
compatibilit des sites
68
.

Cependant, en formatant leurs contenus en fonction de lalgorithme, les
utilisateurs agissent de faon rflexive sur la structure du Web qui se voit ainsi
formate selon un systme de valeur impos. La neutralit revendique par Google
se voit ainsi vince par la forme mme du processus mis en place pour la
rechercher. Ainsi, les rsultats les mieux classs ne seront pas forcment les plus
mritants, mais ceux qui auront t capables de sadapter aux prescriptions du
moteur de recherche.
Le classement des informations ncessite donc des comptences qui ne sont pas
accessibles tous et qui se situent trs loin du processus dmocratique prn par
lentreprise, comme en tmoigne le dveloppement du march du rfrencement qui
a transform une partie du Web en une gigantesque comptition des acteurs
publiants pour se faire voir des algorithmes
69
.
La mise en place de processus de rfrencement payant est galement un biais
dans lgalit du classement des informations. Si la volont du moteur de recherche
est de bien diffrencier visuellement les rsultats de ceux qui ont pay pour leur
visibilit de ceux dont le rfrencement est considr comme naturel, les processus
marchands captent tout de mme une part importante du trafic Web qui ne peut alors
tre considr comme un processus galitaire et dmocratique.
Le modle mritocratique de Google se voit de plus chahut par larrive sur
Internet de gros et puissants acteurs comme les entreprises, les mdias traditionnels

67
CARDON, Dominique, Dans l'esprit du PageRank : Une enqute sur l'algorithme de Google , op.
cit.
68
Ibid.
69
Ibid.

29

ou les institutions. Connus de tous, ils sont trs vite cits par tous sur le Web et
attirent eux suffisamment de liens pour prendre la tte des classements
70
. La
hirarchie des informations se voit ainsi domine par des mastodontes, et la visibilit
donne aux propos de chacun ne prsente finalement que peu de diffrences avec
celle qui avait lieu dans les mdias traditionnels, leurs critres de lgitimit stant
ainsi exports dans le monde du Web.
Ainsi, si sur le Web chacun se voit donner la possibilit de crer du contenu, aussi
pertinent soit-il, les mthodes de tri et de classement de linformation sont rgies par
des algorithmes qui, loin dtre aussi neutres que le discours de leurs concepteurs le
laisse entendre, reproduisent les travers de lespace mdiatique traditionnel.


2. LES HASARDS DE LORGANISATION SOCIALE DE
LINFORMATION


Cependant, lmergence de ce qui a t appel le Web 2.0 a permis de mettre
en lumire de nouveaux systmes de mdiation de linformation sappuyant sur
laspect communautaire dInternet. Cette navigation relationnelle permet chacun de
circuler sur les plateformes numriques partir des sociabilits cres sur diffrents
outils en ligne.
A partir de ces traces laisses par leurs amis et les autres utilisateurs du
rseau, les internautes peuvent circuler entre les informations sans avoir recours aux
moteurs de recherche. Ainsi, ce sont les espaces relationnels des individus qui vont
se charger dorganiser les informations, permettant certains contenus mal classs
par les moteurs de recherche traditionnels et qui forment ce qui est appel la
longue trane dInternet dtre consults
71
.

70
CARDON, Dominique, La dmocratie internet, promesses et limites , op. cit., p.95
71
Ibid.

30

Ainsi, face aux recherches objectives par les moteurs de recherche, ces modes
de navigation permettent de sappuyer sur les traces laisses par la navigation des
autres. Ce type de navigation permet lusager de circuler de contenu en contenu
sans prsupposer de ce quil va trouver, cest--dire sans effectuer de requte a
priori. Cette dmarche est nomme srendipit. Ce sont donc les agrgats laisss
par dautres personnes, comme par exemple les tags ou les playlists, qui vont
permettre de se dplacer dans lespace numrique. Ces dispositifs permettent de
tenir compte de lide que dans de nombreux cas, les utilisateurs nont pas formul
dintention pralable leur recherche
72
. Cest par la proximit de leurs intrts que
les internautes vont tre capables de se proposer rciproquement des informations
susceptibles de les intresser :

En invitant chacun rendre publiques informations et productions personnelles et en
dveloppant des fonctionnalits de communication et de partage, ces plateformes offrent des
opportunits la constitution de formes collectives sur un mode non-prescriptif et rsolument
auto-organis. A leur manire, elles favorisent lmergence dune dynamique de bien commun
partir de logiques dintrt personnel en articulant de faon originale individualisme et
solidarit
73
.

Cependant, il est possible de se demander si ces phnomnes de
recommandation sappuyant sur ces communauts virtuelles ne peuvent pas faire
tomber le systme daccs linformation dans un autre travers tout aussi loign de
tout systme dmocratique.
En effet, malgr la quantit dinformations disponibles en ligne, les informations
consultes par les internautes pourraient ne pas tre si diversifies. Si, comme nous
lavons-vu, le phnomne de srendipit augmente les chances de tomber par
hasard sur des contenus trs diversifis que lon naurait sans doute pas consult en
effectuant une recherche sur un moteur ddi, le regroupement de communauts en
rseaux augmente les chances de se contenter de linformation diffuse par ses
pairs, entrainant une uniformisation de lopinion dans des entre-soi , participant

72
CARDON, Dominique, Le design de la visibilit , Rseaux 6/ 2008 (n 152), p. 93-137
[Disponible en ligne : www.cairn.info/revue-reseaux-2008-6-page-93.htm] Consult le 7 aout 2014.
73
Ibid.

31

ainsi au phnomne de balkanisation des opinions sur Internet, phnomne surtout
observable chez les internautes dont les positions sont juges extrmistes
74
.
Ainsi, si la logique de diversit des informations et des opinions est au cur des
principes qui rgissent le Web et ses imaginaires, nous avons observ ici que les
mthodes de classement des informations ont tendance ractualiser le systme de
hirarchisation qui existait dj dans lespace public traditionnel. Ce tri nest toutefois
plus opr a priori, mais aprs publication. Les phnomnes de sociabilits qui
investissent le Web permettent cependant de rendre visible les lments qui
composent la longue trane des contenus faible audience, le phnomne le plus
radicalement dmocratique de lInternet
75
. Cependant, les logiques marchandes
investissent elles-aussi de plus en plus les territoires de la sociabilit en devenant
amies avec les internautes, qui adoptent eux-mmes des comportements de
plus en plus stratgiques pour agir sur les mesures daudience et gagner en
rputation
76
.
Les plateformes sociales modifient alors elles aussi leurs algorithmes et se
laissent entraner dans des logiques marchandes qui nuisent la dcouverte de la
diversit des contenus prsents sur le Web. De plus, les internautes, de plus en plus
conscients du contre-pouvoir que peuvent leur offrir ces plateformes, se transforment
en experts et laborent des stratgies pour se faire connatre et devenir influents.
Aussi, il convient de se demander comment les internautes apprivoisent ces
nouveaux outils afin de permettre leurs ides et opinions de circuler largement de
faon se faire entendre dans un espace public qui a vu le volume de ses
contributions augmenter de faon importante.


74
FLICHY, Patrice, Internet et le dbat dmocratique , op. cit.
75
CARDON, Dominique, La dmocratie internet, promesses et limites , op. cit., p.98
76
Ibid.

32

C. Diffusion des informations sur Internet : la viralit
nest pas un processus galitaire

1. DECONSTRUIRE LA PRESUPPOSITION DEGALITE

Katz et Lazarsfeld ont trs tt minimis le rle des medias dans la formation des
opinions en dveloppant la thorie de la communication double tage. Cette
thorie avance que ladoption dune opinion ou dun comportement au sein de
groupes sociaux homognes se ralise en deux temps. Tout dabord, les messages
diffuss par les mdias sont reus par des leaders dopinion considrs comme
des autorits influentes au sein de leur groupe. Dans un second temps, ces
influenceurs vont devenir des prescripteurs auprs des individus qui composent leur
groupe social dinfluence, permettant lopinion en question dtre adopte
massivement
77
.
La figure du leader dopinion dveloppe par Katz et Lazarsfeld dans leur modle
de linfluence interpersonnelle se concentre donc autour dune zone sociale
dinfluence dlimite appele groupe primaire . Ces groupes peuvent tre
caractriss par leur petite taille, leur dure relative, leur style informel, leurs
contacts en face face et leurs finalits plus ou moins spcialises
78
. La figure du
leader dopinion se voit ainsi accorder une lgitimit dans des domaines plus ou
moins restreints dans lesquels une expertise particulire lui est reconnue.
Cependant, ces processus dinfluences sont fonds sur une crdibilit acquise
dans les interactions de la vie quotidienne
79
.
Dsormais, sur Internet, les schmas de diffusion de linformation ne fonctionnent
plus uniquement selon le partage dinformations entre interlocuteurs connus. Cest
pourquoi il est ncessaire de se rapproprier les schmas et les analyses de la

77
RAMPON, Jean-Michel, Elihu KATZ et Paul L. LAZARSFELD (1955/2008), Influence personnelle.
Ce que les gens font des mdias , Communication Vol. 29/1, 2011 [Disponible en ligne :
http://communication.revues.org/2550] Publi le 04 octobre 2011, consult le 08 aot 2014.
78
PASQUIER, Dominique, Les jugements profanes en ligne sous le regard des sciences
sociales , Rseaux 1/ 2014 (n 183), p. 9-25 [Disponible en ligne : www.cairn.info/revue-reseaux-
2014-1-page-9.htm.] Consult le 8 aout 2014.
79
Ibid.

33

circulation de linformation au prisme de lInternet et des rseaux sociaux pour
comprendre comment peuvent sy propager les diffrents contenus.
Ltude des mcanismes de diffusion des informations sur Internet sattache donc
dgager comment certains individus sont capables de permettre leurs ides
dtre diffuses massivement. Sil est difficile de mesurer concrtement lactivit
gnre par un contact particulier dans la diffusion dune opinion, on peut tout de
mme penser que sur Internet, ce qui peut caractriser un influenceur serait sa
propension susciter la discussion
80
. Sur ce point, un parallle peut donc tre fait
avec les mdias traditionnels et la notion dagenda setting que nous avons dj
voque auparavant.
Alban Martin nomme gocratie cette facult dinfluence, consistant faire
entendre sa voix plus que celle du voisin
81
quil dfinit comme une prise plus
directe sur la production de la volont gnrale lors de la dlibration entre
reprsentants, via lappropriation personnelle de la cration dune opinion
publique
82
. Ainsi, la diffusion dune ide sur le Web orchestre par une minorit
pourra avoir une influence notable sur les termes du dbat qui concernent tous les
citoyens.
Si aujourdhui tout le monde peut sexprimer sur le rseau, on ne peut pas
considrer que tous les citoyens ont la possibilit de faire rsonner leur voix de
manire gale, et de se faire entendre du plus grand nombre. Ce qui caractrise les
individus capables de se transformer en leaders dopinions et de faire circuler
largement leurs ides, outre les personnalits publiques et politiques dj connues
grce aux mdias traditionnels qui par leur popularit prcdemment acquise ont
une influence sur ceux qui les suivent sur Internet, est la comprhension des codes
de communication propres au rseau.
Lexemple des pigeons , ces entrepreneurs en colre contre les rformes de la
fiscalit induites par le Budget 2013, est ce titre une bonne illustration. Initi sur les
rseaux sociaux, ce mouvement qui se revendiqu[ait] anonyme, non organis, sans

80
BOULLIER, Dominique et LOHARD, Audrey. Chapitre 3. Le sourcing In Opinion mining
et Sentiment analysis : Mthodes et outils , op. cit.
81
MARTIN, Alban, Egocratie et Dmocratie. La ncessit de nouvelles technologies politiques , op.
cit. p.12
82
Ibid, p.66

34

objectif ni financement et apolitique
83
a rapidement pris de lampleur avant dtre
relay par les mdias traditionnels. N dune conversation prive sur Facebook
84
le
28 septembre 2012, ce mouvement sest rapidement organis afin dorchestrer sa
propagation. Trs vite, une page Facebook est cre, suivie dun compte Twitter et
dun site Internet. Le hashtag #geonpi va par la suite tre largement diffus par de
nombreux auto-entrepreurs
85
, jusqu ce que les mdias traditionnels semparent
leur tour du sujet. En effectuant une recherche personnalise sur Google avec le mot
cl pigeons , nous pouvons constater que de nombreux articles de mdias
traditionnels en ligne ont t publis entre le 1er et le 4 octobre 2012, soit trois jours
aprs la naissance de ce mouvement de protestation en ligne, comme par exemple
sur le site du Monde
86
le 1
er
octobre, ou encore sur le site de Libration
87
le 2 octobre
ou du Figaro
88
le 4 octobre.
Toutefois, le succs de ce mouvement n sur Internet ne semble pas tre le fruit
du hasard. En effet, le site Internet defensepigeons.org a t enregistr par une
agence de communication, Yopps
89
, dont le Web et les rseaux sociaux sont les
domaines dexpertise. Les pages Facebook et Twitter ont t cres par Fabien
Cohen et Carlos Dias, respectivement patron de Whoozer
90
et fondateur de
BlueKiwi
9192
. Nous voyons bien ici que le buzz engendr par le mouvement des

83
RAYMOND, Gregory "Pigeons" : d'un change Facebook au recul du gouvernement, autopsie
d'un buzz , Huffington Post [Disponible en ligne : http://www.huffingtonpost.fr/2012/10/04/pigeons-
geonpi-entrepreneurs-buzz-moscovici_n_1939291.html] Publi le 4 octobre 2012, Consult le 18 juillet
2014
84
SAMUEL, Laurent Pigeons, gense dune mobilisation efficace , Le Monde [Disponible en ligne :
http://www.lemonde.fr/politique/article/2012/10/04/pigeons-genese-d-une-mobilisation-
efficace_1770123_823448.html] Publi le 4 octobre 2012, Consult le 18 juillet 2014
85
RAYMOND, Gregory "Pigeons" : d'un change Facebook au recul du gouvernement, autopsie
d'un buzz , Huffington Post [Disponible en ligne : http://www.huffingtonpost.fr/2012/10/04/pigeons-
geonpi-entrepreneurs-buzz-moscovici_n_1939291.html] Publi le 4 octobre 2012, Consult le 18 juillet
2014
86
SAMUEL, Laurent, Pigeons, la grogne des entrepreneurs gagne la toile , Le Monde [Disponible
en ligne : http://www.lemonde.fr/economie/article/2012/10/01/pigeons-la-grogne-des-entrepreneurs-
gagne-la-toile_1768408_3234.html] Publi le 1er octobre 2012, Consult le 18 juillet 2014
87
ALBERTINI, Dominique, Entrepreneurs, des pigeons pas si plums , Libration [Disponible en
ligne : http://www.liberation.fr/economie/2012/10/02/entrepreneurs-des-pigeons-pas-si-
plumes_850287] Publi le 2 octobre 2012, Consult le 18 juillet 2014
88
LE GALES, Yann et CHAPERON, Isabelle, La rvolte fiscale des patrons des start-up se
rpand , Le Figaro [Disponible en ligne : http://www.lefigaro.fr/entrepreneur/2012/10/03/09007-
20121003ARTFIG00702-la-revolte-fiscale-des-entrepreneurs-est-
allumee.php?cmtpage=0#comments-20121003ARTFIG00702] Publi le 4 octobre 2012, Consult le
18 juillet 2014
89
YOPPS [Disponible en ligne : http://www.yopps.fr/] Consult le 18 juillet 2014
90
Whoozer est une application mobile de rseau social de proximit
91
BlueKiwi est un rseau social dentreprise

35

pigeons na pas t gnr par nimporte qui, mais a t cr par une minorit
capable de sappuyer sur leur expertise et leur matrise des codes de communication
du rseau pour diffuser largement leurs ides et peser sur le dbat public.
Remarquons quau final, leurs revendications ont t prises en compte par le
gouvernement qui a modifi son projet de loi.
De la mme manire, la diffusion de la campagne Bring Back Our Girls cite
prcdemment na rellement t massive qu partir du moment o celle-ci a
commenc tre reprise par des personnalits publiques et politiques qui ont permis
de diffuser largement le message pour en faire un sujet central de lagenda
mdiatique, linstar de la premire dame des Etats-Unis.
Cette aptitude de quelques-uns focaliser lattention du plus grand nombre sur
leurs prises de parole fait donc tomber la prsupposition dgalit propre aux
imaginaires dInternet. Toutes les prises de paroles ne sont pas galitaires sur le
rseau, et tout le monde nest pas capable de se faire entendre de la mme manire.
Pour se faire entendre il faut tre capable de matriser techniquement le rseau et
connatre les modalits de la diffusion virale dune information. De plus, la
valorisation excessive de la prise de parole en ligne fait oublier que sont exclus, de
fait, tous ceux qui ne participent pas ou nont pas accs au rseau.
Lide selon laquelle, la multiplication des opinions sur un mme sujet tend
rduire la part de subjectivit individuelle et garantit une meilleure fiabilit du
jugement
93
est donc exclure car elle occulte certains effets lis au rseau quant
la trs ingale participation des internautes :

Les mondes de lvaluation nchappent pas la loi de puissance qui rgit la plupart des
univers du Web 2.0. Il y a un fort dsquilibre dans lintensit de la pratique, avec un petit
nombre dinternautes trs actifs opposs un grand nombre dautres qui ninterviennent que
ponctuellement
94
.


92
SAMUEL, Laurent Pigeons, gense dune mobilisation efficace , Le Monde [Disponible en ligne :
http://www.lemonde.fr/politique/article/2012/10/04/pigeons-genese-d-une-mobilisation-
efficace_1770123_823448.html] Publi le 4 octobre 2012, Consult le 18 juillet 2014
93
PASQUIER, Dominique, Les jugements profanes en ligne sous le regard des sciences
sociales , op. cit.
94
Ibid.

36

De plus, il ne faudrait pas non plus oublier que si tout le monde ne participe pas
sur Internet, de nombreuses personnes nont pas accs au rseau soit par manque
de moyen, soit par manque de comptences. Il ny a donc pas dgalit sur Internet,
la fois dans la capacit faire entendre sa voix, mais aussi quant son accs
propre comme nous le rappelle la thmatique souvent voque par les politiques de
la fracture numrique .
Ainsi, comme nous le rappelle Dominique Cardon, pour tablir la hirarchie
entre haute et basse visibilit, les internautes classent, se corrigent et se critiquent
mutuellement. Cependant, ils sont trs loin de le faire dans un contexte de parfaite
galit. Rien, dailleurs, dans lesprit de lInternet, ne permet dtablir un type
dgalit qui reconnatrait tous la mme voix et la mme lgitimit. Le poids des
acteurs, leur autorit, leurs comptences techniques, leur niveau dengagement
dessinent des rapports de force qui organisent la visibilit sur la Toile. Internet invite
une dmocratie des actifs qui risque toujours de laisser sur le bord de la route les
silencieux et les non connects
95
.
Aussi, nous avons constat ici que la notion dgalit auquel le Web prtend dans
les discours autour de la dmocratie numrique tait relativiser. Cependant, il
convient tout de mme de sinterroger propos des mcanismes qui permettent
certains contenus dtre diffuss massivement en tudiant la notion de viralit.


2. LA METAPHORE DE LA VIRALITE EN QUESTION

La notion de viralit sur Internet peut tre dfinie comme un phnomne de
concentration temporelle de lattention collective des internautes sur certains
contenus
96
. La notion daudience sur Internet serait alors indissociable de la notion
de temps qui permettrait de combiner deux effets pourtant contradictoires :

95
CARDON, Dominique, La dmocratie internet, promesses et limites , op. cit., p.100
96
BEAUVISAGE, Thomas et al., Le succs sur Internet repose-t-il sur la contagion ? Une analyse
des recherches sur la viralit , Tracs 2/ 2011 (n 21), p. 151-166 [Disponible en ligne :
www.cairn.info/revue-traces-2011-2-page-151.htm] Consult le 8 aout 2014.

37


Le premier est que laudience totale crot avec le temps, et que lattention des internautes
a tendance se porter vers ce qui a dj reu de lattention. Le second, qui va dans le sens
inverse, est que lattention des internautes se tourne vers ce qui est nouveau. En rsulte une
forme typique de succs sur le Web, o lattention pour certains items se concentre, puis se
disperse, et se dplace vers de nouveaux items
97
.

Cette conception du Web en temps rel consacre ainsi la vitesse de circulation de
linformation comme nouvelle mtrique de visibilit dont les trending topics
98
de
Twitter sont lexemple phare
99
. Ainsi, on constate quune importance nouvelle est
donne la vitesse de propagation des ides qui conduit la recherche permanente
de la viralit de faon diffuser de manire rapide et massive une opinion.
Cette perception de la viralit, bien quelle saccorde la recherche de la
perception du Web en temps rel qui anime aujourdhui de plus en plus les services
chargs du marketing des grandes entreprises et des agences de communication, ne
sintresse cependant pas aux mcanismes qui permettent de rendre certains
contenus massivement diffusables, mais a tendance valoriser de faon excessive
des systmes comptables qui cherchent mesurer le Web.
La mtaphore de la viralit est ainsi largement utilise pour rendre compte de la
diffusion rapide et massive de certains contenus sur Internet. Se diffusant sur le
rseau et contaminant petit petit ses membres de faon pyramidale, lpidmie est
de plus en plus recherche par les professionnels de la communication et du
marketing, qui ont mme rebaptis leur mtier marketing viral
100
.
Pourtant, si lon souhaite comprendre comment se diffusent les opinions, ce nest
pas tant leur vitesse de diffusion que les mcanismes qui leurs permettent dtre
diffuss rapidement quil convient dtudier. Pour cela, lanalyse de la mise en forme
des contenus largement diffuss semble tre une approche intressante :


97
Ibid.
98
Les trending topics sont une mtrique propre au rseau social Twitter et qui indiquent quels sont
les sujets les plus discuts sur ce rseau un moment prcis. Il peut sagir de mots, de hashtags ou
de segment de phrases qui ont t tweets de nombreuses fois sur une mme priode.
99
CARDON, Dominique, La dmocratie internet, promesses et limites , op. cit., p.97
100
BEAUVISAGE, Thomas et al., Le succs sur Internet repose-t-il sur la contagion ? Une analyse
des recherches sur la viralit , op. cit.

38

Lacclration du passage de lopinion personnelle une opinions publique repose autant
sur la dcouverte de tiers partageant un avis que sur lagrgation de tiers donnant limpression
de partager la mme opinion. En effet, si lgocratie peut reposer sur largumentation ou la
dlibration dans lespace public pour rallier des individus sa cause, le mcanisme le plus
rapide et le plus couramment utilis est le changement de nature du message politique pour le
rendre plus viral. Un message humoristique, notamment multimdia, se propage bien plus
facilement quun message austre. Les dtournements, lhumour, les parodies, qui sont des
procds couramment utiliss pour faciliter la transmission dune opinion de proche en proche,
donnent limpression dune validation du contenu du message par son transmetteur. Ils peuvent
faire penser, vus de lextrieur, quil sagit dune opinion largement partage dans le public. Or,
penser que la diffusion virale de la mise en forme dune opinion quivaut y adhrer serait
crer un raccourci. Il y a fort parier qu partir du second cercle de personnes recevant
lopinion politique sous forme humoristique, la motivation de partage risque de relever plus dun
dsir de faire rire que dune relle adhsion au message sous-jacent. Nanmoins, un volume
important dactivit autour dun message ainsi mis en forme attirera lattention des mdias sur le
sujet, contribuant lgitimer le message original et le transformer en opinion rellement
publique
101
.

Ici, Alban Martin avance donc lide quune importance nouvelle est accorde au
format des messages. La forme humoristique est par exemple un bon moyen de
diffuser rapidement une opinion sur les rseaux sociaux car elle va permettre
dinterpeller le lecteur. Cependant, ce partage massif de la mise en forme dun
message peut poser question. Les personnes diffusant de tels messages sont-elles
daccord avec lopinion exprime ou se contentent-elle de partager la mise en forme
humoristique de celle-ci ? De la mme manire, on peut se demander si une opinion
pourrait ne pas tre partage simplement parce que sa forme ne sy prte pas ?
Dans ce contexte, difficile de savoir si une opinion largement diffuse peut donc tre
qualifie dopinion publique. En effet, la limite de cette logique [] est que cette
culture dvalorise les contenus mmes quelle fait circuler et bnficie une nouvelle
lite de spcialistes de la viralit. Autrement dit, [] lconomie virale de lattention
du Web valorise le style au dtriment de la substance
102
.
Les contextes de rception et dappropriation des contenus culturels qui
bnficient dune diffusion dite virale ont t largement tudis par Henry Jenkins
pour qui les ides qui circulent et survivent sont celles qui peuvent tre aisment
transformes, car elles pourront alors tre mises lagenda de plusieurs groupes ou
sous-cultures, pour lesquels elles seront porteuses de sens, mais dun sens bien

101
MARTIN, Alban, Egocratie et Dmocratie. La ncessit de nouvelles technologies politiques , op.
cit., p.65-66.
102
BEAUVISAGE, Thomas et al., Le succs sur Internet repose-t-il sur la contagion ? Une analyse
des recherches sur la viralit , op. cit.

39

souvent diffrent
103
. A travers lexemple des LOLcats, lauteur explique que ce qui
rend ces contenus si permables est la possibilit de retravailler en continu la
structure mme de limage, savoir la juxtaposition dune phrase comique avec une
photographie de chat. Ici, ce nest donc pas le contenu du message qui circule, mais
bien sa structure.
Nicolas Vanbremeersch complte quant lui la notion de viralit par le concept de
mmtique. Pour lui, toute personne qui souhaite diffuser un document et / ou une
information ou ses ides doit leur faire pouser un contour apte tre propag, les
faire entrer dans la logique mmtique propre au Web
104
. Selon lui, la circulation
des ides se fait selon une logique de rcupration et de recyclage du dire des
autres comme point de dpart de ses propres productions. Pour lui, cest cette
logique dchantillonnage [] qui facilite aussi la circulation de lide par le rebond et
la rappropriation par chacun de la production de lautre
105
. Ainsi, la propagation se
ferait par des mcanismes de reproduction et dimitation de ce que fait lautre.
Ces considrations nous amnent nous interroger propos de la circulation des
ides. Existe-t-il un dterminisme de lide qui possderait sa propre capacit de
circulation, dadaptation et de mutation, comme le suggrent ces mcanismes de
propagation ? Cest en tout cas lide que dveloppe Yves Jeanneret travers la
notion de trivialit. A travers cette approche, lauteur dfinit les ides et les objets
comme des tres culturels qui se chargent de valeur travers les multiples
appropriations dont ils font lobjet. Ainsi, la circulation des ides peut tre
reprsente par le cheminement de ces tres culturels travers les carrefours de la
vie sociale
106
.
Nous avons donc constat ici que le Web, loin dtre galitaire, est rgit par des
logiques de diffusion des ides qui demandent des savoir-faire. Contrairement aux
espoirs sous-tendus par les imaginaires de la dmocratie numrique, Internet est loin
dtre un espace dans lequel la mme lgitimit est accorde tous et o tout le
monde est capable de porter ses opinions haut et fort. Cependant, il est possible de

103
BEAUVISAGE, Thomas et al., Le succs sur Internet repose-t-il sur la contagion ? Une analyse
des recherches sur la viralit , op. cit.
104
VANBREMEERSCH, Nicolas, De la dmocratie numrique , Editions du Seuil, 2009, p.63
105
Ibid, p.61
106
JEANNERET, Yves, Pratiques et conomies de la trivialit , cours dispens au CELSA, cole
des hautes tudes en science de linformation et de la communication dans le cadre du master 2
Mdias Informatiss et Stratgies de Communication (MISC) le 21 novembre 2013.

40

sinterroger propos des logiques de diffusions des ides qui, en circulant dans
lespace numrique, sont sans cesse rappropries et transformes. Ces tres
culturels possdent-ils leurs propres modalits de circulation qui leurs permettent
ainsi de muter et de se diffuser ? Nous supposerons ici que, en tant quobjets
triviaux, cest par la rappropriation par chacun des dires des autres que les ides
sont capables de se diffuser massivement.


Conclusion du chapitre :
Alors que les acteurs de la fouille dopinion appuient leurs discours sur les
imaginaires de la dmocratie numrique, nous avons vu quil fallait dconstruire
lide selon laquelle lespace public numrique permettrait chacun de sexprimer et
de diffuser massivement ses ides de faon spontane et sans filtre. Le Web ne peut
donc pas tre considr comme une nouvelle agora lectronique permettant
chacun de faire circuler massivement ses opinions, en opposition aux mdias
traditionnels qui slectionnent a priori les personnalits juges lgitimes pour
sexprimer dans un espace public cloisonn. Ainsi, les conditions de la circulation des
opinions sur Internet ne sont pas aussi dmocratiques que ce que les discours sur
lespace public numrique peuvent laisser croire.
Conformment aux attentes de lInternet militant, lespace public lre dInternet
a permis de dsenclaver les espaces dexpression autorisant chacun prendre la
parole sur le rseau contribuant ainsi la diversification des opinions exprimes. Les
citoyens sont ainsi mme, en slectionnant eux-mmes les informations qui les
intressent, de se dbarrasser du paternalisme mdiatique et de retrouver une
certaine autonomie quant aux sujets qui mritent leur attention. Cependant, nous
avons vu que la disparition des gate-keepers peut galement entraner des effets
nfastes la construction de lopinion publique en ligne. Lchange darguments
raisonns nest en effet pas la norme sur le rseau, ce qui conduit un clatement
des opinions exprimes en ligne. De plus, la diffusion massive de fausses
informations peut avoir des consquences sur la formation dune opinion publique
qui nest alors pas fonde sur des faits avrs, ce qui peut entraner de relles
rpercussions politiques.

41

Les logiques de traitement et de tri propres au Web chahutent galement la
conception dun Web galitaire o chacun serait capable de se faire entendre de
manire gale. Si le rseau a longtemps t peru comme le recours qui permettrait
de smanciper du contrle des lites mdiatiques sur les informations dans le but de
redonner de limportance aux expressions individuelles des citoyens, nous avons vu
que sur Internet, les mthodes de tri et de classement des informations sont rgies
par des algorithmes qui, malgr le discours de leurs concepteurs, ont tendance
reproduire les travers de lespace mdiatique traditionnel. Lorganisation sociale des
informations pourrait tre considre comme un recours face lhgmonie des
moteurs de recherche en permettant aux contenus qui composent la longue trane de
lInternet dtre valoriss. Pourtant, des logiques marchandes et de dveloppement
dinfluence personnelle investissent elles aussi petit petit les rseaux sociaux.
Tous les internautes ne sont donc pas gaux face aux outils que leur procure le
Web. Avec Internet, sont apparus de nouveaux leaders dopinions et mergent
dsormais des stratgies qui permettent ceux qui matrisent les codes du rseau
de diffuser massivement leurs ides, dominant ainsi les reprsentations du monde
qui circulent sur le Web. Cette circulation est vhicule par la possibilit donne
chacun de se rapproprier les ides et les crations des autres. Ainsi, en se
dformant par assimilation et par appariement, les ides et les objets circulent
comme des tres culturels triviaux indpendants.
Malgr tout, les acteurs de lopinion mining avancent que le Web peut apporter de
nouvelles solutions pour mesurer et qualifier les phnomnes qui agissent sur
Internet et sous-tendent la formation des opinions. En effet, linformatique et les
mathmatiques sont dsormais capables dapporter de nouvelles mthodes
danalyse fondes sur la comprhension automatise des milliers de donnes et de
traces disponibles sur le Web, provoquant un changement dchelle des corpus quil
est possible de constituer et de traiter.
Face ces contenus si riches, si diversifis et si difficiles apprhender, il
convient de se demander comment cette prolifration de conversations enchevtres
et confuses peut faire sens travers les mthodes dopinion mining ?


42





II. Discours promotionnels : un frein dpasser
pour lgitimer la fouille dopinion

Nous avons vu que, bien que le Web ne soit pas aussi galitaire que les
imaginaires de lInternet et de la dmocratie numrique ne le laissent croire, de
nombreux contenus sont dissmins un peu partout sur Internet par les internautes,
constituant autant de traces susceptibles dtre analyses par les acteurs de la fouille
dopinion.
Des milliers dinformations, davis, de jugements, dopinions et de commentaires
sont en effet laisss chaque seconde sur Internet, constituant un corpus gant et un
nouveau terrain danalyse pour les acteurs publics et privs. Lmergence de
lexpression big data est devenue le symbole de cette masse de donnes
tellement volumineuse et presque impalpable, qui concentre lattention des
industriels qui fantasment, travers elle, en supputant les viviers conomiques que
son exploitation pourrait offrir.
Cette exploitation des donnes redessine en effet, entre autres, les perspectives
du traitement, de lanalyse et de la visualisation de ces traces qui ouvrent un tout
nouveau champ de recherche en termes dexploration de linformation. Dsormais,
les donnes sont vues comme des matriaux exploitables, qui, une fois quils auront
t traits, analyss et classs, permettront de mieux comprendre les phnomnes
sociaux, conomiques et politiques en jeu dans notre socit.
Lide dune exploitation conomique se retrouve ainsi dans la thmatique de la
fouille dopinion. En anglais, le terme mining signifie exploitation minire ,
tandis quen franais le terme de fouille peut voquer la recherche archologique. Il y

43

a donc bien, derrire cette expression, lide de trouver dans lanalyse des opinions
prsentes sur le Web quelque chose de prcieux dont il est possible de tirer un
bnfice conomique.
Aussi, nous nous demanderons dans cette seconde partie comment, face des
contenus si riches et si diversifis, les acteurs de lopinion mining sont capables de
traiter ce dluge dinformations grce des procds informatiques et
mathmatiques dans le but den extraire du sens et de la valeur.
Dans un premier temps, nous nous interrogerons propos de la notion dopinion,
afin de comprendre ce qui distingue ce type de prise de parole des autres formes
dexpression. Nous nous demanderons comment il peut tre possible de les isoler
afin de les traiter.
La partie suivante se concentrera sur les discours des acteurs de la fouille
dopinion. Cette analyse nous permettra de comprendre quelles sont les promesses
faites par ces derniers, et la manire dont ils parviennent lgitimer leurs analyses.
Enfin, nous verrons dans une troisime partie quelles sont les controverses qui
agitent le secteur de la fouille dopinion, et nous nous demanderons comment il
pourrait tre possible de les dpasser.





44

A. Libration des subjectivits : comment reconnatre
une opinion ?

1. LE NOUVEAU PARTAGE DU SENSIBLE

Lchange discursif de positions raisonnables et argumentes concernant des
problmes dintrt gnral permet, dans la conception que donne Habermas de
lespace public, daboutir la cration dune opinion publique
107
. Les contributions
qui se dploient dans lespace public dcrit par lauteur se doivent donc de prsenter
un intrt pour la rflexion collective mise en uvre qui permettra daboutir une
position commune.
Or, nous avons vu quau sein de lespace public numrique, lchange de
positions raisonnables sur des sujets dintrt public est loin dtre la norme :

Llargissement de laccs la visibilit sur Internet sest en quelque sorte pay dun
abaissement des contraintes qui avaient fond les formes du discours public en le plaant dans
lhorizon rgulateur de la raison, de lautocontrle, de largumentation et du dtachement vis--
vis des intrts particuliers
108
.

En effet, comme nous lavons exprim, il nexiste plus sur Internet aucune forme
de rgulation car la spcificit du rseau rside dans le fait que toutes les formes de
subjectivit peuvent sy exprimer. La diversit des expressions est ainsi rendue
visible, ce qui rend possible une nouvelle conception de lespace public et de la
parole dmocratique dans laquelle toute diversit expressive est accepte :

En encourageant lanonymat, que pourchasse lespace public traditionnel, Internet sest
montr beaucoup plus tolrant lgard des nonciations la premire personne, des points de
vue premptoires, des coups de gueule, des propos hasardeux, potiques, loufoques, drles ou

107
Dfinition de lespace public par HABERMAS, Jrgen selon WOLTON, Dominique, Espace
public , Dominique Wolton, op. cit.
108
CARDON, Dominique, La dmocratie internet, promesses et limites , op. cit., p.40

45

vibrants. Toute lconomie de lnonciation, patiemment labore pour construire des formats
dexpression publique lgitimes, se trouve brutalement chahute
109
.

Sur ce point, les pages personnelles et les blogs sont un bon exemple car,
labors par des usagers ordinaires du Web autour de leurs centres dintrt,
hobbies, passions, [ils] participent de la multitude des propositions subjectives
disperses sur le rseau pour en constituer lune des ressources premires
110
que
Laurence Allard et Frdric Vandenberghe qualifient dindividualisme expressif .
Ainsi, la page personnelle propose une configuration technique favorable
lexpression de soi travers la mise en page suivant les frames des logiciels-
auteurs qui vont avoir tendance copier les structurations existant pralablement
dans la presse crite ou proposer la pseudo-personnalisation de sites modles
mettre en couleur . Se voit ainsi engendre une relative standardisation des
formes digitales dexpression de la subjectivit qui se voient cadr[e]s par les
standards de loffre logicielle du multimdia domestique
111
.
Trois principales caractristiques peuvent tre attribues aux formes de
lexpression de soi qui sexpriment travers la page personnelle et les blogs. Tout
dabord, le bricolage identitaire typique de lindividualisme expressif
contemporain
112
est le reflet dun moi la fois pluriel et dynamique. En effet, ces
outils sont propices lexposition des diffrentes facettes de soi qui peuvent de
surcrot tre enrichies et ractualises lenvi. De plus, ceux-ci permettent aux
individus de tisser des liens avec dautres autour dnoncs travers lesquels ils
produisent de faon continue et interactive leur identit sociale
113
. La mise en
relation est donc la troisime caractristique retenir car les reprsentations de soi
sont toujours lies la production de publics auxquelles elles sont destines.

109
Ibid.
110
ALLARD, Laurence et VANDENBERGHE, Frdric, Express yourself ! Les pages
perso , Rseaux 1/ 2003 (n
o
117), p. 191-219
[Disponible en ligne : www.cairn.info/revue-reseaux-2003-1-page-191.htm] Consult le 9 aout 2014.
111
Ibid.
112
Ibid.
113
CARDON, Dominique et DELAUNAY-TETEREL, Hlne, La production de soi comme technique
relationnelle , Rseaux 4/ 2006 (no 138), p. 15-71
[Disponible en ligne : www.cairn.info/revue-reseaux-2006-4-page-15.htm.] Consult le 9 aout 2014.

46

Ces trois caractristiques, pluralisme, dynamisme et mise en relation, sont
aujourdhui galement attribuables aux rseaux sociaux les plus rcents
114
. En effet,
si lon sintresse par exemple au rseau social Facebook, on remarque que la page
de profil peut permettre dexprimer diffrentes facettes de la personnalit dun
individu. La gestion des groupes damis peut par exemple offrir la possibilit de
donner une image de soi diffrente en fonction des rcepteurs des noncs
exprims. Lutilisation des posts rend le rseau dynamique. Chacun peut en effet
actualiser son profil lenvi en publiant de nouvelles informations. Enfin, travers les
mentions, les tags, les commentaires et les conversations prives, le rseau rempli
bien galement une fonction de mise en relation.
Aussi, ltude des blogs et des pages personnelles nous permet de dfinir une
typologie des diffrentes modalits dexpression en ligne transposable aux rseaux
sociaux.
En tudiant les spcificits relationnelles des plateformes de blogs, Dominique
Cardon et Hlne Delaunay-Teterel tentent de rendre compte de la spcificit
interactive de ces outils de communication, et proposent en tenant compte des effets
du public des blogs sur les contenus quatre types de communication. En effet, sur les
blogs comme sur les rseaux sociaux, il convient de bien comprendre comment
sentremlent la fois les spcificits de lnonciation, de lnonc et de la rception.
Les auteurs expliquent que cest parce quelles sont de natures fondamentalement
interactives, [que] les productions des blogueurs restent lies lexpression de
lidentit personnelle de leur auteur tout en leur permettant dtablir des liens directs
et personnaliss avec leur public . Ainsi, la constitution de luvre et la rencontre
du public paraissent [] insparable, puisque les possibilits interactives du blog
facilitent une co-fabrication continue des noncs mis en circulation
115
.
Le premier type de communication mis en avant par les auteurs et qui permet de
comprendre les effets du public sur les contenus des blogs est le partage des
intriorits :

114
MAGIS, Christophe, Pratiques communicationnelles , cours dispens luniversit Paris VIII
dans le cadre du master 1 Communication numrique, conduite de projets et veille stratgique le 29
novembre 2012.
115
CARDON, Dominique et DELAUNAY-TETEREL, Hlne, La production de soi comme technique
relationnelle , op. cit.

47


La premire figure de rcit de soi rencontre dans les blogs met en scne une nonciation
intime dans laquelle, sous une forme la plus souvent anonyme, lnonciateur livre des contenus
portant sur ses tats internes et sa vie prive. Tmoigner dun trouble intrieur, tablir le journal
de sa grossesse, dvoiler des lments de sa sexualit, confesser des dtresses suicidaires, se
photographier dans son environnement le plus familier, fictionnaliser son quotidien en
laccompagnant de penses, de rveries, de rcits imaginaires ou de pomes
116


Dans cette premire configuration, lnonciateur est donc au centre de la
production du rcit de lui-mme et cherche rvler son intriorit en dvoilant aux
autres les traits de son identit les plus intimes. Ce sont ces rvlations trs
personnelles qui vont permettre aux blogueurs de se reconnatre et de sidentifier
mutuellement les uns aux autres, pour finalement entrer en contact.
Un deuxime type de blogs et de pratique sociale est caractris par les auteurs
comme un entre-soi devant les autres . Ici, la publication des noncs se dtache
du mode intimiste vu prcdemment pour se diriger vers un mode plus familier qui
se focalise, non sur lintriorit du blogueur, mais sur la description de son
environnement et de ses activits quotidiennes :

Ce que lon montre alors de soi, cest dabord ce que lon est dans les interactions
ordinaires et ce que lon dit, ce que lon change dans les relations sociales habituelles : des
infos, des potins, des blagues, des souvenirs de moments passs ensemble, des coups de
cur, des moqueries et des projets dactivits. Lnonciation ne prend plus de pose
introspective et littraire, elle mime le naturel familier des conversations quotidiennes. []Les
noncs, de leur ct, consignent le droulement des activits les plus banales : liste de
courses, dernire soire passe chez les amis, difficults rencontres avec un collgue, sortie
dans un bar, dcoration dune pice de lappartement, critres du choix dun nouvel achat, bref
tous les domaines de la vie quotidienne peuvent y tre ramasss
117
.

Les productions montres ici sont donc troitement lies la vie quotidienne qui
est traduite au sein du dispositif dnonciation. Le rapport avec le public stablit dans
le partage des traces des activits partages et des rfrences culturelles
communes.

116
Ibid.
117
Ibid.

48

Un troisime type de production ditoriale que les auteurs ont nomm
amateurisme, rputation, professionnalisme est galement mis en avant. Ici,
lobjectif de lnonciation consiste montrer au public ses comptences dans un
domaine particulier :

Cest en tant que dessinateur , brodeuse , fan de Johnny Depp , collectionneur
de voiture ancienne ou crivain , que le blogueur cherche produire, pour lui-mme et
pour les autres, une dfinition stable des qualits dont il aura su faire la dmonstration
118
.

Ainsi, dans cette troisime configuration, le matriau produit est indissociable des
intrts et des comptences de lnonciateur qui constituent lune des facettes de
son identit sociale. Le lien avec le public se cr alors travers la passion
commune qui les relie et qui leur permet de mettre en commun leurs comptences.
Enfin, les auteurs ont tabli un quatrime type dnonciation quils ont nomm
distanciation, discussion et critique . Ici, les blogueurs sidentifient comme des
citoyens qui participent par leurs contributions un largissement du dbat public.
Lnonciateur est donc totalement dtach de lnonc produit afin de se conformer
au principe de distance critique ncessaire la discussion :

La responsabilisation de lnonciation est indispensable lexpression dun jugement
public dans ce quatrime mode dnonciation. Pour tre recevable comme tel, un jugement
public doit tre assum par un je citoyen qui a su construire une distance entre la personne,
et lobjet de son nonciation. Glisse entre lnonciation et lobjet de l'nonciation, la
modalisation argumentative ( je trouve que , je pense que ) est propre la profration
dune opinion dans un espace public. Elle institue un dtachement entre le monde des objets
soumis lvaluation et le cercle des valuateurs, condition indispensable la coordination des
opinions dans un dbat public de nature critique
119


Cette typologie des diffrentes prises de paroles qui stablissent au sein de la
blogosphre peut, comme nous lavons vu, facilement tre transpose aux rseaux
sociaux. De surcroit, celle-ci nous permet de constater que se ctoient sur le Web
plusieurs figures de lespace public numrique qui ne peut alors pas tre considr
comme homogne :

118
Ibid.
119
Ibid.

49


Dans la premire configuration, lchange des intriorits renvoie directement au modle
de la communaut de lecteurs qui, avec la naissance du roman pistolaire, a t tablie, aprs
Rousseau, comme une nouvelle forme de communication entre les imaginations. Dans la
deuxime, cest la question de la visibilit publique et des interactions ordinaires qui se trouve
explicitement mobilise comme une mise en scne de lidentit construite dans les relations
avec les proches. Dans le troisime rgime de communication, lespace public prend une forme
communautaire et spcialise et obit des critres dordre et dchanges relatifs lespace
social et culturel particulier que forment, dans des contextes varies, les communauts de
pairs. Seul le quatrime mode de communication peut-tre rfr la forme habermassienne
de lespace public de dialogue et de controverse entre individus autonomes et
responsables
120
.

A travers cette typologie ralise par Dominique Cardon et Hlne Delaunay-
Teterel, nous voyons bien que les dispositifs de communication disponibles en ligne
et accessibles tous peuvent intgrer des formes dexpression compltement
htrognes qui nont pas toutes un intrt pour la formation de lopinion publique.
Cest pourquoi il nest pas possible, sans craser [leurs] spcificits
communicationnelles, de soumettre lensemble des blogs aux rgles de lecture et
dinterprtation de lespace public traditionnel, dfinit par limpersonnalit et
labstraction universalisante du public civique
121
.
Mais alors, face ce nouveau partage du sensible, comment peut-il tre possible
de distinguer les propos qui vont savrer utiles dans la formulation de lopinion
publique de ceux qui ne le sont pas ou relvent de la sphre prive ? Comment les
acteurs de lopinion mining peuvent-ils parvenir isoler les propos pertinents ?
Comment choisir les contenus retenir et comment les hirarchiser ? Une valeur
gale doit-elle tre accorde toutes ces prises de parole ? A travers la dfinition de
la notion dopinion, nous allons tenter de rpondre ces questions.





120
Ibid.
121
Ibid.

50

2. LOPINION, UN OBJET NECESSAIREMENT IMPALPABLE ?

Le Web recle donc une diversit de contenus qui ne sont pas tous pertinents
pour la formation de lopinion publique. Cest pourquoi il convient de se demander
comment il peut tre possible de qualifier la notion dopinion dans le but dtre
ensuite mme de reconnatre les noncs qui savreront utiles pour la dcrypter.
La notion dopinion implique forcment explicitement ou implicitement lexpression
dun point de vue, ce qui la rend irrmdiablement subjective puisquelle exprime la
reprsentation dun monde tel quil apparat une personne donne un moment
donn. Ainsi, lexpression dune opinion inclut forcment un rfrent, cest--dire
lobjet propos duquel on sexprime, la reprsentation que lon se fait de cet objet
ainsi que ltat desprit dans lequel on se trouve au moment de lnonciation
subjective. Aussi, selon Laurence Kaufmann, les opinions sont des jugements
dvaluation qui vont prsupposer lexistence dun fait pour lui attribuer un prdicat
qui le qualifie sous un aspect et dun point de vue bien particulier
122
.
Lopinion soppose une reprsentation objective du monde et permet dexprimer
lattitude dune personne par rapport un objet donn. Elle est donc difficilement
dtachable du rle de lnonciateur dont elle reprsente ltat desprit puisquil
sexprime par le je qui lui permet de revendiquer une position personnelle et
subjective.
Nous le voyons bien ici, lopinion se caractrise donc par la subjectivit du sujet,
que lon pourrait qualifier de valeur , oppose une suppose objectivit que lon
pourrait qualifier de fait . Aussi, il pourrait par exemple tre possible dimaginer un
classement des matriaux linguistiques disperss sur le Web selon ces deux
aspects, considrant que seule la matire classe dans la catgorie valeur serait
pertinente pour lanalyse
123
.

122
KAUFMANN, Laurence, L'opinion publique : oxymoron ou pleonasme ? , Rseaux 1/ 2003
(n
o
117), p. 257-288 [Disponible en ligne : www.cairn.info/revue-reseaux-2003-1-page-257.htm]
Consult le 10 aout 2014.
123
EENSOO-RAMDANI, Egle, BOURION, Evelyne, SLODZIAN, Monique, VALETTE, Mathieu De la
fouille de donnes la fabrique de l'opinion. Enjeux pistmologiques et propositions , in GRIVEL,
Luc (dir), Analyse d'opinions sur internet, Les Cahiers du Numrique, Volume 7, n2, 2011, p.15-39.

51

Cependant, il est problmatique de classer le matriau linguistique de la sorte car
la complexit du langage mnera toujours une relative imbrication des lments qui
relvent du fait de ceux qui relvent de la valeur :

Considrons un exemple tir du domaine des critiques dordinateurs portables (Pang et
Lee, 2008) : le syntagme long battery life , considr a priori comme factuel, assigne en fait
une valeur positive lordinateur, et cette valeur est contenue dans la dnomination puisque la
dure dautonomie de la batterie figure parmi les critres positifs importants pour cet outil
technique. Il serait illusoire de croire que lon aurait mieux rpondu lexigence de sparation
fait-valeur en proposant la dnomination batterie dune dure de dix heures , dune factualit
renforce. En effet, cette assertion sera interprte comme positive dans le contexte actuel de
notre socit, eu gard son dveloppement technologique, mme si linterprtation est
dpendante du degr dexpertise du lecteur du message
124
.

Pour contourner cette difficult, une autre mthode de dtection des opinions
consiste considrer comme tel tout matriau auquel il est possible dattribuer une
polarit positive ou ngative. Cependant, nous pouvons considrer quun point de
vue sur un sujet ne se caractrise pas toujours par une polarit mais discrtise un
espace de valeurs plus complexe (par exemple, appartenir un parti politique ou
soutenir un courant idologique)
125
. Ici, les expressions seules ne pourront donc
pas toujours tre classes comme positives ou ngatives, car cest la connaissance
de lnonciateur et de ses positions politiques qui permettra de connatre la polarit
de lexpression. Ainsi, nous voyons bien que dissocier un nonc de son nonciateur
peut tre source derreur.
La notion de subjectivit est donc un lment construit partir de diffrents
indices que sont lnonc, lnonciateur et les conditions de lnonciation. Cest
pourquoi il convient de sinterroger propos des mthodologies employes par les
instituts qui ralisent des tudes dopinions grce aux matriaux linguistiques
collects sur le Web. Comment ces instituts parviennent-ils saisir et analyser les
diffrents indices qui composent la notion de subjectivit ? Comment le traitement
automatis de ces immenses corpus peut-il permettre de rvler des opinions ?
Cest ce que nous devrions comprendre en analysant les discours de diffrents
instituts de fouille dopinion.

124
Ibid.
125
Ibid.

52

B. Des promesses opaques : les processus techniques
dissimuls par des discours promotionnels

Nous avons vu que les conditions de la diffusion des opinions sur Internet sont loin
de ce que les imaginaires dInternet pouvaient laisser attendre, et que, de ce fait, il
est bien difficile dapprhender la notion mme dopinion. Il convient alors de se
demander comment les instituts positionns sur le march de lopinion mining
prsentent leurs clients la dmarche qui doit leur permettre de traiter le matriau
linguistique.

1. LA VISEE PROMOTIONNELLE DU DISCOURS DE
LEGITIMATION

Les acteurs du march de la fouille dopinion avancent lide quil serait possible
de visualiser des mouvements dopinions partir des conversations issues du Web.
Pour sinterroger propos des promesses faites par ces instituts dun nouveau
genre, nous nous appuierons sur une analyse de discours compare tablie partir
des sites Internet de trois instituts dtude : Scan-Research
126
, Linkfluence
127
et
Netscope
128
. Ainsi, nous chercherons comprendre comment ces acteurs, grce
leurs discours, lgitiment leurs pratiques et justifient leur expertise sur le sujet de
lanalyse des conversations en ligne. Pour cela, nous tudierons les modes
dargumentation, les modles nonciatifs ainsi que les champs smantiques utiliss
sur leurs sites Internet. Le matriau textuel recueilli et class est disponible en
Annexe 1 page 103.
Ltude des indices nonciatifs nous permet danalyser la manire dont les acteurs
sinscrivent et inscrivent le public de leur site Internet dans leurs discours partir de
diffrents marqueurs. Ainsi, lentreprise Scan-Research semble vouloir tmoigner
dune certaine distance avec son nonc en se dsignant majoritairement la

126
SCAN RESEARCH [Disponible en ligne : www.scan-research.com] Consult le 5 juillet 2014
127
LINKFLUENCE [Disponible en ligne : http://linkfluence.com/fr/] Consult le 5 juillet 2014
128
NETSCOPE [Disponible en ligne : http://www.netscope.fr/institut] Consult le 5 juillet 2014

53

troisime personne, ce qui donne une impression de neutralit, tout comme lInstitut
Netscope qui donne voir dans ses noncs une certaine distanciation vis--vis des
propos mis ( Scan-research fournit ses clients , Scan-research a dvelopp
un ensemble doutils et de mthodes , Linstitut Netscope est n , des
professionnels expriments ). Cette impression est dailleurs renforce par la
prsentation des professionnels de manire factuelle qui met en avant leurs
fonctions, leurs expriences et leurs publications, le tout la troisime personne du
singulier ( Gilles Achache a cr Scan-research lt 2010 ). Cependant, la
prsence du locuteur dans le discours rattrape parfois cette apparente neutralit
avec lutilisation des pronoms nous et nos qui viennent rappeler lattache des
instituts au discours ( ce que nous faisons , nous recueillons , nos outils ,
notre institut ). A contrario, lagence Linkfluence assume pleinement son
nonc, comme en tmoigne lutilisation massive de pronoms personnels la
premire personne du pluriel ( notre offre de social media intelligence , ils nous
font confiance , notre prsence sur les rseaux sociaux , qui sommes-nous ,
notre approche , nos convictions ).
De plus, lagence Linkfluence sadresse directement ses prospects par
lutilisation de la seconde personne du pluriel, donnant ainsi une impression de
proximit, mais incluant galement une posture promotionnelle directe ( Linkfluence
vous aide tirer le maximum de valeur , si vous coutez , dcouvrez ). Les
instituts Scan-Research et Netscope conservent quant eux une certaine distance
avec la figure du rcepteur qui nest pas directement dsign ( proposer au march
des entreprises , fournir les rsultats de nos analyses nos clients ).
Toutefois, lorsquil est question du public cible de ces sites Internet, les noncs
utiliss aprs la dsignation du client-rcepteur relvent majoritairement du registre
de laide apporte ou du problme rsoudre ce qui permet aux Instituts dinsister
travers leurs discours sur la valeur quils peuvent apporter au client ( fournir dans
les meilleurs dlais les rsultats de nos analyses nos clients pour quils prennent
leurs dcisions dans un monde o lurgence est devenue le rythme ordinaire ,
Linkfluence vous aide tirer le maximum de valeur , les autorits et les pouvoirs
constitus prouvent de plus en plus de difficults matriser ).
Il est galement possible de constater une certaine confusion entre la figure de
lmetteur et du rcepteur dans le discours de ces instituts. En effet, sur le site de

54

Scan-Research, la forme interrogative est largement utilise pour figurer les
questions que doivent se poser les clients potentiels ( Comment ma marque, mes
produits & mes services sont-ils perus par les internautes ? , Comment va ma
marque ? , O va ma marque ? ). Lutilisation de cette tournure stylistique est
pousse son paroxysme dans la rubrique offre du site o la description de
loffre se fait par lintermdiaire de questions restes sans rponses qui
prsupposent que les outils utiliss permettront dy rpondre. ( Comment prendre
en compte lnorme quantit de messages et davis mis en ligne chaque jour par les
Internautes sur les rseaux sociaux ? , Comment suivre lvolution constante et
rapide de lopinion des consommateurs ? ). Cette confusion entre nonciateur et
rcepteur est galement prsente sur le site de linstitut Netscope qui utilise la
premire personne du pluriel pour inclure le lecteur dans ses propos ( Cette
rvolution a de fait affect toutes nos pratiques ). Enfin, Linkfluence choisit
galement dinscrire le rcepteur dans son nonc, mais en utilisant un autre
procd. En effet, le rcepteur est directement matrialis par des citations qui lui
donnent la parole. Ce procd permet, travers lexemple de clients qui ont fait
confiance lAgence et qui ont donn leur avis, de rassurer le client potentiel
( Nous avons choisi Linkfluence parmi une quinzaine de prestataires car ils
proposent la fois une veille de la marque et de ses thmatiques [] travers des
outils performants et une quipe ddie - Jean-Nol Pnichon Digital Director Mc
Donald's France ). Ainsi, linscription de la figure du destinataire dans le discours
permet de jouer sur une logique promotionnelle indirecte en lui montrant comment
les outils danalyse de la conversation peuvent lui tre utiles.
Trois tapes se distinguent dans le discours de lInstitut Netscope qui joue sur des
oppositions entre le pass, le prsent et le futur. Tout dabord, le pass qui a vu
natre la rvolution Internet et qui est associ au champ lexical de la peine et de
la difficult travers lutilisation de verbes comme affecter ou encore
prouver . Le prsent, ensuite, offre dsormais un formidable stock
dinformations ainsi que les outils pour tirer profit de la multitude des
conversations qui sexpriment sur Internet, ce qui va nous mener vers une nouvelle
re , future, qui permettra den tirer un avantage. Nous voyons bien ici, travers
llaboration du discours, comment des difficults ( les autorits et les pouvoirs
constitus prouvent de plus en plus de difficults matriser les opinions ) vont

55

pouvoir tre renverses de faon en tirer un avantage la fois conomique et
politique ( offrir de nouvelles perspectives , tirer pleinement profit , tirer
intelligemment parti des contenus ). Pour Scan-Research et Linkfluence,
lutilisation massive du prsent est au contraire porteuse de nouvelles opportunits
qui se dessinent ds aujourdhui. Aucun conditionnel nest utilis dans leurs discours,
ce qui laisse prsager que les technologies sont aujourdhui prtes et que leur
succs ne fait pas de doute pour les nonciateurs. Plus encore, Linkfluence prsente
comme un devoir le traitement du matriau textuel, comme en tmoigne lutilisation
massive des verbes falloir et devoir ( Le social media intelligence est une
opportunit quil faut pouvoir adapter et traduire , Il faut allier technologies
innovantes et expertise humaine , ). Quant Scan-Research, linstitut se prsente
travers lutilisation massive de verbes daction comme un acteur investit dans le
traitement des opinions dans le but doffrir un service immdiat et efficace ses
clients ( sest fix pour objectif de rpondre , suivre lvolution rapide et
constante , fournir dans les meilleurs dlais les rsultats ).
Enfin, les trois instituts utilisent massivement les effets de liste pour dcrire les
services dont vont pouvoir bnficier leurs clients ce qui leur permet dapparatre
comme nombreux. Pour simuler une relative objectivit, ils utilisent de manire trs
frquente des verbes linfinitif ou des noms forms partir de verbes ( recueillir ,
collecter , traiter , mesurer , suivre / Observation , Evaluation ,
Identification , Visualisation ). Ainsi, cela donne limpression que les
bnfices tirs de ces outils seront nombreux et utiles.
Ltude des termes subjectifs nous permet de constater le culte vou par ces
agences la technologie quils utilisent ou quils ont dveloppe, ainsi qu leurs
mthodes danalyse. Aussi, le champ lexical de linnovation et de la nouveaut,
argument commercial bien connu, est-il largement utilis, principalement chez
Linkfluence ( Une solution unique , des mtriques innovantes , des
technologies la pointe ) et chez Netscope ( un outil innovant , un
renouvellement des approches et des mthodes denqute , cet outil exploite et
valorise les nouvelles potentialits offertes par le Web 2.0 ). La technologie est ainsi
prsente comme la cl qui permettra de faire face aux nouveaux dfis que sont
lnorme quantit de messages et davis mis en ligne chaque jour et qui
tmoignent de lvolution constante et rapide de lopinion qui reprsente pourtant

56

un formidable stock dinformations . Face ce capharnam ambiant, lanalyse des
opinions est prsente comme un travail minutieux qui permettra une mesure
prcise , rigoureuse , structure , dtaille , fine et exhaustive . La
recherche de la vrit ( une comprhension fine de ce que disent vritablement
les internautes , la production de donnes particulirement ralistes ) semble en
effet tre le point dorgue du discours des acteurs de lopinion mining. De plus, les
outils proposs aux clients voient leur ergonomie et leur utilisabilit largement
valorise travers des critres de simplicit, defficacit et dutilit et une rflexion
intelligente ( Fournir une reprsentation simple et intuitive de donnes
complexes , Une interface efficace pour une veille simple et performante , tirer
intelligemment parti des contenus circulant sur le Web 2.0 ). Aussi, nous
remarquons que le discours promotionnel des instituts repose majoritairement sur
lopposition qui est faite entre "l'norme quantit de messages", l'opinion "complexe",
" constante et rapide" et la comprhension "fine", "dtaille", "simple", "intuitive" quils
proposent et qui permet de comprendre ce que disent "vritablement" les
internautes.
Les logiques argumentaires utilises visent majoritairement construire un
discours bas sur la confiance et la lgitimit des acteurs. Ainsi, les metteurs
cherchent sduire leur auditoire en mettant en avant la reconnaissance du secteur
pour leur institut ( Radarly reoit le prix des meilleurs Earned Media Analytics dans
le Goldbach Monitoring Tool Report 2014 , Nos mthodes de cartographie et de
segmentation communautaire du Web sont devenues des rfrences et nos
technologies ont t de nombreuses fois primes ), leur bonne sant conomique
( Linkfluence annonce une nouvelle leve de fonds de 6.5M , En 2014,
Linkfluence acquiert TrendyBuzz, rfrence dans le monde de la e-rputation ), ou
encore en voquant leur proximit avec des partenaires de rfrence ( Scan-
research est partenaire pour 2014 de lagence Leo Burnett (Groupe Publicis) ,
soutenu par le ministre de lconomie numrique , Scan-research reoit le
soutien de la BPI et de la Mairie de Paris pour sa R&D, ainsi que celui de
Scientiple ). Ces pratiques qui relvent du domaine de lethos vont permettre
au locuteur de montrer au rcepteur quil peut avoir confiance en leur Institut
puisquil est reconnu par dautres qui ont dj une lgitimit. Linkfluence pousse
encore plus loin cette logique de mise en confiance en insistant fortement sur les

57

nombreux clients qui lui ont fait confiance, ainsi que sur sa prennit sur le march,
quitte parfois afficher des chiffres diffrents sur certaines pages du site ( depuis
2006, plus de 300 clients accompagns et satisfaits , lacteur historique et de
rfrence , depuis 7 ans, nous avons accompagn plus de 500 clients sur des
projets en de multiples langues et sur lensemble des continents ). Enfin, pour
convaincre de son srieux, Netscope mise quant lui sur lexprience des
professionnels qui composent son institut ( Jean-Yves Dormagen, professeur de
science politique lUniversit Montpellier 1, Florence Paulin et Malik Larabi,
directeurs associs de Somme toute , Institut dtudes dopinion et de conseil, ont
dcid de faire converger recherche fondamentale et mthodologies professionnelles
pour permettre leurs clients de tirer intelligemment parti des contenus circulant sur
le Web 2.0. , des professionnels expriments du monde des tudes et
chercheurs en sciences sociales ). Linstitut sappuie galement sur le logos
en raisonnant de manire logique et en sappuyant sur des informations
prtendument factuelles car chiffres pour dmontrer le bienfond de sa dmarche
( En seulement 10 ans, surfer sur la toile est devenu une pratique ordinaire pour
une grande majorit de la population. Dans un pays comme la France, la population
des internautes est, en effet, passe de 11,9 37,5 millions de personnes. Plus de 6
Franais sur 10 sont ainsi dsormais connects sur le net. , Rien que dans un
pays comme la France, ce sont des millions de points de vue qui sexpriment tous les
jours sur la toile ). Suivant cette logique de raisonnement, Linkfluence va encore
plus loin en prsentant le traitement des conversations en ligne comme une addition
permettant de crer de la valeur ( Social Media Intelligence = capter, trier, analyser,
reprsenter ces donnes pour crer de la valeur ). Enfin, ces instituts sappuient,
comme nous lavons vu prcdemment, sur la sensibilit du rcepteur pour tout ce
qui est nouveau et innovant .
Ltude globale du discours permet enfin danalyser les reprsentations du monde
imposes par les metteurs aux rcepteurs, et qui servent de points dancrage au
discours. En effet, Selon Bourdieu, on peut agir sur le monde social en agissant sur
la connaissance quont les agents de ce monde. Cette action vise produire et
imposer des reprsentations du monde social qui soient capables dagir sur ce

58

monde en agissant sur la reprsentation que sen font les agents
129
. Dans notre
cas, les professionnels de la fouille dopinion sappuient dabord, comme nous
lavons vu dans la premire partie de ce mmoire, sur les imaginaires de la
cyberdmocratie. Plus encore, linstitut Netscope prend comme point dancrage pour
llaboration de son argumentation lmergence dune rvolution 2.0 dont
loccurrence revient jusqu six fois sur une mme page. Mais la reprsentation
principale quil est possible de noter dans le discours est celle dun dfi relever
qui, en permettant de comprendre ce que disent vritablement les internautes ,
sera la source dune valeur nouvelle . Ainsi, pour Netscope, les pouvoirs
constitus prouvent de plus en plus de difficults matriser, rguler et saisir
la porte de lopinion. Pour Linkfluence, seules les technologies capables de
relever ce dfi resteront comptitives . Ainsi, en parvenant saisir ce qui se dit sur
Internet, il sera possible de crer de la valeur partir des nouveaux matriaux que
sont les conversations en ligne ( cest une source de valeur ajoute, un levier de
dcision stratgique , linkfluence vous aide tirer le maximum de valeur des
conversations du Web social , tirer pleinement profit de ces nouveaux matriaux
que sont les opinions circulant sur le Web 2.0 ).
Ltude du discours de ces trois instituts nous permet donc de constater que
largumentation en faveur des outils danalyse de lopinion repose uniquement sur
des logiques promotionnelles. En effet, ni les mthodologies, ni les choix effectus
pour le tri et le classement des opinions ne sont dcrits. Les pages censes indiquer
comment fonctionnent rellement leurs outils se contentent de rsumer
sommairement les trois tapes que sont le recueil, le tri et la visualisation des
donnes, mais il nest fait nulle part mention des processus de dcision utiliss pour
traiter les matriaux, alors quils configurent pourtant intrinsquement le rsultat
prsent.



129
BOURDIEU, Pierre, Ce que parler veut dire : L'conomie des changes linguistiques , Fayard,
1982, p.195

59

2. DES PROCESSUS TECHNIQUES ENFERMES DANS DES
BOITES NOIRES

Une infographie trouve sur le site de Linkfluence et intitule Notre technologie
Radarly permet de mieux comprendre la manire dont ces instituts prsentent leurs
technologies. Celle-ci est cense expliquer comment fonctionne la mthode
danalyse des opinions utilise par Linkfluence partir de son logiciel Radarly.
Linfographie en question est disponible en Annexe 2 page 109.
Limage est divise en trois parties numrotes. La premire est nomme
Identifier & capter les sources et est suivie de la mention Radarly collecte plus
de 100 millions de sources dans plus de 50 langues . Au-dessus du titre sont
dessins trois personnages qui reprsentent, selon les bulles prsentes au-dessus
de leurs ttes, Ma Marque , Mes consommateurs et Mes concurrents . On
constate encore une fois ici travers lutilisation du pronom possessif une certaine
confusion entre lmetteur et le rcepteur, visant inscrire ce dernier dans le
discours pour lui permettre de sidentifier plus facilement. Ces trois personnages sont
suspendus dans un grand nuage cens reprsenter Internet et qui voque la
thmatique du cloud cest--dire le stockage en ligne dun grand nombre de
donnes. En effet, lintrieur de celui-ci flottent un certain nombre de documents,
reprsents par des feuilles de papier, et qui sont envoys dans le nuage par les
personnages. Ces feuilles sont donc la reprsentation de toutes les traces laisses
sur Internet par les trois entits que reprsentent les individus prsents sur limage.
Sur ces feuilles, on distingue trois types de contenus diffrents. Il y a du texte brut
reprsent par lnonc Blablabla , des vidos reprsentes par un triangle dans
un rond, lments figuratifs du bouton play , et des images reprsentes par un
schma de montagne et de soleil. Lutilisation du dessin de la feuille de papier pour
reprsenter les multiples traces laisses sur Internet fait dailleurs cho aux crits
dEmmanuel Souchier pour qui le papier rpond un besoin de visualisation et de
concrtisation de l'crit cach
130
.

130
SOUCHIER, Emmanul, L'crit d'cran, pratiques d'criture & informatique , Communication et
langages N107, 1996. pp. 105-119

60

Le bras mcanique dune machine qui rcupre lune de ces feuilles de papier
pour la poser sur un tapis roulant nous amne vers la seconde partie de linfographie
nomme Qualifier et analyser et suivie du texte Radarly analyse le contenu des
conversations et leur diffusion . Ici, un second bras mcanique vient alors coller sur
la feuille de papier la provenance du matriau rcupr, matrialise par le
pictogramme de diffrents rseaux sociaux comme par exemple Facebook ou
Twitter. Cet assemblage, grce au tapis roulant, passe ensuite sous cinq portiques
diffrents nomms respectivement analyse du sentiment , termes employs ,
viralit , influence , golocalisation . Le passage par chacun de ces cinq
portiques affuble ainsi les feuilles de papier de cinq tiquettes diffrentes censes
reprsenter lanalyse qui a t faite par la machine. Ainsi, cette partie de limage
figure bien comment des processus automatiques vont se charger danalyser tous les
composants des matriaux rcolts en leur collant des tiquettes qui vont
permettre de rifier ces lments en les enfermant dans des cases prconues. Le
processus ici nest donc pas sans rappeler les grandes chanes industrielles
permettant de fabriquer grande chelle diffrents objets.
Sur cette partie de limage apparaissent deux nouveaux personnages portant une
bote outils et figurant donc des mcaniciens. Ceux-ci permettent de rassurer le
prospect : Linkfluence vous assiste pour lidentification et lajout de sources
supplmentaires et Les quipes de Linkfluence vrifient le codage pour une
information 100% pertinente . Ainsi, ces deux personnages visent rassurer le
client en lui assurant quil ne se retrouvera pas seul face au logiciel, et que
linformation retranscrite par le logiciel est reprsentative de la ralit car surveille
par des quipes humaines. Il y a donc ici un dcalage entre le tout automatique de la
machine et le personnage du mcanicien cens dtecter les failles. La
reprsentation des employs de Linkfluence sous forme de mcanicien nest
cependant pas si rassurante. Sont-ils en charge de vrifier la pertinence des
informations colles sur les matriaux linguistiques ou vrifient-ils uniquement le
bon fonctionnement des rouages de la machine ?
Enfin, larrive du tapis roulant et des feuilles de papier tiquetes vers un gros
tuyau nous amne la troisime partie de linfographie nomme Restituer et
accompagne du sous-titre Radarly propose des tableaux de bord synthtiques
permettant dagir en quelques clics . Le tuyau, de plus en plus fin figurant ainsi une

61

analyse de plus en plus prcise, mne alors un cran dordinateur sur lequel il est
possible de reconnatre un tableau de bord. Un nouveau mcanicien nous indique
Linkfluence produit des reportings quotidiens, hebdomadaires et mensuels et vous
accompagne en management du risque . Grce lcran dordinateur, nous
comprenons que le traitement automatique ralis par la machine permet de recevoir
des donnes pralablement analyses et classes quil est possible de visualiser via
une interface Web. De plus, les professionnels de lagence soccupent dtablir en
fonction du rythme souhait des rapports rcapitulatifs.
Enfin, en guise de conclusion de linfographie, est inscrite la phrase Radarly par
Linkfluence rpond lensemble de vos besoins . Ces besoins sont ensuite
matrialiss par trois nouveaux personnages qui possdent respectivement un
ordinateur, une tablette et un smartphone, et qui reprsentent les clients finaux
derrire linterface. Ces trois personnages ont eux-mmes t rangs dans trois
cases distinctes qui correspondent trois fonctions du logiciel : la veille pour
veiller sa rputation et ses concurrents , le social CRM pour optimiser sa
relation client et le community management pour comprendre ses
communauts .
Cette infographie montre bien comment, travers la mtaphore de la machine ,
les concepteurs de ces technologies qui ont pour but danalyser les traces laisses
par les utilisateurs sur le Web enferment les enjeux politiques, sociaux et
conomiques du traitement des opinions dans des boites noires qui ne permettent
pas de comprendre comment le rsultat donn a t produit, ni quels ont t les
choix raliss pour le produire. Or, ces informations ne sont pas purement
techniques, car elles influent sur la manire dont les donnes vont ensuite tre
retranscrites.
Ainsi, ces analyses conscutives de discours et de contenus nous ont permis de
constater que, malgr loffre plthorique qui commence merger face ce nouveau
type dtudes dopinions, les argumentaires commerciaux mis en place par les
instituts qui les proposent ont tendance enfermer les choix raliss a priori pour le
traitement du matriau linguistique dans des boites noires, contribuant une certaine
opacit autour des mthodes utilises pour analyser les opinions, ce qui va avoir

62

pour consquence dalimenter de nombreuses controverses propos de la lgitimit
de telles mthodes.



C. Dvoiler les ajustements techniques : un
cheminement ncessaire pour mettre fin aux
controverses

1. FORCES ET FAIBLESSES DU TRAITEMENT AUTOMATIQUE
DES LANGUES

Face lopacit des mthodes de traitement et danalyse des instituts qui
pratiquent la fouille dopinion mergent aujourdhui de nombreuses controverses. La
premire dentre-elles affirme que le langage humain est trop complexe pour tre
correctement interprt par des ordinateurs.
En effet, les problmes rencontrs les plus rcurrents concernent les subtilits du
langage qui sont intrinsquement lies lhomme, comme par exemple lutilisation
de lhumour ou de lironie. Pourtant, comme nous lavons vu prcdemment,
lutilisation de la drision est lun des leviers couramment utilis sur Internet pour
rendre virale une opinion. Ainsi, comment un ordinateur comprendrait-il le tweet
#NKM et les SDF : une femme si proche des parisiens #LOL ? On peut supposer
quune machine ne serait pas capable de comprendre le second degr li cet
nonc suite la photo polmique qui a circul sur la toile pendant la campagne
pour les lections municipales de 2014 Paris et prsentant la candidate Nathalie
Kosciusko-Morizet fumant une cigarette avec des SDF.

63

Ainsi, le langage serait un domaine si subtil quil serait intrinsquement li
lhomme et ne pourrait tre reproduit ou compris par des machines, contrairement
ce que cherche prouver le test de Turing
131
.
Pourtant, les techniques de traitement automatis du langage se dveloppent bel
et bien aujourdhui et cherchent reproduire le langage humain par approximation et
par dtour. En effet, les outils informatiques apprhendent les corpus de texte
comme des chanes de caractres. Eux-mmes fonds sur lcriture, le code
informatique, les logiciels sont ainsi capables dassimiler les lments de langages
produits sous forme de texte du code. Cette approximation est la fois la force et
la faiblesse du traitement automatique du langage, comme nous lexpliquent
Dominique Boullier et Audrey Lohard :

Cette distinction entre langage et code informatique est essentielle car elle permet de
comprendre les confusions entretenues entre les deux ordres de ralit. Cest parce que
linformatique rduit tout matriel linguistique du code quelle le rend calculable et quelle peut
par approximation, statistique ou autre, restituer une partie de lintelligibilit des expressions
recueillies. Mais cest aussi parce quelle rduit le langage du code quelle butera toujours sur
du manque--signifier puisque le langage ne fonctionne pas du tout selon les mmes
principes
132
.

En effet, le langage humain ne fonctionne pas selon une grille de composition
univoque qui permettrait au langage informatique de le comprendre de faon
irrmdiable. Le langage est par dfinition quivoque et capable dassocier sans
cesse de nouvelles combinaisons de mots pour produire un sens indit.
Il est donc effectivement possible destimer que le langage humain est trop
complexe pour tre compris par un ordinateur. Cependant, cest bien grce ce
dtour qui consiste tout rduire un mme code, que linformatique permet de
calculer par approximation des significations qui sont finalement assez pertinentes
pour un observateur humain
133
. Aussi, nous sommes bien aujourdhui face de
nouvelles puissances de calcul capables de traiter des corpus normes tirs des

131
Le test de Turing, devenue une rfrence pour les chercheurs en Intelligence Artificielle, cherche
valuer si un ordinateur peut tre capable de mener une conversation avec un humain sans quune
tierce personne ne soit capable de distinguer laquelle des deux entits est lordinateur.
132
BOULLIER, Dominique et LOHARD, Audrey, Opinion mining et Sentiment analysis : Mthodes
et outils , op. cit.
133
Ibid.

64

traces textuelles laisses sur Internet. Mais le risque, cest de faire croire que leur
puissance puise le sens et que leurs rsultats peuvent tre pris la lettre, sans
connatre les conditions de leur production et donc les ncessaires rductions qui ont
rendu le matriau linguistique calculable
134
.


2. LA DISPARITION DES CRITERES SOCIODEMOGRAPHIQUES

Selon les chiffres de lobservatoire du numrique, en 2013 14 % des particuliers
franais dclaraient navoir jamais utilis Internet
135
. Ces chiffres particulirement
loquents nous permettent de comprendre rapidement la seconde controverse qui
anime les dbats autour de lanalyse des opinions en ligne. En effet, ce type
danalyses, loin dtre reprsentatif de la population, exclut de fait toutes les
personnes qui ne sont pas prsentes sur le rseau.
Selon lIfop
136
, la mme anne, 17% des internautes franais dclaraient tre
inscrits sur le rseau social Twitter. Sachant quune inscription ne signifie pas
forcment que les usagers sont actifs, il convient de se demander comment des
initiatives comme le Twittoscope
137
de TF1 peuvent se rvler pertinentes. En
effet, loin des traditionnelles mthodes dchantillonnage ou de quotas utilises dans
les sondages, les mthodes de fouille dopinion ne permettent pas de faire
correspondre une trace laisse sur le rseau un tat civil dtermin, ce qui
permettrait de faire correspondre les profils des internautes participants des
catgories sociodmographiques reprsentatives de la population. En effet, les
tudes dopinion se prvalent toujours de leur capacit corrler tous les attributs et
opinions des personnes sondes leurs proprits sociodmographiques. Ce lien

134
Ibid.
135
OBSERVATOIRE DU NUMERIQUE, chiffres cls , mai 2014 [Disponible en ligne :
http://www.observatoire-du-numerique.fr/wp-content/uploads/2014/05/2014-05-Chiffres-cles-ON.pdf]
Consult le 15 aout 2014.
136
IFOP, Observatoire des rseaux sociaux 2013 , [Disponible en ligne :
http://www.ifop.com/media/poll/2436-1-study_file.pdf] Publi le 13 dcembre 2013, consult le 15 aout
2014.
137
TF1 NEWS, Exclusif : les rsultats du Twittoscope de mars 2012 , [Disponible en ligne :
http://lci.tf1.fr/politique/elections-presidentielles/exclusif-les-resultats-du-twittoscope-de-fevrier-2012-
7122597.html] Consult le 15 aout 2014.

65

personnel permet ensuite des agrgats qui prtendront la validit statistique par
rapport une population de rfrence
138
. Or, cela nest pas possible en ce qui
concerne les mthodes de fouille dopinion.
De plus, il est possible de se demander, lorsquil est question de lopinion
publique, quelle est la place de lInternet militant dans les messages rcuprs et
analyss. En effet, les partis politiques ont dsormais compris lintrt et limportance
du Web et nhsitent pas y diffuser largement leurs messages. Or, la rcupration
dun nombre important de messages caractre politique publis par des militants
ne saurait pour autant tre reprsentatif de lopinion publique.
Un article publi par le site Slate
139
illustre bien cette ide. Nomm Twitter :
lattaque des robots hollandistes , larticle relate comment certains militants du PS
ou de lUMP ont accept de voir leurs comptes tre utiliss par les instances du parti
pour publier des tweets officiels directement sur ces comptes personnels, permettant
ainsi de classer directement les tweets en question en top tweets .
Outre cette possible mainmise des partis politiques sur les messages publis qui
risquent donc dtre analyss comme des opinions largement diffuses alors quils
ne sont que luvre de robots, il est possible de constater une autre caractristique
propre lespace numrique que reprsente Internet, celle de la coexistence
possible de plusieurs identits pour un mme individu. En effet, les identits des
internautes sont floues et mobiles
140
. Ainsi, lun des lments qui permet de
distinguer lespace public numrique de lespace public traditionnel est la distinction
entre le corps et lidentit qui ne sont plus forcment unifis. En effet, sur Internet,
par lutilisation de pseudonymes, il est possible de changer son identit, voire den
avoir plusieurs. Une note trouve sur un article du Monde au sujet des sites Internet
anti-IVG illustre bien ce phnomne :

En crivant cet article, on pouvait s'attendre recevoir les ractions outrages des anti-
IVG. Nous avons nanmoins t surpris par la virulence et l'unanimit de ton des premiers

138
BOULLIER, Dominique et LOHARD, Audrey, Opinion mining et Sentiment analysis : Mthodes
et outils , op. cit.
139
SLATE, Twitter : lattaque des robots hollandistes [Disponible en ligne :
http://www.slate.fr/story/44349/twitter-attaque-robots-hollandistes-francois-hollande] Publi le 28
octobre 2011, consult le 15 aout 2014.
140
FLICHY, Patrice, 7. La fin du politique , op. cit.

66

commentateurs du Monde.fr sur le sujet. En y regardant de plus prs, nous avons dcouvert
que quelques abonns avaient multipli les pseudonymes pour se faire plus nombreux qu'ils
n'taient et donner cette impression. Depuis, les commentaires sont arrivs plus nombreux et
se sont rquilibrs. Un exemple de plus, en tous cas, des illusions que peuvent crer sur
Internet quelques personnes dcides influencer l'opinion
141
.


Par ces diffrents exemples, nous voyons bien que sur Internet, avec les
mthodes de fouille dopinion, il nest pas possible de reproduire la traditionnelle
reprsentativit des individus que recherchaient par principe les sondages
dopinions. Aussi, nous devons admettre ici que ce que ces mthodes permettent
dobserver nest pas tant ltat de lopinion, mais la manire dont celle-ci se diffuse et
circule travers les graphes qui composent lcosystme numrique.
Effectivement, il serait insens de rejeter ces nouvelles mthodes danalyse avant
mme que celles-ci naient eu le temps dmerger. En effet, la gigantesque masse
des donnes disponibles sur le Web que lon nomme aujourdhui Big Data
pourrait permettre danalyser et de comprendre les phnomnes qui se droulent sur
la Toile. Mais pour cela, il est ncessaire que ces mthodes, comme les sondages
avant elles, voient leurs mthodologies rvises et lgitimes. Cest pourquoi les
mthodologies dapproximation utilises par les instituts doivent tre rendues
publiques. Ainsi, en ouvrant les boites noires , les ajustements ncessaires au
traitement et analyse de lopinion en ligne pourront progressivement sajuster
jusqu ce quelles soient, linstar des sondages dopinions, juges lgitimes.

Conclusion du chapitre :
La libration de subjectivits constate sur Internet rend complexe la tche des
acteurs qui se sont donn pour objectif de sonder les opinions diffuses sur le Web.
En effet, comme nous lavons constat, les dispositifs de communication disponibles
en ligne et accessibles tous peuvent intgrer des formes dexpression
compltement htrognes qui nont pas toutes un intrt pour la formation de
lopinion publique. Ds lors, face ce nouveau partage du sensible, il convient de
sinterroger sur la manire dont il peut tre possible disoler les matriaux textuels

141
SAMUEL, Laurent Les anti-IVG pratiquent la dsinformation sur le Web , Le Monde [Disponible
en ligne : http://www.lemonde.fr/politique/article/2013/02/25/les-anti-ivg-pratiquent-la-desinformation-
sur-le-Web_1838677_823448.html] Publi le 25 fvrier 2013, Consult le 15 aout 2014.

67

pertinents. Nous avons vu que la notion de subjectivit est un lment construit
partir de diffrents indices disperss dans le texte. Nous verrons quil est donc
ncessaire, pour saisir le sens dun nonc, de prendre en compte les conditions de
son nonciation.
Face ce constat, il convient de sinterroger propos des mthodologies utilises
par les acteurs de lopinion mining pour isoler les propos pertinents. Lanalyse des
discours dploys sur les sites Internet de trois instituts nous a permis de constater
que ces mthodologies et les choix effectus pour le tri et le classement des
matriaux textuels ne sont voqus nulle part. Loin dtre transparents vis vis des
ajustements effectus qui conditionnent pourtant intrinsquement les rsultats
produits, nous avons donc constat que des logiques promotionnelles permettent
denfermer les enjeux politiques, sociaux et conomiques du traitement des opinions
dans des boites noires qui ne permettent pas de comprendre les processus
techniques utiliss, contribuant une certaine opacit autour des mthodes utilises
pour analyser les opinions.
Cette opacit autour des mthodes de traitement des matriaux collects a pour
consquence dalimenter de nombreuses controverses sur la lgitimit de la fouille
dopinion. En effet, si le langage est bel et bien un objet trop complexe pour tre
rendu aujourdhui totalement intelligible pour des machines, il nen demeure pas
moins que les approximations ralises par ces machines peuvent permettre de
traiter des corpus imposants constitus dune multitude de traces rcoltes sur le
Web. De plus, si ces traces collectes ne peuvent pas tre associes des profils
sociodmographiques imposs permettant de reproduire des critres de
reprsentativit, elles peuvent tout de mme permettre de comprendre comment les
opinions se diffusent et circulent travers les graphes qui composent lcosystme
numrique.
Ainsi, malgr les controverses, il convient de continuer amliorer ces nouvelles
mthodes danalyse de lopinion en ligne. Mais pour se crdibiliser, la mise en
visibilit des critres de slection et de traitement du matriau linguistique analyser
est une condition ncessaire. La mthodologie de la fouille dopinion doit en effet,
comme celles des sondages avant elle, faire lobjet de normes concertes et
acceptes.

68





III. Analyse et reprsentation des donnes :
transformer la fouille dopinion en enjeu de
pouvoir par la rationalisation des mthodes


Nous avons vu que labsence de transparence de la part des instituts de fouille
dopinion contribuait alimenter les controverses autour des mthodes dopinion
mining. En effet, les acteurs qui analysent les opinions qui circulent en ligne ont
tendance dissimuler, derrire des discours promotionnels, les mthodes
dapproximation qui leur permettent dexploiter les donnes collectes. Pourtant,
nous supposons que cest grce llaboration de normes communes et la mise en
visibilit des processus techniques utiliss qui conditionnent la production du sens
que lopinion mining pourra acqurir une lgitimit.
Comme nous le verrons dans un premier temps, lune des contraintes quil faut
dsormais dpasser afin de produire du sens partir des matriaux textuels
collects sur le Web est la prise en compte du contexte de production des donnes
collectes. Celui-ci comprend, comme nous lavons vu prcdemment, le contexte
nonciatif, mais galement les processus de mdiations qui rgissent la production
de contenu sur Internet. A partir de ces considrations, nous nous demanderons
quels sont les critres qui doivent tre rendus visibles pour permettre aux mthodes
de fouille dopinion de se soumettre des exigences de contrle des interprtations
produites et de lgitimer ces mthodes.
Le deuxime aspect auquel nous devons nous intresser dans cette troisime
partie concerne la modlisation de lopinion. Nous verrons alors quil est possible

69

dadresser une critique commune aux mthodes dopinion mining et aux sondages.
En effet, par sa matrialisation, lopinion publique se voit enferme dans des cases
qui la rigidifie, la globalise et lhomognise. Si cette critique peut difficilement tre
dpasse, il conviendra de sinterroger propos de la manire dont il peut tre
possible de reflter le sens rel des opinions partir des lments de langage
rcolts. Ainsi, nous chercherons comprendre comment il est possible de
synthtiser les rsultats sans craser toute leur diversit.
Enfin, nous nous demanderons dans une dernire partie comment la
matrialisation de lopinion effectue partir des matriaux rcolts en ligne pourrait
reconfigurer les rapports de pouvoir. En effet, nous pouvons nous demander si le
Web peut tre considr comme un laboratoire dans lequel il est possible dobserver
les opinions mergentes. Cette rflexion nous permettra de nous demander
comment ces mthodes pourraient, terme, devenir utiles aux institutions
dmocratiques et aux politiques, et donc se transformer en enjeux de pouvoir.



A. Interprtation des noncs : limportance des
mdiations techniques et du contexte dnonciation

1. LENONCIATION EDITORIALE, UN ELEMENT INDISSOCIABLE
DE SES MEDIATIONS TECHNIQUES

En tudiant les reprsentations du monde vhicules par les discours des instituts
de fouille dopinion, nous avons pu constater que la rfrence aux imaginaires de la
cyberdmocratie leur permet davancer lide que lopinion sexprime
spontanment
142
sur Internet. Ainsi, derrire cette notion de spontanit se cache

142
Observer lopinion dans son mouvement spontan sur Internet , Prendre du recul sur les
conversations spontanes du Web social , dcrypter lopinion qui se forme et sexprime

70

lide quaucun processus de mdiation ne cadrerait lexpression des opinions sur le
Web, que les conversations qui se droulent sur Internet seraient aussi naturelles et
dsintermdies que celles qui ont lieu hors ligne.
Toutefois, ces reprsentations, en prsupposant une relation directe entre
sujets via un rseau, [] omettent que toute relation entre sujets usagers des
mdias informatiss est mdiatise par la relation qu'ils entretiennent aux dispositifs,
aux formes textuelles, et par l mme aux acteurs qui sont en position de configurer
ces objets et ces formes
143
. Yves Jeanneret et Emmanuel Souchier dfinissent
lnonciation ditoriale comme l'ensemble de ce qui contribue la production
matrielle des formes qui donnent au texte sa consistance
144
. Il sagit donc des
mdiations matrielles qui structurent le texte, lui permettent davoir une visibilit et
dexister. Cest donc larchitexte, entendu comme les conditions crites qui vont rgir
la mise en forme des expressions crites, ou pour le dire autrement lcriture des
conditions dcriture, qui va agir sur les conditions de lexpression. Ainsi, le mdia
de l'criture n'est pas seulement le lieu de passage d'un flot informationnel ; c'est un
objet matriel configur qui cadre, inscrit, situe et, par- l mme, donne un statut au
texte
145
.
En ce sens nous pouvons affirmer que la nature mdiatique des rseaux sociaux
formate les noncs qui y sont exprims. Par leur configuration, ils imposent aux
membres qui y sont inscrits des systmes dcriture qui vont formater les processus
de sens. Ainsi, la force des rseaux sociaux vient du fait quils russissent donner
lillusion de limmdiatet et de la transparence grce aux processus de mdiatisation
mis en place. Lutilisateur a ainsi limpression dtre en contact direct avec dautres
individus. Pourtant, ce que donnent voir ces outils, ce nest pas la personne, mais
uniquement ses productions mdiatiques
146
. De plus, outre cette capacit donner
lillusion de la conversation directe, larchitexte du rseau contraint fortement les
expressions. Sur le rseau Twitter, un nonc se limite par exemple 140 caractres

spontanment sur le Web social Propos recueillis sur les sites de trois instituts dtudes, voir
Annexe 1 p 103.
143
JEANNERET, Yves et SOUCHIER, Emmanul, L'nonciation ditoriale dans les crits d'cran ,
Communication et langages N145, 2005. pp. 3-15.
144
Ibid.
145
Ibid.
146
GKOUSKOU-GIANNAKOU, Pergia, Smiotique de mdias informatiss , cours dispens au
CELSA, cole des hautes tudes en science de linformation et de la communication dans le cadre du
master 2 Mdias Informatiss et Stratgies de Communication (MISC) le 18 octobre 2013.

71

ce qui oblige les utilisateurs sexprimer de faon concise. Pour permettre aux
utilisateurs de dpasser cette exigence, ce sont dvelopps des codes propres au
rseau social, comme par exemple les hashtags . Ainsi, signals par le caractre
# , les hashtags sont des mots cls balise qui permettent de rsumer lobjet du
tweet.
Nous le voyons bien ici, considrer que les opinions puissent sexprimer
spontanment sur le rseau social Twitter nest thoriquement pas acceptable.
En effet, le cadre smiotique du rseau contraint tellement fortement lexpression
quil impose ncessairement au scripteur un processus rflexif fort dans la
construction de son nonc. Aussi, lidentification des spcificits de lnonciation
propres chaque mdia source utilis pour lopinion mining est un lment essentiel.
Il convient en effet dtre familier des codes qui rgissent lcriture des opinions afin
de pouvoir les intgrer lanalyse. Pour reprendre lexemple de Twitter, il conviendra
donc lanalyste didentifier les hashtags utiliss pour parler du sujet analys.
De plus, lidentification des conditions de lnonciation permet de se questionner
quant la compatibilit des sources. En effet, faut-il accorder la mme importance
un tweet de 140 caractres qu un post sur un forum longuement argument ? Sil
pourrait tre tentant de rpondre cette question par la ngative, gageons toutefois
quun mlange des sources peut garantir une meilleure reprsentativit des opinions
en vitant de focaliser lanalyse sur un mdia o une partie prenante pourrait tre
majoritaire.
Toutefois, si un tweet contraint lexpression dune opinion en un maximum de 140
caractres, il ne faudrait pas oublier quInternet est un espace stratifi fait de signes
passeurs, les liens hypertextes, qui font la liaison entre le texte et larchitexte
147
. Le
texte nest donc pas lisse mais fait de couches qui se superposent et renvoient les
unes vers les autres. Sur le rseau, il nest pas rare dutiliser les liens hypertexte
pour renvoyer vers une ide, une opinion, ce qui peut permettre de contourner les
limites imposes par larchitexte dun mdia. Cest pourquoi, dans ce cas de figure, il

147
DAVALLON Jean et JEANNERET Yves, La fausse vidence du lien hypertexte ,
Communication et langages N140, 2004. pp. 43-54. [Disponible en ligne :
http://www.persee.fr/Web/revues/home/prescript/article/colan_0336-1500_2004_num_140_1_3266]
Consult le 18 aout 2014.

72

sera tout autant ncessaire danalyser le contenu du message initial que le contenu
de la page dsigne par le lien hypertexte pour saisir toute la subtilit de lopinion.
Ainsi, les discours autour des bouleversements gnrs par le Web social et la
Rvolution 2.0 , obnubils par les notions de viralit et de spontanit, oublient de
prendre en compte les mdiations ditoriales pourtant trs contraignantes opres
par les interfaces Web. Pourtant, cest en prenant en compte ce cadre
dinterprtation, ainsi que les lments qui permettent de comprendre le contexte
nonciatif des messages, que les mthodes de fouille dopinion seront capables de
crer les conditions ncessaires la production de sens de manire plus fine.


2. LA NECESSAIRE ELABORATION DE NOUVEAUX CRITERES
DINTERPRETATION

Outre les processus de mdiation prsents sur Internet et qui rgissent limage
des textes produits, la prise en compte du contexte nonciatif est galement un
lment essentiel pour comprendre le sens des opinions mises sur Internet.
Comme nous lvoquions prcdemment, la subjectivit des messages, caractre
indissociable de la notion dopinion, se construit travers la multitude dindices
ports par lnonc, lnonciateur et les conditions de lnonciation. Aussi, la validit
des analyses est soumise des exigences dinterprtation qui doivent prendre en
compte le texte dans son ensemble et en le situant dans son corpus de
provenance
148
car le risque, si lon considre lopinion indpendamment de lobjet
sur lequel elle porte, de lmetteur et du contexte, est de passer ct du sens rel
du message.
Certains acteurs de la fouille dopinion mettent lhypothse quil pourrait tre
possible de dterminer de faon automatise la position de lmetteur dun nonc

148
EENSOO-RAMDANI, Egle, BOURION, Evelyne, SLODZIAN, Monique, VALETTE, Mathieu De la
fouille de donnes la fabrique de l'opinion. Enjeux pistmologiques et propositions , op. cit

73

propos dun sujet. En effet, comme nous lavions vu dans la partie prcdente
149
,
lopinion exprime la reprsentation dun monde tel quil apparat une personne
donne un moment donn. Pour accder cette reprsentation, il pourrait tre
possible de typer le rseau co-occurrentiel dun mot-ple. Lidentification de ces
variations permet[trait] de dterminer non pas lopinion ngative ou positive dun
metteur relativement au mot-ple mais lopinion gnrale qui est la sienne sur une
problmatique donne
150
:

Considrons lexemple dtranger dans le corpus raciste/antiraciste dj voqu. Ses
mesures de rappel antiraciste et raciste y sont relativement similaires de telle sorte que la seule
prsence du mot tranger ne suffit pas dterminer si un texte est raciste ou non []. Mais un
test dcart rduit permet disoler les spcificits positives des contextes dactualisation du mot-
ple dont on conserve les plus discriminantes. Il montre que, parmi les cooccurrents les plus
saillants dtranger dans le sous-corpus raciste, on trouve par exemple illgalit, naturalisation,
dlinquants tandis que dans le sous-corpus antiraciste, on peut identifier rgularisation,
emplois, droit. Ces items constituent des reprsentations subjectives du concept tranger qui ne
sont pas elles-mmes polarises mais qui permettent dattribuer une valeur raciste ou
antiraciste au texte
151
.

En complment, la notion de polyphonie nous permet de comprendre pourquoi il
convient de considrer lincidence de lnonciateur et du contexte dnonciation sur
le message
152
. En effet, un mme nonc peut vhiculer plusieurs points de vue car
chaque discours sinscrit dans une interaction, explicite ou implicite, avec dautres
discours
153
. Ainsi, aucun discours ne surgit ou ne se produit sans tre mis dans
un contexte, que ce contexte soit dj produit, en cours de construction ou
imaginaire
154
. On comprend donc aisment, lorsquil sagit de dtecter lopinion, en
quoi cette notion peut poser problme. Si plusieurs points de vue peuvent sexprimer
dans un mme discours, comme par exemple pour nuancer un propos, il nest alors
pas possible danalyser les noncs selon une approche sac de mots o un
texte nest quun ensemble de mots ayant tous la mme valeur caractrisante quels

149
Se reporter au II.A.2 Lopinion, un objet ncessairement impalpable ? p.50
150
EENSOO-RAMDANI, Egle, BOURION, Evelyne, SLODZIAN, Monique, VALETTE, Mathieu De la
fouille de donnes la fabrique de l'opinion. Enjeux pistmologiques et propositions , op. cit
151
Ibid.
152
Ibid.
153
ANSCOMBRE, Jean-Claude et al, La polyphonie linguistique , Langue franaise 4/ 2009 (n
164), p. 3-9 [Disponible en ligne : www.cairn.info/revue-langue-francaise-2009-4-page-
3.htm]. Consult le 18 aout 2014.
154
Ibid.

74

quils soient
155
. Nanmoins, le fait mme quun nonc soit polyphonique donne
des informations sur le discours :

Diffrentes tudes tendent montrer que les marqueurs de polyphonie tels que certains
connecteurs argumentatifs dopposition (cependant, toutefois, mais, etc.) sont surreprsents
dans les textes polmiques ou ceux qui soutiennent une position sujette polmique. []Il ne
sagit pas ici dallouer une valeur smantique particulire ces diffrents segments, mais de
prendre en compte le double positionnement de lmetteur qui nous renseigne sur les modalits
de production du texte. Lmetteur, en laborant son texte, choisit, consciemment ou non, un
ensemble de contraintes de production destines donner au lecteur un cadre dinterprtation.
[]Lensemble des contraintes rgissant la production et linterprtation dun texte constitue ce
que lon appelle un genre textuel, tel quil a t thoris par (Rastier, 2001) notamment
156
.

Ainsi, lhypothse mise ici part de lide quun ensemble de traits linguistiques
peuvent tre caractristiques dun genre textuel donn, et quune classification de
ces traits permettrait de diffrencier de manire plus fine diffrentes familles de
textes au sein dun mme genre textuel
157
:

Par exemple, D. Malrieu et F. Rastier (2001) traitent un corpus de 2541 ouvrages couvrant
quatre discours (littraire, scientifique, juridique, essayiste) et dix-sept genres. Ils utilisent 25
variables allant du niveau le plus global (le texte ou le paragraphe) jusquau niveau le plus fin
(temps et personnes des verbes, types dadjectifs et mme usage de la ponctuation) et font
merger, grce une analyse statistique multivarie, diffrents facteurs caractristiques du
genre textuel narratif : poids des pronoms personnels, de la premire personne du singulier ou
du prsent par exemple
158
.

Nous le voyons bien ici, la seule tude du champ lexical des noncs compris
comme une simple liste de mots agence par des rgles grammaticales nest pas
acceptable. Lopinion, caractrise par la subjectivit qui se construit partir
dindices dissmins dans le texte, doit pour pouvoir tre interprte prendre en
compte un certain nombre de paramtres. Nous avons vu ici que la prise en compte
de lmetteur et du genre du discours sont des critres qui permettront lanalyste

155
EENSOO-RAMDANI, Egle, BOURION, Evelyne, SLODZIAN, Monique, VALETTE, Mathieu De la
fouille de donnes la fabrique de l'opinion. Enjeux pistmologiques et propositions , op. cit
156
Ibid.
157
POIBEAU, Thierry, Traitement automatique du contenu textuel , Lavoisier, [Disponible en ligne :
http://books.google.fr/books?id=1owHudO-riwC&dq=rastier+genre+textuel&hl=fr] Consult le 18 aout
2014.
158
Ibid.

75

dtayer son interprtation pour se rapprocher dune relative objectivit. Les
productions textuelles doivent donc tre considres comme des objets culturels,
mis par des acteurs prcis, historiquement et spatialement situs et qui mettent en
mots leur doxa, au sein de champs de pratiques
159
. Ainsi, lmetteur et le genre
sont ici compris comme des objets smiotiques construits dont les caractristiques
peuvent tre analyses travers diffrents marqueurs linguistiques dissmins dans
lnonc. Leur prise en compte devrait ainsi permettre de dtecter de manire plus
fine les opinions mises dans les noncs analyss
160
.
Toutefois, de telles procdures statistiques, si elles peuvent permettre danalyser
plus finement des corpus de textes en les replaant dans leur contexte dnonciation,
ne doivent cependant pas reproduire les travers actuels de lanalyse dopinion. Cest
pourquoi les lments utiliss pour la classification automatique de la position dun
auteur vis--vis dun sujet, ainsi que les critres de classification par genre textuel
devront tre rendus publics de manire se soumettre des exigences de
vrifiabilit des interprtations ralises. Cette relative transparence devrait ainsi
permettre, terme, de perfectionner les mthodes danalyse partir de nouveaux
critres dinterprtation, qui devront se construire par discussion et par dbats entre
les diffrents acteurs du domaine, et qui contribueront lgitimer ces tudes.







159
Ibid.
160
EENSOO-RAMDANI, Egle, BOURION, Evelyne, SLODZIAN, Monique, VALETTE, Mathieu De la
fouille de donnes la fabrique de l'opinion. Enjeux pistmologiques et propositions , op. cit


76

B. Reprsentation des opinions : la recherche des
ajustements qui permettront dillustrer les
diffrentes forces en prsence

1. LOPINION PUBLIQUE, UNE SIMPLE ADDITION DES
OPINIONS INDIVIDUELLES ?

Si llaboration de critres dinterprtation communs et transparents permettant de
prendre en considration les mdiations techniques ainsi que le contexte
dnonciation des opinions collectes en ligne est ncessaire, il est galement
essentiel de se questionner propos des modles de reprsentation de lopinion
publique. En effet, il convient de sinterroger propos de la manire dont il peut tre
possible de construire du sens partir des lments de langage rcolts de faon
exprimer toute leur diversit.
Sur ce point, lexpression mme dopinion publique peut poser question. En
effet, si lon se penche de plus prs sur la composition smantique de ce concept, on
observe une tension entre, dun ct, lopinion qui comme nous lavons vu peut
tre dfinie comme lexpression dune subjectivit individuelle, et de lautre le terme
public qui renvoi la recherche de lintrt gnral
161
, ce qui est considr
comme pertinent pour tre rendu visible au sens o lentendaient les gate-
keepers .
Ainsi, la figure de loxymore permet de comprendre les difficults rencontres
lorsquil est question de reprsenter lopinion publique. Sagit-il uniquement dun
processus quantitatif produit partir de lagrgation dopinions similaires, cest--dire
partir de la somme des individualits ? Cette posture, qui est celle adopte
aujourdhui par les sondages, tend imposer comme objective une reprsentation de
lopinion publique exprime en pourcentage. Cest alors la logique politique du
rfrendum qui est imite chelle rduite, sur un chantillon de population. Cette
reprsentation de lopinion publique se heurte ainsi la reprsentation

161
KAUFMANN, Laurence, L'opinion publique : oxymoron ou pleonasme ? , op. cit.

77

habermassienne de lespace public o seules les opinions juges lgitimes
pouvaient sexprimer.
Pierre Bourdieu
162
, propos des sondages, critique lutilisation de la notion
dopinion publique, arguant que cette pratique repose sur lhypothse fausse selon
laquelle les personnes interroges ont forcment une opinion sur la question qui leur
est pose. Ainsi, on prsuppose que le problme pos certaines personnes sur un
sujet est un problme pour eux, et quils se sont dj pos la question
pralablement. Or, lauteur prtend que les rpondants ne se sont la plupart du
temps jamais formul eux-mmes la question, et que, loin de rvler un tat
prexistant, lopinion rvle par les sondages est lobjet dune construction
technique induite par la mthode.
Nous voyons bien ici comment les mthodes de fouille dopinion peuvent
sappuyer sur ce premier point pour justifier leur lgitimit vis--vis des sondages. En
effet, sur le Web, les opinions rcoltes nont pas t dclenches par une question
prcise. Chaque opinion individuelle na donc pas t construite par un sondeur qui
aurait pos une question lnonciateur. Toutefois, les mthodes de fouille dopinion
devront faire attention ne pas reproduire ce travers en choisissant des thmatiques
ou des mots cls trop circonscrits qui pourraient eux-mmes engendrer de nouveaux
biais. De plus, comme nous lavons vu prcdemment, il ne faudra pas oublier de
prendre en compte le contexte dnonciation et les mcanismes induits par les
mdiations techniques pour comprendre comment une opinion a pu se constituer et
en tirer du sens.
Le second postulat sur lequel reposent les techniques de sondage que critique
lauteur est lide selon laquelle toutes les opinions se valent. En effet, pour
Bourdieu, les sondages vont additionner des opinions qui nont pas toutes la mme
force sociale, et qui de ce point de vue ne sont pas gales. Ainsi, pour lauteur,
lopinion peu rflchie mise par un individu isol et potentiellement choisie par
hasard ne peut tre considre comme quivalent celle, rflchie, mise par un
individu inform possdant des comptences sur le sujet voqu et capable de se

162
BOURDIEU, Pierre, Lopinion publique nexiste pas , expos fait Noroit (Arras) en janvier 1972
et paru dans Les temps modernes , 318, janvier 1973, pp. 1292-1309. Repris in Questions de
sociologie, Paris, Les ditions de Minuit, 1984, pp. 222-235. [Disponible en ligne : http://www.homme-
moderne.org/societe/socio/bourdieu/questions/opinionpub.html] Consult le 18 aout 2014.

78

rfrer un groupe social organis pour la faire triompher. De ce fait, les sondages
dopinion seraient une illusion car, loin de tmoigner des forces en prsence dans les
conflits dopinions, des rapports qui soprent entre des groupes constitus, ils
tenteraient dimposer l'ide qu'il existe quelque chose qui serait comme la moyenne
des opinions ou l'opinion moyenne
163
. Ainsi, pour lauteur, l' opinion publique
qui est manifeste dans les premires pages de journaux sous la forme de
pourcentages (60 % des Franais sont favorables ...), cette opinion publique est
un artefact pur et simple dont la fonction est de dissimuler que l'tat de l'opinion un
moment donn du temps est un systme de forces, de tensions et quil nest rien de
plus inadquat pour reprsenter l'tat de l'opinion qu'un pourcentage
164
.
Les mthodes de fouille dopinion vont galement avoir tendance additionner
sans plus de prcision toutes les opinions exprimes sur Internet. Toutefois, nous
lavons vu, tout le monde nest pas capable de diffuser ses opinions dans la sphre
sociale de la mme manire. La diffusion dune ide sur Internet requiert en effet des
comptences, et la comprhension des codes de communication du rseau. Ainsi, ce
que vont pouvoir chercher reprsenter ces nouveaux procds nest pas ltat de
lopinion un moment donn, mais, comme nous lavons vu, la manire dont celle-ci
se diffuse et circule travers les graphes qui composent lcosystme numrique.
Enfin, le troisime postulat dnonc par Pierre Bourdieu est fond sur lide selon
laquelle les questions qui mritent dtre poses font lobjet dun accord gnral de la
part des institutions politiques et mdiatiques dans le sens o celles-ci sont utilitaires,
cest--dire quelles vont correspondre leurs proccupations immdiates. Ainsi, les
enqutes dopinions imposeraient un questionnement jug lgitime car rpondant au
seul intrt des acteurs qui les posent un moment dtermin. Cette problmatique
rejoint la thmatique de lagenda-setting souleve dans la premire partie de ce
mmoire.
A ce sujet, nous avons vu quInternet pouvait permettre aux citoyens de se
dbarrasser du paternalisme mdiatique en accordant un intrt des sujets qui
navaient pas t jugs pertinents par les mdias traditionnels. Les mthodes
dopinion mining pourraient donc tre mme, en se focalisant sur les matriaux

163
Ibid.
164
Ibid.

79

collects en ligne, de faire merger des problmatiques qui nont pas encore perc
dans lespace mdiatique traditionnel. Pour se diffrencier des sondages, les acteurs
de la fouille dopinion devront donc tre en mesure de dtecter les signaux faibles qui
leur permettront de voir merger de nouveaux mouvements dopinion. Sinon, ils ne
feront que reproduire les travers des sondages qui ninterrogent que les
problmatiques juges utiles politiquement et mdiatiquement, et qui par l mme
ont tendance focaliser lopinion sur les sujets quils ont eux-mmes choisi,
enfermant lopinion publique dans des cases prdfinies.
Ainsi, comme nous lavons dj exprim, lopinion capte par les mthodes de
fouille dopinion ne peut tre dmocratique car tous les citoyens ne sont pas
capables de se faire entendre sur Internet de la mme manire, avec la mme
porte. Elle nest pas reprsentative car les opinions collectes ne peuvent tre
rapportes des individus socialement identifis. Ce quelle permet cependant de
montrer, cest la manire dont des groupes sociaux constitus vont parvenir
diffuser leur opinion, la rendre triviale, de manire rendre visibles leurs ides. En
ce sens, les acteurs de la fouille dopinion devront tre mme de matrialiser
lopinion de faon exprimer la fois sa diversit, ses mouvements, et permettre de
la visualiser la fois localement et globalement.



2. LOPINION, UN OBJET SANS CESSE AJUSTE AU CONTEXTE
SOCIAL DANS LEQUEL ELLE SEXPRIME

Nous avons vu que les mthodes de fouille dopinion pouvaient permettre dviter
le biais traditionnellement reproch aux sondages dopinions qui consiste
construire lopinion en tant quobjet par le fait mme de poser une question des
personnes qui ne se la seraient pas pose spontanment, ou en induisant une
rponse via la formulation de la question.
Il convient toutefois de se demander si lopinion peut tre considre comme plus
vraie lorsquelle sexprime sur Internet sans mdiation autre que technique, que

80

lorsquelle est provoque par question ou lorsquelle sexprime de manire prive
dans les urnes.
Nous avons mis en vidence dans la deuxime partie du prsent mmoire que, de
par leur nature fondamentalement interactive, les productions ditoriales publies sur
Internet sont largement influences par le public auxquelles elles sadressent, ce qui
a donc un effet sur leur construction. Cest pourquoi lopinion, comme les autres
formes dexpressions sur Internet, est toujours construite en fonction du public
rcepteur.
Ainsi, lopinion est une attitude qui relve du domaine communicationnel
puisquelle va ncessairement sexprimer par lacte langagier et sadresser des
interlocuteurs qui elle va par la suite tre soumise. En consquence, lopinion
nest un tat mental que de manire drive, car elle est oriente normativement
par des prtentions un commun accord et comprend comme proprit constitutive
la procdure de monte en gnralit qui la rend apte tre publicise et
reconnue par autrui
165
. Lopinion exprime doit donc satisfaire, sous peine dtre
rejete, des critres dacceptabilit et de recevabilit dtermins par le public vis--
vis duquel elle sexprime.
Ainsi, une personne sexprimant au sein dune communaut identifie laquelle
elle se rfre aura tendance sajuster au point de vue gnral de ladite
communaut. Par cette mdiation rflexive, lopinion mise sera ainsi justifiable et
valide. En ce sens, elle copie ou anticipe le comportement majoritaire en saidant
de lorthodoxie culturelle ou, comme le dit Livet, du paysage interprtatif que
lindividu croit ou prsume partag
166
. Ainsi, il peut exister une tension entre
lopinion relle du sujet et celle exprime qui doit sadapter pour pouvoir tre
juge valide par la communaut au sein de laquelle elle sexprime.
Ce travail dajustement a dailleurs dj largement t constat par les sondages
qui ont mis en place ce que lon nomme le redressement des rsultats bruts . En
effet, les Instituts ont remarqu que certaines positions politiques taient parfois
sous-reprsentes, comme par exemple dans le cas des votes Front-National, o les

165
KAUFMANN, Laurence, L'opinion publique : oxymoron ou pleonasme ? , op. cit.
166
Ibid.

81

personnes interroges peuvent se montrer rticentes indiquer quelles votent pour
ce type de formation politique.
Nous pouvons ainsi estimer que sur Internet comme ailleurs, les opinions
exprimes ne sont pas toujours celles qui se traduisent par la suite dans les urnes.
Cest pourquoi, comme pour les sondages, des mthodes dajustement, qui devront
bien videmment tre transparentes et discutes pour gagner en lgitimit, devront
tre labores afin dtre mme de comprendre la manire dont se diffusent les
opinions. En effet, cest grce cette cette modlisation fine que les mthodes de
fouille dopinion pourront se transformer en rels enjeux de pouvoir.



C. Mise en forme du Web : un nouvel enjeu de
pouvoir ?

1. CARTOGRAPHIES DU WEB, DES OBJETS
COMMUNICATIONNELS CREATEURS DE SENS

Si, comme nous lavons vu, la reprsentation sous forme de pourcentage ne peut
permettre de reprsenter les mouvements dopinion qui ont lieu sur le Web, se pose
alors la question de la reprsentation des donnes collectes et traites. En effet,
pour permettre de crer de la valeur, les donnes rcoltes se doivent dtre mises
en forme. Emergent alors de nouveaux modes de reprsentation du Web, inspirs
des formes anciennes du papier et de lcrit, dont lobjectif est de crer du sens
partir des matriaux disparates que reprsentent les donnes.
Lun des modles de reprsentation des donnes le plus couramment utilis est la
cartographie. En effet, la carte est une reprsentation possible dun territoire, ce qui
permet par mtaphore dancrer les donnes issues du Web dans le monde physique.
Ce type dcriture permet ainsi de rendre visible ce qui ne ltait pas auparavant, de

82

donner naissance la reprsentation. Tout dabord reprsentation du monde par le
biais de mesures gographiques, la carte permet aussi, par reprsentation
iconographique de donner du sens ce que lesprit peine matrialiser. Ainsi, par
son usage, la carte peut tre dfinie comme outil de conceptualisation
167
.
Ainsi, les cartographies du Web sont des dispositifs graphiques qui transforment
les lments traditionnels de la carte pour servir de nouveaux objets. La carte se
transforme alors en une nouvelle expression du monde des ides. Elle devient un
mdia, un objet communicationnel. Pour cela, elle ractive certaines conventions qui
lui permettent de sinscrire dans la tradition de la cartographie gographique.
En effet, comme il est possible de le constater sur la figure 1 disponible ci-aprs
cense reprsenter le web politique franais en dcembre 2012, apparaissent
certaines similitudes entre les cartes gographiques et les cartographies du Web.
Tout dabord, la carte est contenue dans un cadre qui permet de dlimiter lespace
de la reprsentation en lui donnant une matrialit. Une lgende permet dexpliciter
les donnes qui y sont reprsentes. Enfin, un cadre permettant de situer les
lments consults au sein de la reprsentation globale fait rfrence la
traditionnelle chelle cartographique. Tous ces lments, en faisant rfrence aux
processus de reprsentation gographiques permettent de donner une cohrence
lensemble et de faciliter la lecture en faisant appel des rfrences connues du
consultant.
La carte, par sa capacit dire quelque chose du monde et linfluencer en le
matrialisant, est donc un objet intrinsquement signifiant. Elle permet en effet
dapporter du sens des ralits qui nen ont pas en dehors delle, comme lexplique
Emmanuel Souchier :

Sur Internet, le cartographe produit des artefacts visuels la croise de linformatique et
du design graphique, il observe des correspondances lcran, les trie et les hirarchise. Il finit
par tablir des relations entre les lments quil observe et produit. Et il ralise tout cela par le
truchement doutils logico-statistiques qui crent les signes-mmes quil va ensuite observer. Il
sagit bien ici de donner corps un monde invisible, de lui donner forme . Lacte est
dmiurgique, il fait apparatre ; cest un acte de pouvoir, il donne voir et rgule la signification.

167
BIGOT, Jean-Edouard, Enjeux et techniques des reprsentations cartographiques du web ,
cours dispens au CELSA, cole des hautes tudes en science de linformation et de la
communication dans le cadre du master 2 Mdias Informatiss et Stratgies de Communication
(MISC) le 29 novembre 2013

83

Or ce corps sinscrit incidemment dans un territoire , terme qui permet de lgitimer la
mtaphore gographique de la cartographie tout en humanisant au passage le monde
numrique travers lexpression territoires numriques
168
.

Ainsi, les cartographies du web sont des mdiations crites qui permettent de
comprendre le monde grce des reprsentations qui vont le rendre intelligible.
Cette matrialit, en permettant de donner au web une reprsentation spatiale, rend
possible la visualisation de la circulation des opinions. De plus, la fonction du
zoom permet lutilisateur daccder des donnes la fois locales et globales.
Ainsi, diffrentes formes de reprsentation cartographiques sont aujourdhui
prsentes par les acteurs de la fouille dopinion, et permettent de contextualiser les
donnes collectes. Comme il est possible de le constater sur la Figure 2 Nos
mthodes : tape 3, visualisation des rsultats qui prsente les mthodes de
visualisation des opinions utilises par lInstitut Scan-Research, par ce type
dcriture, il est possible de reprsenter limportance de thmatiques dtermines au
sein des conversations, les relations entre les acteurs de cette discussion, ou bien
encore la frquence des associations entre les diffrents thmes dune mme
conversation.
Aussi, nous avons vu ici que les dispositifs cartographiques permettaient de
modliser le territoire flou que reprsente le web en contextualisant les donnes. La
matrise de la cartographie du Web permet ainsi de donner limpression de matriser
le Web et ce qui sy passe. Ainsi, ces objets, par leur capacit imposer un monde
social, peuvent avoir une forte porte politique en se prsentant comme instruments
de comprhension et de rvlation des opinions sur Internet.





168
SOUCHIER, Emmanuel, Voir le Web et deviner le monde. La cartographie au risque de
lhistoire de lcriture , in Traces numriques: de la production l'interprtation , CNRS
ditions, 2013, p.231-229.


84

























Figure 1 : LINKFLUENCE, la blogosphre politique franaise (dcembre 2012) [Disponible en ligne :
http://www.lemonde.fr/politique/visuel_interactif/2012/12/26/carte-de-la-blogosphere-politique-
2013_1809704_823448.html] Consult le 19 aout 2014.


Figure 2 : SCAN RESEARCH, Nos mthodes : tape 3,
Visualisation des rsultats [Disponible en ligne :
http://www.scan-research.com/index-3.html] Consult le 19
aout 2014.


85

2. LE WEB, UN NOUVEAU LABORATOIRE POLITIQUE ?

Le quatrime type de reprsentation prsent sur la figure 2 Nos mthodes :
tape 3, Visualisation des rsultats visible ci-dessus permet de visualiser lvolution
de la frquence des thmes utiliss dans une conversation sur une priode donne
en utilisant la reprsentation graphique. Ainsi, en faisant appel des reprsentations
scientifiques, la mise en ordre smiologique [] repose sur un exercice de
traduction des proprits statistiques et mathmatiques du jeu de donnes
(notamment des structures de graphes) en figures visuelles et, pour lensemble du
corpus, en une organisation topologique signifiante
169
. Par ce type de
reprsentation, les acteurs de la fouille dopinion cherchent crdibiliser leurs
discours en imposant une modlisation signifiante des rsultats faisant rfrence aux
sciences exactes.
Ainsi, la visualisation statistique sous forme graphique ou cartographique qui
permet lutilisateur daccder une reprsentation des phnomnes la fois au
niveau local et au niveau global le transpose dans une situation de puissance o il a
limpression de disposer dune vision de lensemble des vnements qui se
produisent
170
.
Limaginaire de la puissance de la statistique nest pas nouveau. En effet, ds le
XVIme sicle, les discours des auteurs dits monarchomaques []
proposaient une nouvelle vision du gouvernement du prince. La souverainet quils
proposent ne tiendrait pas uniquement au monopole de la contrainte physique
lgitime , attribut courant du pouvoir. Le prince, avec la statistique, doit disposer
doutils proposant un point de vue dynamique dans lequel le dtail singulier et le
global doivent tre saisis dun seul et mme mouvement afin que le plus grand
empire puisse tre gr comme la plus petite des maisons
171
. Ainsi, la statistique

169
SOUCHIER, Emmanuel, Voir le Web et deviner le monde. La cartographie au risque de
lhistoire de lcriture , op. cit.
170
GOETA, Samuel, Open-Data : quouvre-t-on avec les donnes publiques ? , Mmoire de
recherche en master 2, CELSA, Ecole des hautes tudes en sciences de linformation et de la
communication, 2012.
171
BERNS, Thomas, Gouverner sans gouverner : Une archologie politique de la statistique, 1re
d.,Presses Universitaires de France - PUF, 2009 in GOETA, Samuel, Open-Data : quouvre-t-on
avec les donnes publiques ? , Mmoire de recherche en master 2, CELSA, Ecole des hautes
tudes en sciences de linformation et de la communication, 2012.

86

se prsente comme un instrument de puissance faisant rfrence au savoir divin
par sa capacit saisir dun seul mouvement le tout et le dtail et ouvrir ainsi sur
la perspective dune maitrise absolue
172
.
Aussi, la statistique, comme les sondages, offre aux gouvernants la possibilit
dassouvir une obsession de la quantification qui leur permet de se donner une force
et de se voir agir par la mise en forme du monde. Dans ce contexte, il est possible de
se demander si le Web, travers les mthodes de fouille dopinion, pourrait tre
considr par les politiques et les institutions dmocratiques comme un laboratoire
dans lequel il serait possible dobserver les opinions mergentes, les thmatiques
montantes de faon pouvoir se prparer de manire anticipe leur arrive sur la
scne politique. Il pourrait galement tre possible de voir si les discours et les
opinions exprims par certaines personnalits politiques sont adopts et circulent
largement, ce qui reviendrait pouvoir tester la popularit de certaines mesures,
ainsi que la pertinence des argumentaires politiques.
Enfin, dans un monde o la rputation est devenue un facteur structurant de la
confiance et de la lgitimit lectorale et o se dveloppe la dmocratie de la
surveillance
173
, comme en tmoigne lessor des mouvements de vrification et de
contrle des politiques nomms Fact-checking (ou en franais vrification par les
faits) et alors que les citoyens se constituent facilement juges du politique, nous
pouvons nous demander si lutilisation de ces mthodes ne pourrait pas, terme
permettre nos reprsentants de contrler leur image de marque sur Internet en
dtectant rapidement les signaux faibles comme le font aujourdhui les institutions
prives.
Cartographies et reprsentations graphiques sont donc largement utilises
comme formats dcriture signifiants des donnes prsentes sur le Web. La posture
communicationnelle de tels objets leur permet dinfluer sur le monde quelles vont
reprsenter en dotant les donnes dune signification qui nexiste pas en dehors de
cette matrialisation. Sil conviendra toujours dinterroger les corrlations et les
regroupements induits par ces mises en forme dans le but dvaluer leur pertinence,

172
Ibid.
173
ROSANVALLON, Pierre, La contre-dmocratie : La politique lge de la dfiance , Paris,
Editions du Seuil, coll. Les livres du nouveau monde , 2006, p.19

87

la matrise de la modlisation des opinions qui sexpriment sur le Web pourrait se
transformer en vritable enjeu de pouvoir. En effet, le contrle des outils statistiques
peut permettre daccder une vision la fois locale et globale des phnomnes qui
se produisent sur le Web, ce qui pourrait permettre aux politiques ainsi quaux
institutions dmocratiques, terme, danticiper les mouvements dopinions naissant
sur Internet, dvaluer efficacement la circulation et ladoption dargumentaires
politiques ou de matriser leur rputation en ligne les mettant mme de distinguer
lmergence de signaux faibles comme le font dj les marques commerciales
aujourdhui.


Conclusion du chapitre :
La transparence vis--vis des conditions de rcolte, de traitement et danalyse du
matriau linguistique devrait permettre aux mthodes de fouille dopinion de tendre
vers une normalisation gage de crdit et condition essentielle la dmocratisation de
ces mthodes. Celles-ci, pour parvenir analyser finement lopinion, devront parvenir
dpasser les discours autour de la viralit et de la spontanit pour prendre en
compte les mdiations ditoriales qui rgissent les processus dcriture en ligne et
influent sur lexpression des opinions. Les conditions de lnonciation devront
galement faire lobjet dun examen attentif, tant entendu que les productions
textuelles disponibles en ligne sont des objets culturels qui ont t publis par des
acteurs spcifiques qui expriment leur vision du monde dans un contexte historique
et spatial particulier. Ainsi, la prise en compte de lmetteur et du genre comme
nouveaux critres dinterprtation permettra, par ltude des marqueurs linguistiques
prsents dans le texte et larchitexte, daboutir une classification plus prcise des
opinions. Toutefois, les critres retenus pour lamlioration des conditions de
lanalyse devront tre ouvertement spcifis afin de pouvoir se soumettre des
exigences de validation, ainsi que pour permettre, par lchange et le dbat de
positions entre acteurs du secteur, de perfectionner et de rationnaliser ces mthodes
danalyse.

88

Pour faire face aux controverses qui agitent les dbats autour des mthodes de
fouille dopinion et dpasser la critique des sondages, les acteurs de lopinion mining
devront parvenir dfinir ce que leurs mthodologies permettent danalyser. Sagit-il
vraiment de lopinion publique ? Et si oui, comment celle-ci sexprime-t-elle ? Nous
avons dmontr ici que ce que ces mthodes pouvaient permettre dobserver ntait
pas lopinion publique au sens o lentendent les sondages, cest--dire la simple
agglomration des opinions individuelles dun chantillon reprsentatif. En effet, loin
dtre dmocratique, le rseau ne permet pas chacun de faire rsonner ses
opinions avec une puissance quivalente ou de rapporter les opinions collectes
des profils socialement identifis. Ce que ces instituts peuvent tre capables de
montrer, cest la manire dont des groupes sociaux constitus vont parvenir
diffuser leurs opinions, les rendre triviales, de manire rendre visibles leurs ides.
Cest en analysant les processus de diffusion, de circulation et dappropriation des
opinions quil sera alors possible didentifier les sujets et les positions mergeants sur
le Web. Toutefois, comme les sondages avant elles, les mthodes de fouille
dopinion devront tre prudentes avec les rsultats proposs et tablir des processus
dajustements transparents.
Aussi, ces nouvelles mtriques, en tant que processus dynamiques, ne peuvent
pas tre visualisables sous forme de pourcentages, comme lont toujours fait jusqu
aujourdhui les sondages, ce qui permettait de stabiliser la reprsentation dune
opinion publique un moment dtermin. Cest pourquoi les acteurs doivent inventer
de nouveaux procds pour permettre de donner du sens leurs analyses. Les
cartographies du Web ainsi que les reprsentations sous forme de graphiques sont
aujourdhui largement utilises par les instituts de fouille dopinion. Ces nouveaux
formats dcriture permettent en effet de matrialiser les donnes collectes, traites
et analyses en les enfermant dans des objets communicationnels susceptibles de
leur donner du sens, de faire merger une signification. Les regroupements effectus
par ces mthodes qui tendent rendre visible ce qui nest pas apprhendable sans
leur utilisation devront toutefois tre constamment interrogs afin dvaluer leur
pertinence. Ayons toujours lesprit que la matrise des donnes statistiques
prsentes sur Internet, en permettant de visualiser le mouvement des opinions un
niveau la fois local et global, pourrait devenir un vritable enjeu politique. En effet,
ces outils pourraient tre mme de permettre danticiper la monte en puissance

89

de mouvements dopinions, de surveiller la circulation dargumentaires politiques au
sein du Web ou bien de rguler la rputation de personnalits politiques en
surveillant la moindre expression dopinion en ligne, se transformant alors en
vritables enjeux de pouvoir.







90





Conclusion

Dans ce mmoire, trois approches ont guid notre rflexion au sujet des tudes
dopinion ralises partir des mthodes dopinion mining. Tout dabord, nous avons
souhait dconstruire lide, sur laquelle sappuient largement les acteurs de la
fouille dopinion, selon laquelle lespace public numrique serait plus dmocratique
que lespace public traditionnel. En effet, si la dmocratisation des outils numriques
a permis le dsenclavement des espaces dexpression ouverts tous et a pu
redonner aux citoyens une certaine autorit face linfluence des gates-keepers
quant aux sujets qui mritent dtre dbattus au sein de lespace public, nous avons
vu que les logiques de traitement algorithmiques des informations avaient tendance
reproduire les travers de lespace public traditionnel en favorisant les informations
des acteurs les plus puissants au dtriment des plus petits, jugs moins lgitimes. De
plus, si lorganisation sociale de linformation aurait pu tre considre comme un
recours face lhgmonie des moteurs de recherche en permettant aux contenus
de la longue trane dtre valoriss, linvestissement des rseaux sociaux par des
logiques marchandes tend faire basculer cette hypothse. Aussi, tous les
internautes ne sont pas gaux face aux outils proposs sur Internet pour exprimer et
faire entendre leurs opinions. Seuls ceux qui matrisent les codes de communication
du rseau sont capables de rendre leurs opinions virales de faon ce que celles-ci
puissent largement circuler et tre rappropries par de nouveaux acteurs, dominant
ainsi les reprsentations du monde qui circulent sur le Web.
Malgr cela, les acteurs de la fouille dopinion avancent lide quil est possible de
comprendre les opinions qui sexpriment et circulent sur Internet pour formuler et
rendre tangible lopinion publique. En effet, lutilisation de linformatique et des

91

mathmatiques pourrait dsormais permettre dapporter de nouvelles mthodes
danalyse fondes sur la comprhension automatise des milliers de donnes et de
traces disponibles sur le Web, provoquant un changement dchelle des corpus quil
est possible de constituer, de traiter et danalyser. Ces normes quantits de
donnes, une fois interprtes, pourraient alors permettre de modliser lopinion qui
sexprime et qui circule sur Internet.
Toutefois, nous avons vu dans la partie suivante que la libration des subjectivits
ayant cours sur le Web rendait complexe le traitement automatique des opinions.
Face une telle quantit de donnes, nous nous sommes demands comment il
pouvait tre possible de diffrencier celles qui avaient un intrt pour lopinion
publique de celles qui nen avaient pas, cest--dire comment parvenir isoler les
matriaux textuels pertinents. Pour cela, nous nous sommes intresss ce qui
constituait la notion dopinion, et avons constat que lide de subjectivit se
construisait partir de nombreux indices disperss dans le texte et larchitexte.
Constatant ainsi que la seule analyse de segments de textes bruts pris en dehors de
leur contexte dnonciation ne pouvait permettre de comprendre les opinions
exprimes, nous avons souhait nous pencher sur les mthodes employes par les
acteurs de lopinion mining pour analyser les noncs. Ltude des discours
employs par les instituts de fouille dopinion nous a alors permis de constater que
les mthodes utilises pour la collecte, le traitement et lanalyse des textes publis
sur Internet et qui conditionnent pourtant intrinsquement les rsultats produits, sous
couvert de discours promotionnels, taient enferms dans des boites noires. Ainsi,
des logiques communicationnelles permettent aujourdhui ces acteurs denfermer
les enjeux politiques, sociaux et conomiques qui sous-tendent pourtant le traitement
des opinions en ligne dans des procds opaques qui ne permettent pas ces
mthodes dtre lgitimes. De ce fait, cette opacit autour des mthodes de
traitement des matriaux collects a pour consquence dalimenter de nombreuses
controverses. Pourtant, nous avons vu que si le langage est bel et bien un objet trop
complexe pour tre rendu totalement intelligible pour des machines, il nen demeure
pas moins que les approximations ralises qui consistent rduire le langage du
code informatique sont bien la force des mthodes de fouille dopinion car ce sont
ces approximations qui vont permettre de traiter des corpus volumineux. De plus, si
le web ne permet pas de reproduire les traditionnels chantillons reprsentatifs si

92

chers aux instituts de sondage, lopinion mining peut dpasser cette limite en
parvenant comprendre comment les opinions circulent et se diffusent au sein de
lcosystme numrique. Aussi, lopacit des mthodes utilises par les acteurs de
lopinion mining contribue les dcrdibiliser alors que celles-ci devraient plutt tre
transparentes et assumer les ncessaires ajustements raliss pour traiter les
opinions de manire continuer samliorer en se rationnalisant. Aussi, nous
avons vu dans cette partie que la mise en visibilit des choix raliss dans le
traitement et lanalyse des documents rcolts tait une condition ncessaire pour la
lgitimation de ces mthodes qui doivent, comme les sondages avant elles, faire
lobjet de normes concertes et acceptes.
Une troisime partie nous a permis de mettre en vidence que pour tre crdibles
et parvenir analyser finement lopinion, les mthodes dopinion mining devraient
parvenir utiliser des normes communes labores en prenant en compte de
nouveaux critres dinterprtation capables dintgrer les effets des mdiations
techniques et des conditions de lnonciation sur le texte. Aussi, les instituts dtude
devront parvenir dpasser les discours autour de la viralit et de la spontanit de
lexpression des opinions pour intgrer lide que les productions textuelles
disponibles en ligne sont des objets culturels qui ont t publis par des acteurs
spcifiques qui expriment travers elles leur vision du monde, et que celles-ci ont
t publies un moment prcis dans un contexte prcis. Aussi, lanalyse de
lmetteur et du genre textuel devrait permettre grce ltude des marqueurs
techniques et linguistiques prsents dans le texte et larchitexte de parvenir une
analyse plus fine des opinions. De plus, les acteurs devront tre mme de prciser
clairement ce que ces analyses permettent de rvler . En effet, la fouille
dopinion ne doit pas chercher reproduire la mise en forme de lopinion
habituellement effectue par les instituts de sondage et qui consiste considrer
lopinion comme la somme des opinions individuelles dun chantillon reprsentatif
de la population. Ce que peuvent parvenir montrer ces mthodes, cest la manire
dont des collectifs vont tre capables de faire circuler leurs opinions de faon ce
que dautres puissent se les approprier. Car comme nous lavons vu, le rseau nest
ni dmocratique, ni reprsentatif de la population. Ce quil est alors possible de voir,
ce sont les tensions qui vont exister entre diffrentes forces sociales et la manire
dont celles-ci vont parvenir ou non diffuser leurs opinions. Grce cela, il devrait

93

alors tre possible didentifier le poids des diffrentes forces en prsence, ainsi que
les sujets et les positions mergeant sur le Web. Il nest donc pas possible
dexprimer les dynamiques identifies sous forme de pourcentage. Cest pourquoi les
instituts de fouille dopinion utilisent dsormais de nouveaux procds pour donner
du sens leurs analyses, comme les cartographies du Web ou les reprsentations
sous forme de graphiques. Devenus nouveaux formats dcriture et de rification du
Web, ces objets communicationnels permettent ainsi de faire merger une
signification dun ensemble de donnes qui nauraient pas t apprhendables en
dehors deux. Sil convient dinterroger constamment la pertinence des associations
effectues au sein de ces processus dcriture du Web, ceux-ci permettent toutefois
de donner ceux qui les matrisent un sentiment de puissance. En effet, ceux-ci
permettent par la granularit unique que confre loutil zoom de consulter les
phnomnes se droulant la fois au niveau local et au niveau global sur Internet.
Aussi, ces technologies, mises au service des politiques et des institutions
dmocratiques, pourraient se transformer en vritable enjeux de pouvoir.
Nous lavons constat, la fouille dopinion soulve aujourdhui de nombreux
espoirs et de nombreuses questions. Si ces mthodes ont dj pu montrer leur
efficacit et leur intrt dans le domaine marketing, elles doivent encore faire leurs
preuves en ce qui concerne les tudes dopinion. Aussi, pour permettre ces
mthodes de se rationnaliser et de se crdibiliser, les recherches en linguistiques et
en traitement automatique du langage doivent se poursuivre de manire
transparente afin de permettre de comprendre toujours plus finement les
phnomnes qui se produisent sur Internet.
De plus, nous voyons bien qualors, le traitement des donnes, en tant que
nouvelle source de valeur, est devenu un enjeu majeur de lconomie numrique.
Les donnes sont ainsi collectes en permanence par des acteurs publics et privs
qui cherchent en tirer un bnfice conomique, social ou politique. Cest pourquoi
la collecte, le traitement et lanalyse des opinions en ligne, en tant que nouveaux
enjeux de pouvoir, peuvent ouvrir de nombreuses nouvelles pistes de recherche. Il
pourrait par exemple tre intressant de se demander comment ces outils pourraient
devenir particulirement utiles aux politiques. Peuvent-ils constituer des outils
intressants en priode dlection pour leur permettre de tester leurs programmes ?
Peuvent-ils se rvler prdictifs ? Ces acteurs doivent-ils sinspirer des mthodes du

94

marketing pour parvenir contrler leur image de marque sur Internet ? Il
conviendrait galement de sinterroger propos des ajustements qui doivent tre
raliss partir des donnes rcoltes. De plus, lmergence des mthodes de
fouille dopinion pourrait poser de nombreuses questions relatives aux imaginaires du
contrle de la socit par le pouvoir en place. La quantit de donnes collectes sur
chaque Internaute peut-elle contribuer alimenter lide quInternet peut permettre la
surveillance des usagers du Web ? Internet pourrait-il devenir le nouveau panopticon
grce auquel les institutions publiques et prives pourraient surveiller sans tre vues,
et o les citoyens seraient vus sans voir ? Autant de questions propos desquelles il
pourra tre intressant de sinterroger afin de continuer alimenter les travaux
autour des enjeux de la fouille dopinion.



95

Bibliographie

Ouvrages
BARTHES, Roland, Mythologies , Editions du Seuil, coll. Points , 1957.
BOULLIER, Dominique et LOHARD, Audrey, Opinion mining et Sentiment
analysis : Mthodes et outils , OpenEdition Press, coll. Science po / Medialab ,
2012 [Disponible en ligne : http://books.openedition.org/oep/204]. Marseille,
OpenEdition Press, 2012. Publi en 2012, consult le 18 juin 2014
BOURDIEU, Pierre, Ce que parler veut dire : L'conomie des changes
linguistiques , Fayard, 1982.
CARDON, Dominique, La dmocratie Internet, promesses et limites , Paris,
Seuil-La rpublique des ides, 2010.
MARTIN, Alban, Egocratie et Dmocratie. La ncessit de nouvelles
technologies politiques , France, FYP ditions, Coll. Prsence / Essai , 2010.
POIBEAU, Thierry, Traitement automatique du contenu textuel , Lavoisier,
[Disponible en ligne : http://books.google.fr/books?id=1owHudO-
riwC&dq=rastier+genre+textuel&hl=fr] Consult le 18 aout 2014.
ROSANVALLON, Pierre, La contre-dmocratie : La politique lge de la
dfiance , Paris, Editions du Seuil, coll. Les livres du nouveau monde , 2006.
VANBREMEERSCH, Nicolas, De la dmocratie numrique , Editions du Seuil,
2009.

WOLTON, Dominique, Internet, et aprs ? Une thorie critique des nouveaux
mdias , Paris,Flammarion, coll. Champs Essais , 2000.


Articles scientifiques
ALLARD, Laurence et VANDENBERGHE, Frdric, Express yourself ! Les
pages perso , Rseaux 1/ 2003 (n
o
117), p. 191-219
[Disponible en ligne : www.cairn.info/revue-reseaux-2003-1-page-191.htm] Consult
le 9 aout 2014.
ANSCOMBRE, Jean-Claude et al, La polyphonie linguistique , Langue
franaise 4/ 2009 (n 164), p. 3-9 [Disponible en ligne : www.cairn.info/revue-langue-
francaise-2009-4-page-3.htm]. Consult le 18 aout 2014.
BEAUVISAGE, Thomas et al., Le succs sur Internet repose-t-il sur la
contagion ? Une analyse des recherches sur la viralit , Tracs 2/ 2011 (n 21),

96

p. 151-166 [Disponible en ligne : www.cairn.info/revue-traces-2011-2-page-151.htm]
Consult le 8 aout 2014.
BENRAHHAL SERGHINI, Zineb et MATUSZAK, Cline, Lire ou relire
Habermas : lectures croises du modle de lespace public habermassien , tudes
de communication [Disponible en ligne : http://edc.revues.org/868], publi le 02
septembre 2009, consult le 10 juillet 2014.
BOULLIER, Dominique, Les industries de l'attention : fidlisation, alerte ou
immersion , Paris, Rseaux, 2009/2 n 154, p. 239
BOURDIEU, Pierre, Lopinion publique nexiste pas , expos fait
Noroit (Arras) en janvier 1972 et paru dans Les temps modernes , 318, janvier
1973, pp. 1292-1309. Repris in Questions de sociologie, Paris, Les ditions de
Minuit, 1984, pp. 222-235. [Disponible en ligne : http://www.homme-
moderne.org/societe/socio/bourdieu/questions/opinionpub.html] Consult le 18 aout
2014.
CARDON, Dominique, Prsentation , Rseaux 1/ 2013 (n 177), p. 9-21
[Disponible en ligne : www.cairn.info/revue-reseaux-2013-1-page-9.htm] Consult le
7 aout 2014.

CARDON, Dominique, Dans l'esprit du PageRank : Une enqute sur
l'algorithme de Google , Rseaux, 2013/1 n 177, p. 63-95.

CARDON, Dominique, Le design de la visibilit. Un essai de cartographie du
Web 2.0 , Rseaux 6/ 2008 (n 152), p. 93-137 [Disponible en ligne
: www.cairn.info/revue-reseaux-2008-6-page-93.htm] Consult le 7 aout 2014.

CARDON, Dominique et DELAUNAY-TETEREL, Hlne, La production de soi
comme technique relationnelle , Rseaux 4/ 2006 (no 138), p. 15-71
[Disponible en ligne : www.cairn.info/revue-reseaux-2006-4-page-15.htm.] Consult
le 9 aout 2014.

DAVALLON Jean et JEANNERET Yves, La fausse vidence du lien
hypertexte , Communication et langages N140, 2004. pp. 43-54. [Disponible en
ligne : http://www.persee.fr/Web/revues/home/prescript/article/colan_0336-
1500_2004_num_140_1_3266] Consult le 18 aout 2014.

EENSOO-RAMDANI, Egle, BOURION, Evelyne, SLODZIAN, Monique,
VALETTE, Mathieu De la fouille de donnes la fabrique de l'opinion. Enjeux
pistmologiques et propositions , in GRIVEL, Luc (dir), Analyse d'opinions sur
Internet, Les Cahiers du Numrique, Volume 7, n2, 2011, p.15-39.

FLICHY, Patrice, Internet et le dbat dmocratique , Rseaux 4/2008 (n
150), 2008, p. 159-185 [Disponible en ligne : www.cairn.info/revue-reseaux-2008-4-
page-159.htm] Consult le 28 juin 2014
FLICHY, Patrice, 7. La fin du politique , In L'imaginaire d'Internet , La
Dcouverte, 2001, p. 195-222 [Disponible en ligne : www.cairn.info/l-imaginaire-d-
Internet--9782707135377-page-195.htm.]

97

GOETA, Samuel, Open-Data : quouvre-t-on avec les donnes publiques ? ,
Mmoire de recherche en master 2, CELSA, Ecole des hautes tudes en sciences
de linformation et de la communication, 2012.
GREFFET, Fabienne et WOJCIK, Stphanie, Parler politique en
ligne , Rseaux 4/ 2008 (n 150), p. 19-50, [Disponible en
ligne : www.cairn.info/revue-reseaux-2008-4-page-19.htm] Consult le 18 juillet 2014.
JEANNERET, Yves et SOUCHIER, Emmanul, L'nonciation ditoriale dans
les crits d'cran , Communication et langages N145, 2005. pp. 3-15.
KAUFMANN, Laurence, L'opinion publique : oxymoron ou
pleonasme ? , Rseaux 1/ 2003 (n
o
117), p. 257-288 [Disponible en
ligne : www.cairn.info/revue-reseaux-2003-1-page-257.htm] Consult le 10 aout
2014.
LECOMTE, Romain, Rvolution tunisienne et Internet : le rle des mdias
sociaux , LAnne du Maghreb [disponible en ligne :
http://anneemaghreb.revues.org/1288], Publi le 01 septembre 2011, consult le 28
juin 2014.
MCCOMBS, Maxwell et SHOW, Donald, The Agenda-Setting Function of
Mass-Media , Public Opinion Quaterly n36, 1972, p.176-187 [Disponible en ligne :
http://www.unc.edu/~fbaum/teaching/PLSC541_Fall06/McCombs%20and%20Shaw
%20POQ%201972.pdf] Consult le 1er juillet 2014.
PASQUIER, Dominique, Les jugements profanes en ligne sous le regard des
sciences sociales , Rseaux 1/ 2014 (n 183), p. 9-25 [Disponible en ligne
: www.cairn.info/revue-reseaux-2014-1-page-9.htm.] Consult le 8 aout 2014.
RAMPON, Jean-Michel, Elihu KATZ et Paul L. LAZARSFELD
(1955/2008), Influence personnelle. Ce que les gens font des
mdias , Communication Vol. 29/1, 2011 [Disponible en ligne :
http://communication.revues.org/2550] Publi le 04 octobre 2011, consult le 08 aot
2014.
ROUVROY, Antoinette et BERNS, Thomas, Le nouveau
pouvoir statistique , Multitudes 1/ 2010 (n 40), p. 88-103 [Disponible en ligne : URL
: www.cairn.info/revue-multitudes-2010-1-page-88.htm.] Consult le 3 juillet 2014.
SOUCHIER, Emmanuel, L'crit d'cran, pratiques d'criture & informatique ,
Communication et langages N107, 1996. pp. 105-119.
SOUCHIER, Emmanuel, Voir le Web et deviner le monde. La cartographie
au risque de lhistoire de lcriture , in Traces numriques : de la production
l'interprtation , CNRS ditions, 2013, p.231-229.
TAIEB, Emmanuel, Persistance de la rumeur , Rseaux 2/ 2001 p. 231-271
[Disponible en ligne : www.cairn.info/revue-reseaux-2001-2-page-231.htm.] Consult
le 7 aout 2014.



98

Cours magistraux mobiliss
AM, Olivier, Les Mdias dans les sciences de linformation et de la
communication , cours dispens au CELSA, cole des hautes tudes en science de
linformation et de la communication dans le cadre du master 2 Mdias Informatiss
et Stratgies de Communication (MISC) le 23 septembre 2013.
BIGOT, Jean-Edouard, Enjeux et techniques des reprsentations
cartographiques du web , cours dispens au CELSA, cole des hautes tudes en
science de linformation et de la communication dans le cadre du master 2 Mdias
Informatiss et Stratgies de Communication (MISC) le 29 novembre 2013.
CANDEL, Etienne, Lapproche smiotique du numrique , cours dispens au
CELSA, cole des hautes tudes en science de linformation et de la communication
dans le cadre du master 2 Mdias Informatiss et Stratgies de Communication
(MISC) le 10 septembre 2013.
DENIS, Jrme, Sociologie, usages et technologies , cours dispens au
CELSA, cole des hautes tudes en science de linformation et de la communication
dans le cadre du master 2 Mdias Informatiss et Stratgies de Communication
(MISC) le 8 octobre 2013.
GKOUSKOU-GIANNAKOU, Pergia, Smiotique de mdias informatiss ,
cours dispens au CELSA, cole des hautes tudes en science de linformation et de
la communication dans le cadre du master 2 Mdias Informatiss et Stratgies de
Communication (MISC) le 18 octobre 2013.
JEANNERET, Yves, Pratiques et conomies de la trivialit , cours dispens au
CELSA, cole des hautes tudes en science de linformation et de la communication
dans le cadre du master 2 Mdias Informatiss et Stratgies de Communication
(MISC) le 21 novembre 2013.
KUNERT, Stphanie, Smiologie des mdias et analyse de discours , cours
dispens au CELSA, cole des hautes tudes en science de linformation et de la
communication dans le cadre du master 2 Mdias Informatiss et Stratgies de
Communication (MISC) le 8 octobre 2013.
MAGIS, Christophe, Pratiques communicationnelles , cours dispens
luniversit Paris VIII dans le cadre du master 1 Communication numrique, conduite
de projets et veille stratgique le 29 novembre 2012.
SOUCHIER, Emmanuel, Transformations et pouvoirs de lcriture , cours
dispens au CELSA, cole des hautes tudes en science de linformation et de la
communication dans le cadre du master 2 Mdias Informatiss et Stratgies de
Communication (MISC) le 17 septembre 2013.




99

Corpus :

FOCUSMATIC, analyse en continu , [Disponible en ligne :
http://focusmatic.com/fr/produit/analyse-en-continue] Consult le 5 aout 2014.
GOOGLE, Dix repres cls [Disponible en ligne :
http://www.google.com/about/company/philosophy/] Consult le 7 aout 2014.

GOOGLE, Informations supplmentaires concernant la cration dun site de
qualit , [Disponible en ligne :
https://sites.google.com/site/Webmasterhelpforum/informations-supplementaires-
concernant-la-creation-de-sites-de-qualite] Consult le 7 aout 2014.

HO2S, Surveillance de lopinion [Disponible en ligne :
http://www.ho2s.com/fr/services-Web/surveillance-de-l-opinion/] Consult le 5 juillet
2014

HOLMES, Analyse de sentiment , [Disponible en ligne :
http://www.ho2s.com/fr/produits-et-technologies/analyse-des-sentiments/] Consult le
5 juillet 2014.

IPSOS Social listening , [Disponible en ligne : http://www.ipsos.fr/ipsos-
otx/social-listening,] Consult le 5 juillet 2014.

LINKFLUENCE [Disponible en ligne :
http://linkfluence.com/fr/2009/10/19/observatoire-politique-Web-social/] Consult le 5
juillet 2014

LINKFLUENCE, la blogosphre politique franaise (dcembre 2012)
[Disponible en ligne :
http://www.lemonde.fr/politique/visuel_interactif/2012/12/26/carte-de-la-blogosphere-
politique-2013_1809704_823448.html] Consult le 19 aout 2014.

NETSCOPE [Disponible en ligne : http://www.netscope.fr/institut] Consult le 5
juillet 2014

SCAN RESEARCH [Disponible en ligne : www.scan-research.com] Consult le 5
juillet 2014

SCAN RESEARCH, Nos mthodes : tape 3, Visualisation des rsultats
[Disponible en ligne : http://www.scan-research.com/index-3.html] Consult le 19
aout 2014.

SEMIOCAST, Baromtre politique , [Disponible en ligne :
http://semiocast.com/en/barometre_politique] Consult le 5 juillet 2014.

TF1 NEWS, Exclusif : les rsultats du Twittoscope de mars 2012 , [Disponible
en ligne : http://lci.tf1.fr/politique/elections-presidentielles/exclusif-les-resultats-du-
twittoscope-de-fevrier-2012-7122597.html] Consult le 15 aout 2014.


100

TNS SOFRES, Le futur des tudes , [Disponible en ligne : http://www.tns-
sofres.com/notre-offre/nos-solutions/le-futur-des-etudes] Consult le 5 juillet 2014.

Articles de presse cits dans le mmoire
ALBERTINI, Dominique, Entrepreneurs, des pigeons pas si plums , Libration
[Disponible en ligne : http://www.liberation.fr/economie/2012/10/02/entrepreneurs-
des-pigeons-pas-si-plumes_850287] Publi le 2 octobre 2012, Consult le 18 juillet
2014

BATTAGLIA, Mattea et LE BARS, Stphanie, Thorie du genre : lappel au
boycott qui alarme lcole , Le Monde, [Disponible en ligne :
http://www.lemonde.fr/societe/article/2014/01/29/l-appel-au-boycott-qui-alarme-l-
ecole_4356195_3224.html] Publi le 28 janvier 2014, Consult le 7 aout 2014.

BROSSARD, Guillaume, Thorie du genre lcole : comment facebook et les
SMS servent blanchir la rumeur , Le plus Nouvel Obs [Disponible en ligne :
http://leplus.nouvelobs.com/contribution/1138487-theorie-du-genre-a-l-ecole-
comment-les-reseaux-sociaux-servent-a-blanchir-la-rumeur.html] Publi le 30 janvier
2014, Consult le 7 aout 2014.

LE GALES, Yann et CHAPERON, Isabelle, La rvolte fiscale des patrons des
start-up se rpand , Le Figaro [Disponible en ligne :
http://www.lefigaro.fr/entrepreneur/2012/10/03/09007-20121003ARTFIG00702-la-
revolte-fiscale-des-entrepreneurs-est-allumee.php?cmtpage=0#comments-
20121003ARTFIG00702] Publi le 4 octobre 2012, Consult le 18 juillet 2014

RAYMOND, Gregory "Pigeons" : d'un change Facebook au recul du
gouvernement, autopsie d'un buzz , Huffington Post [Disponible en ligne :
http://www.huffingtonpost.fr/2012/10/04/pigeons-geonpi-entrepreneurs-buzz-
moscovici_n_1939291.html] Publi le 4 octobre 2012, Consult le 18 juillet 2014

SAMUEL, Laurent, Pigeons, la grogne des entrepreneurs gagne la toile , Le
Monde [Disponible en ligne :
http://www.lemonde.fr/economie/article/2012/10/01/pigeons-la-grogne-des-
entrepreneurs-gagne-la-toile_1768408_3234.html] Publi le 1er octobre 2012,
Consult le 18 juillet 2014

SAMUEL, Laurent Pigeons, gense dune mobilisation efficace , Le Monde
[Disponible en ligne : http://www.lemonde.fr/politique/article/2012/10/04/pigeons-
genese-d-une-mobilisation-efficace_1770123_823448.html] Publi le 4 octobre 2012,
Consult le 18 juillet 2014

SAMUEL, Laurent Les anti-IVG pratiquent la dsinformation sur le Web , Le
Monde [Disponible en ligne : http://www.lemonde.fr/politique/article/2013/02/25/les-
anti-ivg-pratiquent-la-desinformation-sur-le-Web_1838677_823448.html] Publi le 25
fvrier 2013, Consult le 15 aout 2014.


101

Pages Web

HOAXBUSTER [Disponible en ligne : www.hoaxbuster.com] Consult le 7 aout
2014.

IFOP, Observatoire des rseaux sociaux 2013 , [Disponible en ligne :
http://www.ifop.com/media/poll/2436-1-study_file.pdf] Publi le 13 dcembre 2013,
consult le 15 aout 2014.

OBSERVATOIRE DU NUMERIQUE, chiffres cls , mai 2014 [Disponible en
ligne : http://www.observatoire-du-numerique.fr/wp-content/uploads/2014/05/2014-
05-Chiffres-cles-ON.pdf] Consult le 15 aout 2014.

SLATE, Twitter : lattaque des robots hollandistes [Disponible en ligne :
http://www.slate.fr/story/44349/twitter-attaque-robots-hollandistes-francois-hollande]
Publi le 28 octobre 2011, consult le 15 aout 2014.

SYNDICAT NATIONAL DES JOURNALISTES, Dclarations des devoirs et des
droits des journalistes , Munich, 1971, [Disponible en ligne :
http://www.snj.fr/spip.php?article2016] Consult le 7 aout 2014.

WOLTON, Dominique, Espace public , [Disponible en ligne :
http://www.wolton.cnrs.fr/spip.php?article67], consult le 10 juillet 2014
YOPPS [Disponible en ligne : http://www.yopps.fr/] Consult le 18 juillet 2014

Documents audiovisuels
SMC TALKS, Opinion mining : ces algorithmes qui dcryptent nos conversations
[S3E5] , Social Mdia Club France, [Disponible en ligne :
http://socialmediaclub.fr/2014/03/smc-talks-opinion-mining-ces-algorithmes-qui-
decryptent-nos-conversations-s3e5/] Publi le 28 mars 2014, consult le 24 juillet
2014.


102







Annexes









103







Annexe 1 : Tableau rcapitulatif de lanalyse de discours


104

http://www.scan-research.com/ http://linkfluence.com/fr http://www.netscope.fr/
1.
Construction
de la figure
de
l'nonciateur
et du
rcepteur.
DISTANCIATION
> Scan-research fournit ses clients les moyens de
comprendre en temps rel le sens de lopinion des Internautes
> Scan-research est un institut dtudes de lopinion des
consommateurs et des citoyens dun type nouveau
> Scan-research a dvelopp un ensemble doutils et de
mthodes originales qui nous permet de proposer au march
des entreprises, ainsi quaux organisations non commerciales,
un service rpondant aux exigences professionnelles les plus
rigoureuses dans lanalyse de lopinion.
> Scan-research collecte les messages pertinents mis en
ligne par les Internautes sur tous les types de sources Internet

PRESENCE DU LOCUTEUR
> ce que nous faisons
> nous recueillons ainsi rgulirement des corpus importants
de messages pouvant aller jusqu plusieurs centaines de
milliers de documents pour une mme tude.
> chaque document est index par nos outils selon ses
contenus

FIGURE DU RECEPTEUR
> proposer au march des entreprises
> fournir dans les meilleurs dlais les rsultats de nos
analyses nos clients pour quils prennent leurs dcisions dans
un monde o lurgence est devenu le rythme ordinaire
> mesurer les performances de vos oprations de brand
content sur Internet

CONFUSION DE LA FIGURE ENONCIATEUR /
RECEPTEUR :
> dans "offre" : sont poses toute une srie de questions qui
sont celles de l'interlocuteur et non du locuteur
> comment ma marque, mes produits & mes services sont-ils
perus par les internautes ?
> comment va ma marque ?
> o va ma marque ?
> quel effet de ma campagne sur lopinion ?
PRESENCE DU LOCUTEUR
> notre offre de social media intelligence
> ils nous font confiance
> notre prsence sur les rseaux sociaux
> qui sommes-nous ?
> notre approche
> nos convictions :

FIGURE DU RECEPTEUR
> linkfluence vous aide tirer le maximum de
valeur des conversations du Web social
> sur le Web, si vous coutez tout, vous
nentendrez rien..
> dcouvrez radarly, solution de veille et
danalyse des mdias sociaux

INSCRIPTION DU RECEPTEUR DANS LE
DISCOURS EN LUI DONNANT LA PAROLE :
> "Grce Radarly, nous profitons au sein d'un
outil simple et puissant d'un monitoring de
l'ensemble de nos chanes et missions, d'une suite
d'engagement pour nos community managers et
d'un reporting quotidien destination de diffrentes
directions du groupe" Myriam l'Aouffir
Communication Online et Social Media Manager
France Tlvision
> "Radarly nous permet d'valuer l'impact de
nos actions de community management, et de nous
mesurer aux standards de nos secteurs, De plus
l'quipe disponible et l'coute nous aide
rpondre nos problmatiques spcifiques", Lionel
Fumado Corporate Community Management et E-
rputation Orange
> "Nous avons choisi Linkfluence parmi une
quinzaine de prestataires car ils proposent la fois
une veille de la marque et de ses thmatiques, de
la gestion de crise et un monitoring de nos
campagnes marketing travers des outils
performants et une quipe ddie" Jean-Nol
Pnichon Digital Director Mc Donald's France
DISTANCIATION :
> des professionnels
expriments
> "Ils" ont dcid de faire
converger recherche
fondamentale et mthodologies
professionnelles
> permettre leurs clients de
tirer intelligemment parti des
contenus circulant sur le Web 2.0.
> Netscope est un institut

PRESENCE DU LOCUTEUR
> Notre institut est en quelque
sorte n de la rvolution Internet
> Mise en avant de l'quipe
avec exprience + photo

CONFUSION DE LA FIGURE
ENONCIATEUR / RECEPTEUR
> Cette rvolution a de fait
affect toutes nos pratiques.
> Nos pratiques de
consommation bien sr (que lon
songe au dveloppement du e-
commerce) ; nos modes de
socialisation galement, comme
en atteste le dveloppement
exponentiel des rseaux sociaux ;
mais aussi nos modes de
communication et dchanges.

FIGURE DU RECEPTEUR
> les autorits et les pouvoirs
constitus prouvent de plus en
plus de difficults matriser,


105


http://www.scan-research.com/ http://linkfluence.com/fr http://www.netscope.fr/
2. Les verbes Un institut investit :
> fournit / comprendre
> sest fix pour objectif de rpondre
> prendre en compte
> suivre lvolution constante et rapide de lopinion
> fournir dans les meilleurs dlais les rsultats de nos
analyses
> fournir une reprsentation simple et intuitive
> dpasser le simple comptage de citations de mots cls
pour aller jusqu une comprhension fine
> Scan-research a dvelopp un ensemble doutils et de
mthodes originales
> Un service conu pour rpondre dans les meilleurs dlais

FAITS/LISTES - Verbes l'infinitif :
> Recueillir
> Collecter
> Traiter
> Indexer
> Identifier
> Evaluer
> Suivre
> Visualiser

NOMS A LA PLACE DES VERBES - Objectivit relative -
liste
> Observation de la perception dune marque par ses
diffrents publics
> Analyse de son positionnement par rapport ses
concurrentes
> Dtermination de son territoire de valeur et de lgitimit
> Evaluation de la satisfaction des clients et des utilisateurs
de ses services
> Suivi de lvolution de la perception dune marque
> Observation des rpercussions dvnements sur limage
dune marque et son e-rputation
> Visualisation
> Exploitation
> ...
DECLARATIFS : FALLOIR / DEVOIR :
> Le social media intelligence est une
opportunit quil faut pouvoir adapter et
traduire pour chaque dpartement, pour
chaque silo dans lentreprise ;
> A la comprhension du quoi sajoute
maintenant le profilage du qui. Le
traitement automatis du langage, lanalyse
du sentiment ne sont plus suffisants, il faut
maintenant analyser les profils, leurs
affinits, leurs communauts ;
> Il faut allier technologies innovantes et
expertise humaine pour vritablement
transformer les donnes et mtriques en
enseignements, prises de dcisions et
actions ;
> Les outils doivent sadapter aux
usages et non le contraire, ergonomie et
exprience utilisateur sont primordiales

FAITS/LISTES - Verbes l'infinitif :
> Cartographier son cosystme Web
pour cadrer son brief agence,
> Extraire des insights consommateurs
des mdias sociaux pour nourrir sa direction
produit,
> Mesurer et benchmarker limpact de
ses campagnes social media,
> Suivre sur le long terme lvolution de
sa structure dimage sur le Web pour piloter
ses efforts marketing.
> Faire son CRM en temps rel et en
quipe,
> Identifier ses influenceurs,
ambassadeurs ou dtracteurs et engager
massivement en quelques clics,
> Se comparer ses concurrents,
identifier les meilleures pratiques,
TIRER UN AVANTAGE...
> offrait de formidables perspectives
> cette rvolution ncessitait
> tirer pleinement profit
> tirer intelligemment parti des
contenus
> lexploitation ouvrira une nouvel re
> permettra de mieux connaitre les
opinions

... DE NOUVELLES DIFFICULTES
> les autorits et les pouvoirs
constitus prouvent de plus en plus de
difficults matriser,
> des millions de points de vue qui
sexpriment
> Cette multitude de points de vues et
dopinions qui sexpriment et circulent


FAITS/LISTES - Verbes l'infinitif :
Collecter, traiter, analyser ces millions
dinformations disponibles
quotidiennement
> connaitre et comprendre les
attentes des consommateurs, et identifier
les tendances qui traversent nos socits

NOMS A LA PLACE DES VERBES -
Objectivit relative
> Identification
> Observation
> Etude
> Production

106


http://www.scan-research.com/ http://linkfluence.com/fr http://www.netscope.fr/
3. Les termes
subjectifs
CE QUE LA TECHNOLOGIE PERMET :
Minutie
> une mesure prcise
> un service rpondant aux exigences professionnelles
les plus rigoureuses dans lanalyse de lopinion
> Lensemble du corpus est ainsi tri et structur selon
une grille danalyse thmatique dtaille, allant trs au
del de seule polarit positif/ngatif
> aller jusqu une comprhension fine de ce que
disent vritablement les Internautes

Simplicit, efficacit, utilit
> fournir une reprsentation simple et intuitive de
donnes complexes et en suivre la perptuelle volution
> rpondre dans les meilleurs dlais et des conditions
de cots efficaces

Pour faire face de nouveaux dfis :
> rpondre aux grands dfis des tudes de march
l'heure d'Internet
> suivre lvolution constante et rapide
> prendre en compte lnorme quantit de messages
et davis mis en ligne chaque jour

> Opposition entre "l'norme quantit de messages",
l'opinion "complexe", " constante et rapide" et la
comprhension "fine", "dtaille", "simple", "intuitive" qui
permet de comprendre ce que disent "vritablement" les
internautes
CE QUE LA TECHNOLOGIE PERMET :
Simplicit, efficacit, utilit
> Une interface efficace pour une veille simple
et performante
> Des dashboards synthtiques et
oprationnels
> Des mthodologies sur mesure en fonction
du brief client,
> Engager massivement en quelques clics

Innovation :
> une solution unique pour raliser sa veille
des mdias sociaux, mesurer sa performance et
engager avec ses communauts.
> des mtriques innovantes
> des technologies la pointe


Minutie
> Une parfaite hybridation entre approches
quantitatives et qualitatives, analyse humaine et
automatise,
CE QUE LA TECHNOLOGIE
PERMET :
Simplicit, efficacit, utilit
> permettre leurs clients de tirer
intelligemment parti des contenus
circulant sur le Web 2.0.
> de formidables perspectives
> amlioration de nos connaissances
du monde social et des pratiques des
individus

Innovation
> un outil innovant danalyse de
lopinion et des tendances sur le Web 2.0
> un renouvellement des approches
et des mthodes denqute
> Cet outil exploite et valorise les
nouvelles potentialits offertes par le
Web 2.0

Minutie :
> Identification et recueil exhaustif
des points de vue
> supprimer les risques derreur
> production de donnes
particulirement ralistes


> un formidable stock dinformations



107

http://www.scan-research.com/ http://linkfluence.com/fr http://www.netscope.fr/
4. La
nature des
arguments
UN ACTEUR INNOVANT (pathos)
> Scan-research est un institut
dtudes de lopinion des consommateurs
et des citoyens dun type nouveau
> Scan-research est laurate pour
lanne 2013 du Start up project un
programme initi par Cap Digital (ple de
comptitivit pour les activits
numriques en le de France) et lAACC
(Association des Agences Conseil en
Communication).

UN SERVICE PERFORMANT
(pathos)
> Un service conu pour rpondre
dans les meilleurs dlais et des conditions
de cots efficaces aux questions
dopinion que se posent les dcideurs


DES PARTENAIRES RECONNUS
(ethos)
> Scan-research est partenaire pour
2014 de lagence Leo Burnett (Groupe
Publicis)
> Scan-research est un institut
dtudes de lopinion des Internautes
Linstitut a t cr sur la base des
travaux conduits partir du printemps
2009 dans le cadre du projet iPinion
soutenu par le ministre de lconomie
numrique (DGCIS) dans le cadre de
lappel projet Web 2.0
> Scan-research reoit le soutien de la
BPI et de la Mairie de Paris pour sa R&D,
ainsi que celui de Scientiple, un fonds
dinvestissement public anim notamment
par la Rgion le de France.
RECONNAISSANCE DU SECTEUR (ethos)
> Radarly reoit le prix des meilleurs Earned Media Analytics
dans le Goldbach Monitoring Tool Report 2014
> Nos mthodes de cartographie et de segmentation
communautaire du Web sont devenues des rfrences et nos
technologies ont t de nombreuses fois primes (OSEO, statut de
Jeune Entreprise Innovante, concours de startup).

Et l'internationnal (ethos)
> Linkfluence dploie ses solutions partout dans le monde


SANTE ECONOMIQUE (ethos)
> linkfluence annonce une nouvelle leve de fonds de 6.5m
> en 2014, linkfluence acquiert trendybuzz, rfrence dans le
monde de la e-rputation et simpose alors comme numro 1 en
france dans un march en pleine explosion. lambition ? tre le
numro 1 europen dici 2 ans.

UN ACTEUR HISTORIQUE ET DE NOMBREUX CLIENTS
(ethos)
> fonde en 2006, linkfluence cest plus de 70 collaborateurs, 200
clients, des technologies performantes et des mthodologies indites.
> linkfluence est un acteur historique du social media intelligence
> lacteur historique et de rfrence
> depuis 2006, plus de 300 clients accompagns et satisfait
> depuis 7 ans, nous avons accompagn plus de 500 clients sur
des projets en de multiples langues et sur lensemble des continents

UN ACTEUR INNOVANT (pathos)
> Depuis notre cration, nous navons cess dinnover nous
adaptant constamment aux volutions de notre secteur (temps rel,
profilage communautaire, interconnexion des suites logicielles,
intgration des dernires plates-formes sociales, modules
dengagement).
> Une mthodologie reconnue
> profiter de l'expertise unique

> Social Media Intelligence = capter, trier, analyser, reprsenter
ces donnes pour crer de la valeur
MISE EN AVANT DIRECT DES
PROFESSIONNELS (ethos)
> Jean-Yves Dormagen, professeur
de science politique lUniversit
Montpellier 1, Florence Paulin et Malik
Larabi, directeurs associs de Somme
toute Institut dtudes dopinion et de
conseil, ont dcid de faire converger
recherche fondamentale et
mthodologies professionnelles pour
permettre leurs clients de tirer
intelligemment parti des contenus
circulant sur le Web 2.0.
> des professionnels expriments du
monde des tudes et chercheurs en
sciences sociales

CHIFFRES / FAITS (Logos)
> En seulement 10 ans, surfer sur la
toile est devenue une pratique ordinaire
pour une grande majorit de la
population. Dans un pays comme la
France, la population des internautes est,
en effet, passe de 11,9 37,5 millions
de personnes. Plus de 6 Franais sur 10
sont ainsi dsormais connects sur le
net. Et ils sont en moyenne trs actifs sur
la toile, puisquenviron 90 % dentre eux
surfent quotidiennement. Ce qui place
dailleurs la France au premier rang
mondial en la matire.
> Rien que dans un pays comme la
France, ce sont des millions de points de
vue qui sexpriment tous les jours sur la
toile propos de sujets aussi divers que
la qualit de laccueil dans les aroports,
les films que lon peut voir en salle, les
bonnes destinations o partir en
vacances, la panne des Blackberry, ou
encore, et bien sr, la vie politique

108

http://www.scan-research.com/ http://linkfluence.com/fr http://www.netscope.fr/
5. Lanalyse
des
prsupposs et
des
reprsentations
Vrit :
> comprendre ce que disent
vritablement les Internautes /
comprendre en temps rel le sens de
lopinion des Internautes

Cyberdmocratie :
> observer lopinion dans son
mouvement spontan sur Internet
> suivre lvolution constante et
rapide de lopinion des
consommateurs au rythme de leurs
contributions quotidienne aux rseaux
sociaux
> Les rseaux sociaux ont
boulevers le monde conomique,
social, politique


Cyberdmocratie :
> Le traitement automatique des
donnes disponibles sur le Web peut
aider la prise de dcision et apporter
de la valeur
> des tudes marketing,
communication et opinion pour prendre
du recul sur les conversations
spontanes du Web social
> dcrypter lopinion qui se forme et
sexprime spontanment sur le Web
social

UN DEFI A RELEVER
> Le temps rel nest plus une
question de minutes mais de diximes
de secondes. Seules les technologies
capables de relever ce dfi resteront
comptitives

LA SOURCE D'UNE VALEUR
NOUVELLE :
> Les mdias sociaux ont
dfinitivement boulevers lorganisation
des entreprises. Le Web regorge de
conversations, de publications, de
traces laisses par des individus
(consommateurs, citoyens, usagers)
souvent sous-exploites : cest une
source de valeur ajoute, un levier de
dcision stratgiques.
> Le social media intelligence est
une opportunit quil faut pouvoir
adapter et traduire pour chaque
dpartement, pour chaque silo dans
lentreprise ;
>Linkfluence vous aide tirer le
maximum de valeur des conversations
du Web social
REVOLUTION 2,0
> convaincus que la rvolution du Web 2.0 offrait de formidables
perspectives pour ltude de lopinion
> Partageant le constat que cette rvolution ncessitait un
renouvellement des approches et des mthodes denqute
> Une rvolution ncessaire dans la manire dtudier lopinion
> Notre institut est en quelque sorte n de la rvolution Internet
> Cette rvolution a de fait affect toutes nos pratiques.

LA SOURCE D'UNE VALEUR NOUVELLE :
afin de tirer pleinement profit de ces nouveaux matriaux que
sont les opinions circulant sur le Web 2.0
> Cette multitude de points de vues et dopinions qui sexpriment
et circulent sur la toile reprsentent un formidable stock
dinformations ltat virtuel dont lexploitation ouvrira une nouvel re
dans le domaine de la recherche fondamentale et des tudes
appliques la connaissance du monde social.
Collecter, traiter, analyser ces millions dinformations disponibles
quotidiennement sur la toile permettra de mieux connaitre les
opinions, mesurer ce qui produit ladhsion ou, au contraire, ce qui
suscite le rejet chez les citoyens internautes, connaitre et comprendre
les attentes des consommateurs, et identifier les tendances qui
traversent nos socits

CYBERDEMOCRATIE :
> Le Web 2.0 apparait dsormais comme un espace quasi-illimit
de production et de circulation des opinions
> Cette multitude de points de vues et dopinions qui sexpriment
et circulent sur la toile
> mieux connaitre les opinions, mesurer ce qui produit ladhsion
ou, au contraire, ce qui suscite le rejet chez les citoyens internautes

UN DEFI A RELEVER
les pouvoirs constitus prouvent de plus en plus de difficults
matriser, rguler, voire tout simplement en saisir la porte comme
lillustre le cas des rcentes rvolutions arabes, et les multiples
nouvelles pratiques sociales et citoyenne (manifestations claires,
apro gant)

109












Annexe 2 : Infographie Radarly par Linkfluence

110


111


112


113


114

Rsum

Les instituts qui utilisent les mthodes de fouille dopinion pour sonder lopinion publique
sappuient aujourdhui sur un double discours pour lgitimer leur dmarche. Aussi, les imaginaires
de la dmocratie numrique coupls des discours promotionnels leurs permettent denfermer
dans des botes noires les enjeux techniques, smiotiques et linguistiques de la fouille dopinion.
Pourtant, pour dpasser les controverses qui agitent les dbats autour de lopinion mining, ces
instituts devront accepter de rendre publiques leurs dmarches mthodologiques et intgrer de
nouveaux critres dinterprtation de faon rationaliser et lgitimer leurs mthodes. Ces
ncessaires ajustements permettront alors de transformer la fouille dopinion en enjeu de pouvoir
en rendant possible la modlisation de la circulation des diffrentes forces politiques en prsence
sur le Web.





115

Mots cls

Architexte, Algorithme, Fouille dopinion, Imaginaire, Opinion mining, Opinion publique,
Sentiment Analysis.

Vous aimerez peut-être aussi