Vous êtes sur la page 1sur 32

Manuscrit auteur, publi dans "Rseaux 30, 176 (2012) pp. 29-72" DOI : 10.3917/res.176.

0029

Diversit et concentration de l'information sur le web. Une analyse grande chelle des sites d'actualit franais.
Emmanuel Marty (Univ. Nice), Franck Rebillard (Univ. Paris 3), Stphanie Pouchot (Univ. Lyon 1), Thierry Lafouge (Univ. Lyon 1) Linternet a pris une place croissante en tant que mdia dinformation, et suscite ce titre de nombreuses interrogations. Celles-ci sont largement motives par la volont de mieux cerner son rle dinterface entre un espace public en possible reconfiguration (Flichy, 2008 ; Cardon, 2010 ; Mige, 2010) et des industries culturelles et mdiatiques en prise avec de sensibles volutions conomiques et technologiques (Bouquillion, Matthews, 2010 ; Charon, 2010). Dans un tel contexte, la nature de linformation en ligne, et en particulier la diversit des contenus mdiatiques offerts aux internautes, devient une question centrale : l'arrive de nouveaux acteurs sur le terrain de l'information (industriels issus d'autres secteurs, amateurs profitant des facilits d'expression numrique) entrane-t-elle une originalit accrue ou au contraire une certaine redondance des nouvelles ? Autrement dit, en matire d'information en ligne, la quantit est-elle synonyme de qualit ? La question du pluralisme de l'information, et des ses enjeux fondamentaux pour la vie dmocratique, se trouve ainsi pose nouveaux frais avec l'internet. Elle se pose avec acuit sur le web, lieu majeur pour l'information d'actualit en ligne. Les espaces de publication s'y sont dvelopps tous azimuts, empruntant autant la voie du journalisme participatif que de l'agrgation automatise de nouvelles, aux cts des sites de journaux, radios ou tlvisions. En rsulte-t-il pour autant une plus-value informationnelle, en termes d'originalit et de diversit de l'information ? A l'inverse, cette prolifration des espaces de publication sur le web n'a-t-elle pas engendr un vaste systme de re-traitement d'une mme matire premire informationnelle (Rebillard, 2006) ? Le prsent article se donne prcisment pour objectif de dterminer si le pluralisme de linformation est, dans les faits, favoris ou non avec la multiplication des sites web. Elle vient enrichir, pour le cas de la France, une littrature scientifique largement toffe ces dernires annes sur le plan international, passant d'un stade plutt spculatif une dimension empirique de plus en plus aboutie. Le web, opportunit ou menace pour la diversit de l'information ? Le web constitue, indniablement, un lieu potentiel de pluralisme pour l'information. Plusieurs chercheurs se sont en particulier intresss ce que l'amateurisme pouvait apporter l'information en ligne (pour une synthse, cf. Dagiral, Parasie, 2010), travers l'tude des blogs (Serfaty, 2006), ou en questionnant les relations entre blogueurs et journalistes (Reese et al., 2007). Affirmant que les journalistes ne sont prsent plus les seuls matres de lagenda mdiatique en ligne, Bruns (2008) est l'un des auteurs les plus repris ce sujet, Selon lui, le gatekeeping aurait fait place un gatewatching : les internautes contributeurs auraient acquis une capacit de mobilisation collective mme dinfluencer les choix oprs par les journalistes dans la slection de linformation. Dans la mme perspective, linteractivit suppose de l'internet est considre comme un facteur contribuant mettre le dbat dmocratique et lexpression politique au premier plan de linformation mdiatique. Ceci permettrait alors au citoyen de se forger une opinion sur le monde social, ventuellement de prendre part un engagement politique (pour une synthse, cf. Greffet, Wojcik, 2008). L'internet cependant, bien loin d'une peaceful market-place of ideas telle que dnonce par Peters (2004), constitue une arne o diffrents acteurs se livrent une comptition pour

hal-00836651, version 1 - 21 Jun 2013

laccs une tribune mdiatique. Les contenus offerts aux internautes sont d'abord le rsultat du travail ralis par les acteurs de linformation en ligne. Et ils sont trs souvent lis aux sources que constituent les services de communication des organisations et les agences de presse. Leur pouvoir de fixation de lagenda est dans bien des cas inversement proportionnel la capacit matrielle et temporelle des entits mdiatiques produire un contenu propre, ou exploiter de manire crative le matriau discursif qui leur est fourni (Marty, 2010). Cette logique du systme mdiatique, aboutissant une situation assez classique de circulation circulaire de linformation vulgarise par Bourdieu (1996), est rendue encore plus complexe sur l'internet : face au succs d'infomdiaires tels que Google Actualits, la politique des diffrents diteurs est ambige, voire ambivalente, faisant se ctoyer mise en cause dune concurrence considre comme dloyale ctoyant et souci presque obsessionnel dun bon rfrencement, le tout pesant sur la nature des contenus ainsi produits (Smyrnaios, Rebillard, 2009). More is Less ? La ncessaire analyse des informations offertes aux internautes. Prcisment, des travaux plus empiriques se sont employs analyser les contenus d'actualit effectivement offerts sur le web. Tous semblent se rejoindre autour d'un constat assez semblable, rsum dans la formule-titre More is Less d'une des premires recherches cet gard (Paterson, 2007) : davantage de sites certes, mais moins d'informations originales au final. Chris Paterson s'est vertu ds le dbut des annes 2000 analyser les articles produits par les nouveaux entrants dans le domaine journalistique que constituaient les grands sites portails et agrgateurs (AOL, Yahoo, Excite, AltaVista, ...), et les comparer avec les sites de mdias plus tablis (CNN, BBC, ABC, SkyTV, New York Times, ...). Il s'est avr que ces sites reprenaient en grande partie des dpches d'agence, et dans des proportions croissantes au fil du temps : de 2001 2006, la part de textes provenant de Reuters et d'Associated Press passe de 34% 50% dans les articles publis par les sites de mdias, et de 68% 85% dans les articles publis par les portails et agrgateurs. Plus rcemment, un groupe de chercheurs conduit par Natalie Fenton (2009) s'est pench sur les sites d'information britanniques. En sus des sites de mdias imprims et audiovisuels, et des portails/agrgateurs, ont t pris en compte des sites d'information alternative tels que IndyMedia ou OpenDemocracy. Ces derniers sont les seuls ne pas suivre l'agenda mdiatique dominant de l'anne 2008 au Royaume-Uni, ils sont aussi les moins consults. Les autres sites, l'exception notable de celui de la chane participative Current TV et de la page "Have Your Say" de la BBC, prsentent des contenus trs frquemment similaires (crits comme images) et les traitent partir d'un angle souvent unique. Les chercheurs relient cette similarit dans l'information analyse aux pratiques professionnelles de veille sur la concurrence observes paralllement dans les salles de rdaction. La mme pratique de monitoring a t mise en relief par Pablo Boczkowski (2010) lors de son enqute ethnographique au sein du quotidien argentin Clarn, et plus particulirement dans les bureaux du service web Ultimo Momento jonchs d'crans scrutant la concurrence jusqu'aux chanes d'information en continu. Un phnomne d'imitation dans les contenus en dcoule : Boczkowski l'a observ en 2005 lors d'une comparaison entre les sites de Clarn, La Nacion.com (autre grand quotidien argentin) et Infobae (site d'information sans quivalent papier). Il le rattache galement l'anticipation d'une attente d'information factuelle et rapidement renouvele en rception, en raison des habitudes de consultation de l'internet sur le lieu de travail. Une semblable incitation la productivit dans l'information en ligne, et son corollaire consistant s'appuyer essentiellement sur des dpches d'agence ou des informations de seconde main, avaient t documents par des enqutes auprs de cinq sites d'information en Allemagne (Quandt, 2008).

hal-00836651, version 1 - 21 Jun 2013

C'est une mme dmarche, visant mettre l'preuve des faits l'hypothse d'une contribution du web au pluralisme de l'information, qui a anim notre propre recherche en France. A la diffrence des travaux voqus prcdemment, nous ne traiterons toutefois dans cet article que de l'analyse des informations offertes sur le web. Les deux autres volets, connexes, de la production et de la rception de l'information, sont abords dans deux autres articles de ce dossier (Rieder, Smyrnaios, 2012; Smyrnaios, 2012). Laissant donc momentanment de ct les ressorts sociaux de l'information, nous centrons notre analyse de discours sur les informations produites en les rapportant leurs sites nonciateurs, en allant plus loin dans cette voie que ne l'ont fait les recherches passes en revue. Afin de pouvoir pleinement statuer sur le degr de diversit des informations disponibles sur le web, nous avons fait en sorte d'inspecter l'ensemble des sites proposant des contenus d'actualit. Cela ncessitait, par rapport aux recherches existantes, d'largir trs sensiblement la focale afin d'intgrer des sites susceptibles de proposer une information plus originale tels que les blogs. Il s'est agi, en somme, de dplacer le centre de gravit de l'analyse vis--vis des sites de mdias "traditionnels", encore trop souvent pris comme rfrents de dpart. Les rsultats livrs dans cet article prsentent ainsi un caractre novateur. Ils sont issus de l'apprhension exhaustive d'un espace national d'informations d'actualit sur le web, et permettent ce titre de pleinement embrasser la problmatique de l'adquation entre multiplicit des sites et diversit des nouvelles. Ils constituent l'aboutissement d'une recherche au long cours, base du programme Ipri2, qui a dj t prcde par des travaux exploratoires (Marty et al., 2010 ; Smyrnaios et al., 2010). Ces premires incursions dans l'analyse de l'information sur le web nous ont permis dprouver la validit dune typologie des sites dactualit et dtablir des corrlations entre modes de publication de linformation et nature des contenus offerts. Nanmoins, nous pointions dans nos prcdents travaux un certain nombre de limites, dpasses dans les dernires phases de notre recherche. Dune part, le nombre de sites web considrs a t substantiellement augment, d'un chantillon d'environ 60 prs de 200, jusqu' reprsenter la totalit de la population des sites proposant des informations gnrales et politiques en France. D'autre part, la priode d'observation s'est tale sur une dizaine de jours conscutifs (du 7 au 17 mars 2011), plutt que sur quelques journes isoles, et a ainsi permis de prendre en compte tous les rythmes de publication des sites, y compris ceux beaucoup plus lents des blogs. Au final, nous avons ainsi dispos d'un terrain mme de fournir une valuation globale, pour la France, du niveau de pluralisme de l'information sur le web.

hal-00836651, version 1 - 21 Jun 2013

Programme de recherche IPRI - Internet, pluralisme et redondance de l'information (ANR-09-JCJC-0125-01b), soutenu par l'Agence nationale de la recherche et regroupant des laboratoires en information-communication (CIM, universit Paris 3 ; ELICO, universit de Lyon ;LERASS, universit Toulouse 3 ; CRAPE, universit Rennes 1 ; GRICIS, UQAM Montral) et en informatique ( LIRIS, INSA Lyon). Ce programme ANR (2009-2012) avait t prcd par la constitution d'une quipe-projet soutenue en 2008 par la MSH Paris-Nord.

SAISIR LE PLURALISME DE L'INFORMATION SUR LE WEB : ELEMENTS DE METHODE Notre vise dans cette recherche a donc t d'pouser le spectre complet des sites d'actualit, dans toute leur diversit. Ceci afin de voir si lui fait cho une diversit dans les informations mises l'agenda mdiatique, dans les faons de rendre compte des diffrents vnements survenant dans le monde social, mme dclairer le jugement des citoyens. Une analyse de l'agenda mdiatique, adapte la configuration du web On sait notamment depuis Berger et Luckmann (1966) que l'activit de construction sociale de la ralit, par le biais du langage et des mdias, aboutit livrer un miroir invitablement dformant et pluriel de notre environnement (Vron, 1981; Charaudeau, 2005). Les diffrentes tapes de l'laboration des nouvelles, la slection des sujets dignes dtre traits, les critres de la newsworthiness voque par Gamson et Modigliani (1989), sont troitement dpendantes des logiques conomiques et ditoriales des diffrents mdias. Cette dimension de lactivit mdiatique, situe en amont de la diffusion de linformation, est peu visible au public. Elle nen a pas moins un rle essentiel : celui de dfinir la physionomie de lagenda mdiatique. Depuis les travaux de McCombs et Shaw (1972) et leur thorisation de lagenda-setting, de nombreuses tudes ont dmontr la tendance des principaux mdias traiter des mmes sujets dactualit au mme moment (Dearing, Rogers, 1992). Il sagit de ce que Scheufele (2000) a en ralit identifi comme tant lactivit dagenda-building, littralement de construction de lagenda , le terme setting dsignant plutt les corrlations entre les sujets privilgis par les mdias et ceux considrs comme importants par le public. Sans prjuger de la manire dont peut se rpercuter l'agenda-setting auprs des publics, notre propos ici est bien didentifier ltat de lagenda-building en ligne, en se donnant pour objet de questionner les spcificits des diffrents sites dinformation. L'analyse de l'agenda mdiatique sur le web a donc du tre rapporte lensemble des types de sites d'actualit. Plus prcisment encore, dans une optique d'tude du pluralisme de l'information web en France, il s'est agi de rpertorier tous les sites publiant des informations et/ou commentaires sur lactualit gnrale et politique, caractre essentiellement national. Une apprhension de l'ensemble des catgories de sites Le paysage des sites web dinformation politique et gnrale avait fait l'objet d'un premier recensement (Marty et al., 2010) distinguant les catgories de presse en ligne (versions internet de mdias existants), webzines (publications collectives exclusivement internet), blogs (publications individuelles exclusivement internet), sites participatifs (publications collaboratives exclusivement internet), portails (composantes informationnelles de plateformes multiservices), et agrgateurs (regroupements automatiss d'informations d'actualit). Cette premire catgorisation s'appuyait sur des typologies relativement anciennes (Deuze, 2003 ; Rebillard, 2006) qui mritent d'tre actualises. Tout dabord, la frontire entre agrgateurs et portails est devenue plus floue, dans la mesure o ces derniers emploient eux aussi des procds d'automatisation de la recherche d'actualits. Ces deux types de site officient de plus selon une logique similaire, qui est celle de linfomdiation telle quvoque plus haut. Dans la prsente tude, portails et agrgateurs sont donc rassembls et dsigns sous lappellation commune dinfomdiaires. Par ailleurs, en ce qui concerne lappellation presse en ligne, on peut lgitimement avancer quelle ne traduit plus suffisamment la monte en puissance des versions internet de mdias audiovisuels. Il est

hal-00836651, version 1 - 21 Jun 2013

hal-00836651, version 1 - 21 Jun 2013

alors sans doute prfrable demployer la formule plus large de mdias en ligne, recouvrant le dploiement sur la toile de la presse crite mais aussi de la radio et de la tlvision. Paralllement, une nouvelle appellation, celle de pure players, s'est progressivement impose jusqu' subsumer les catgories webzines et participatifs (Ouakrat, 2011), lesquelles incluent dsormais un degr variable de modration des contenus par la communaut des internautes ou par la rdaction professionnelle du site. Pour autant, les supports de diffusion ont galement volu : plusieurs pure players dveloppent ou ont un temps dvelopp une version crite (Bakchich, Rue89), rendant inadapte l'appellation de sites exclusivement internet. Par consquent, l'appellation de sites ns en ligne (Mercier, Pignard-Cheynel, 2011), ou plus exactement natifs de l'internet, leur sera prfre. Nous proposons donc prsent une catgorisation mise jour et simplifie, distinguant les mdias en ligne, les sites natifs de linternet, les blogs et les infomdiaires. A lintrieur de cette catgorisation, une attention particulire sera toutefois porte au caractre professionnel ou amateur3 de lnonciateur, nous amenant parfois distinguer certains sites lintrieur dune mme catgorie. Cest particulirement vrai pour la catgorie des blogs, lesquels peuvent tre des lieux dexpression individuelle des journalistes professionnels, hbergs par le site de leur titre de presse (ex : Yvan Riouffol sur le site du Figaro), ou relever dune initiative individuelle et amateure (blogs Partageons mon avis, A perdre la raison, CSP, etc.). C'est le cas galement de plusieurs sites natifs de linternet, voire de certains infomdiaires, tels que Rezo.net, qui compile des publications la fois amateures et professionnelles. Le recensement des sites et leur exploration Une fois cette typologie dtermine, la recherche des sites web d'information gnrale et politique, caractre essentiellement national, a vis l'exhaustivit. Trois tapes mthodologiques se sont succd cette fin. Une premire liste de sites a d'abord pu tre tablie sur la base des sites identifis lors des travaux exploratoires prcdents de 2008-2010. Cette base initiale a t contrle et ainsi mise jour en janvier 2011. Elle a abouti l'intgration des 43 mdias en ligne et des 14 infomdiaires de notre chantillon final de sites. Des mdias natifs de linternet et des blogs avaient t galement reprs lors de nos prcdents travaux : ils ont eux aussi t soumis un nouvel examen en janvier 2011. Mais pour ces deux dernires catgories, blogs et sites natifs de l'internet, des dmarches complmentaires ont t mises en uvre. La mthode du navi-crawling4, consistant en une exploration systmatique des liens hypertextuels d'un site, a t employe. Plus prcisment, elle a t applique un chantillon-racine constitu par les blogs occupant les premires places du classement Wikio, dont lactivit est atteste et dont la place est relativement centrale dans la blogosphre franaise. Ainsi, plusieurs sites (majoritairement des blogs, mais galement certains sites natifs de l'internet) ont t dcouverts et intgrs la suite de ce navi-crawling.

Sachant que l'activit et le statut ne se recouvrent pas toujours dans le domaine journalistique (Ruellan, 2007), nous avons class comme amateurs les non-professionnels du journalisme au sens dindividus ntant pas rmunrs titre principal pour cette activit, ft-elle reconnue ou non par les instances de conscration ou de labellisation statutaire (pouvoirs publics, structures paritaires comme la Commission de la carte dide ntit professionnelle des journalistes franais, etc.). Par consquent, l'intrieur de cette catgorie transversale des amateurs, on pourra trouver la fois des passionns exerant bnvolement une activit de production d'information d'actualit et des individus ventuellement rmunrs pour cette activit sans que cela ne constitue pour autant leur activit principale (c'est le cas notamment de travailleurs intellectuels comme les juristes ou les chercheurs). 4 A laide de lextension Firefox dveloppe par Web Atlas: http://webatlas.fr/wp/navicrawler/

Enfin, d'autres blogs et sites natifs de l'internet ont t ajouts partir de liens points par les internautes sur Twitter. Ce travail s'est appuy sur la Twitter REST API et son exploitation depuis la plateforme Tweetism dveloppe par Bernhard Rieder et Raphal Velt. Ces multiples mthodes ont permis au final didentifier 110 blogs et 42 sites natifs de linternet rpondant aux critres prcdemment voqus. Ceci a port le nombre total de sites recenss 209 en fvrier 2011, un ensemble que l'on peut estimer trs proche de la population entire des sites franais ddis l'information gnrale et politique au moment de notre priode d'observation (7 au 17 mars 2011). La collecte des articles Pour procder l'analyse des informations publies par ces sites, un logiciel a t spcialement dvelopp dans le cadre de notre projet par les chercheurs du laboratoire d'informatique LIRIS5. Ce logiciel, appel IPRI - News Analyzer (IPRI-NA), a dans un premier temps permis de collecter les articles publis sur les flux RSS des sites. Dans l'idal, il aurait t prfrable de collecter les articles publis directement sur les pages web, mais les procds techniques existants taient peu satisfaisants, charriant avec les articles et illustrations des encarts publicitaires ou des liens hypertextuels susceptibles de compltement brouiller l'analyse. Les flux RSS fournissent de ce point de vue un rendu bien plus adquat, avec titre de l'article, descriptif, lien vers l'URL d'origine, et date de publication. Pour chacun des sites a t capt le flux RSS A la Une ou Actualits rassemblant les articles correspondant notre critre d'information gnrale et politique ( la diffrence de flux RSS thmatiques sur les informations conomiques, sportives, culturelles, etc.). La collecte sest droule sur la quasi-totalit du mois de mars 2011. Comme indiqu prcdemment, l'analyse en elle-mme a port sur une priode d'une dizaine de jours conscutifs afin d'intgrer les temporalits de publication respectives des diffrentes catgories de sites. De faon alatoire, la priode du 7 au 17 mars a t dlimite, planifie plusieurs semaines avant la collecte afin de s'assurer de son bon droulement pratique (ncessit pour les chercheurs de prvoir une disponibilit pour surveiller le bon fonctionnement du logiciel durant cette priode). Cette priode s'est rvle comporter le tsunami au Japon en son sein (vendredi 11 mars). Sa physionomie a alors donn la possibilit de travailler d'une part sur des journes ordinaires au niveau de l'actualit, en amont du tsunami, ainsi que d'autre part sur les journes plus exceptionnelles qui ont suivi. Aprs collecte et vacuation de quelques artefacts techniques, le corpus comprend 37 569 articles sur la priode du 7 au 17 mars 2011, publis par 199 sites6 rpartis entre les quatre catgories : mdias en ligne, sites natifs de linternet, blogs, et infomdiaires. La classification des articles en sujets d'actualit Les milliers d'articles ainsi collects ont t soumis une analyse de discours, afin de dterminer les sujets d'actualit abords par les diffrents sites web, et de reconstituer partir de l l'agenda mdiatique. La notion de sujet d'actualit constitue donc la pierre angulaire de ce travail, la fois oprateur de la classification smiotique des articles, et unit de base de

hal-00836651, version 1 - 21 Jun 2013

Le logiciel IPRI News Analyzer (IPRI-NA) a t dvelopp par Samuel Gesche, Eld Egyed-Zsigmond et Cyril Laitang. Il est distribu sous licence Creative Commons http://liris.cnrs.fr/ipri/pmwiki/index.php?n=Public.IpriNA 6 Sur les 209 sites initialement identifis, seuls huit blogs et deux sites natifs de l'internet nont pas vu d'article publi et collect par le logiciel IPRI-NA pendant la priode en question. La liste des 199 sites ayant publi est fournie en annexes.

l'agenda mdiatique pour les analyses ultrieures. Elle ncessite ce titre d'tre dfinie de faon taye.
La notion de sujet d'actualit La notion de sujet d'actualit a t construite sur la base d'une distinction entre cadrages mdiatiques primaire et secondaire, au sein du processus de constitution mdiatique de la ralit (Arquembourg, 2011). Le cadrage primaire se rapporte au concept de fait , lequel est issu de lactivit de perception dune exprience par les sens (Goffman, 1991) et va faire l'objet d'une slection journalistique parmi les occurrences du rel (Neveu, Qur, 1996), au-del de son traitement diffrenci par chacun des mdias. Le cadrage secondaire, en revanche, correspond ce traitement mdiatique d'un mme fait (Esquenazi, 2002 ; Marty et al., 2010), auquel les journalistes apposent des angles, des lignes ditoriales, des points de vue (Ringoot & Rochard, 2005). Un sujet d'actualit est ici entendu comme un fait pass au prisme d'un cadrage mdiatique primaire, par-del le cadrage secondaire choisi pour le traiter. Les articles s'tant rejoints dans le mme cadrage mdiatique d'un fait ont ainsi t considrs comme relevant d'un mme sujet d'actualit, quel que soit le cadrage mdiatique secondaire adopt par chacun d'eux. Par exemple, tous les articles abordant l'ouverture du procs de Jacques Chirac concernant les emplois fictifs la Ville de Paris ont t regroups, considrs comme relevant d'un mme sujet d'actualit, et diffrant par exemple d'articles sur les soupons d'espionnage au sein de l'entreprise Renault ou plus encore d'articles sur le conflit en Libye. Ceci en sachant que, au sein de ce sujet d'actualit Procs Chirac - emplois fictifs, certains articles prsenteront un point de vue svre vis--vis de l'ancien Prsident de la Rpublique, tandis que d'autres se montreront bienveillants eu gard l'tat de sant de l'accus ou l'antriorit des faits jugs. Le passage par la notion de sujet d'actualit permet ainsi de reconstituer l'agenda mdiatique, d'valuer l'importance relative de chaque sujet dans l'actualit du web. Il peut galement tre un pralable des analyses plus approfondies s'intressant cette fois aux traitements diffrencis d'un mme sujet d'actualit par chacun des mdias, objectif d'un autre article de ce dossier (Touboul et al., 2012).

hal-00836651, version 1 - 21 Jun 2013

Partant de cette dfinition du sujet d'actualit, la classification des articles a alors t tablie sur chacune des journes, selon une mthode semi-automatise grce au logiciel IPRINA. Par rapport d'autres recherches portant sur la diversit de l'information en ligne, principalement menes aux Etats-Unis, notre mthode se situe mi-chemin entre un traitement lexicomtrique compltement automatis (cf. Leskovec et al., 2009, propos de la mdiatisation de la campagne prsidentielle US en 2008 entre blogs et sites web), et ce qui resterait au stade d'une analyse manuelle par codage thmatique (cf. Carpenter, 2010, comparant les articles des sites de mdias traditionnels et ceux publis dans les sites de mdias citoyens). Nous avons pour notre part procd un premier dfrichage informatique des similarits lexicales entre articles, permettant de traiter automatiquement un tiers de notre corpus, avant de vrifier cette premire classification et de la complter par un codage manuel, en sujets d'actualit, des deux-tiers restants du corpus8. Une telle mthode, mme fonde sur des critres thoriques relativement solides, pose la question de larbitraire du codeur au moment de la classification des articles en sujets. Il a donc t dcid de procder une mesure statistique de la fiabilit intracodeur et intercodeurs. Le test intracodeur consistait en une nouvelle classification par le mme codeur plusieurs mois aprs (juillet 2011 / novembre 2011), tandis que le test intercodeurs tablissait une comparaison avec un second codeur. Ces tests ont abouti un taux de

A titre informatif : le codage manuel d'une journe moyenne de la priode d'observation (autour de 3 500 articles classer en sujets d'actualit) demande l'quivalent de cinq jours de travail temps plein. Ce travail, rpt pour les onze journes, a t principalement ralis par Emmanuel Marty lors de son post-doctorat au sein du programme Ipri.

cohrence intra-codeur de 96,5% et de plus de 92 % pour la cohrence intercodeurs, taux trs levs accrditant la fiabilit de la classification9.

LA PHYSIONOMIE DE L'AGENDA MEDIATIQUE SUR LE WEB La classification des articles en sujets d'actualit nous permet d'valuer le pluralisme de l'information en ligne de faon quantitative. En nous inspirant de la typologie labore par Benhamou et Peltier pour l'valuation de la diversit culturelle (2006), nous retenons trois critres similaires pour le pluralisme de l'information. Le critre de varit, premier critre, sera ici constitu par le nombre de sujets d'actualit abords. Le second critre, celui de l'quilibre, concernera dans notre cas la rpartition des articles au sein des diffrents sujets d'actualit, indiquant le poids relatif de ces derniers entre sujets majeurs occupant la Une de l'actualit sur le web et sujets mineurs relgus dans les trfonds de l'internet. Un troisime critre, celui de la disparit, vise identifier les diffrents modes de traitement pour un mme sujet. Ncessitant une analyse de nature plus qualitative, ce dernier critre de disparit de traitement journalistique fait l'objet d'un autre article dans ce dossier (Touboul et al., 2012). Le prsent travail est donc centr sur la varit et l'quilibre des sujets d'actualit. Cette mesure quantitative du pluralisme de l'information aboutit dessiner l'agenda mdiatique tel qu'il s'est prsent sur le web, durant notre priode d'observation, entre le 7 et le 17 mars 2011. La varit des sujets abords au jour le jour Rappelons que, au cours de cette priode, 199 sites ont publi un total de 37 569 articles, reprsentant au final 5 481 sujets d'actualit. Sur chaque journe, ce sont entre 300 et 700 sujets d'actualit diffrents qui sont abords sur l'internet, tmoignant d'un niveau lev de varit ditoriale. Dans le dtail, le dcompte s'effectue comme suit (voir tableau 1). Journe Nb articles Nb sujets Nb sites Lundi 7 mars 3418 593 143 Mardi 8 mars 3496 625 145 Mercredi 9 mars 3552 670 141 Jeudi 10 mars 3369 678 140 Vendredi 11 mars 145 4068 573 Samedi 12 mars 2415 342 117 Dimanche 13 mars 2417 306 116 Lundi 14 mars 3527 534 152 Mardi 15 mars 3757 562 141
9

hal-00836651, version 1 - 21 Jun 2013

Les tests ont t raliss sur un chantillon constitu avec une mthode alatoire simple, sur un chantillon de 350 articles soit environ 10% de la production ditoriale dune journe, celle -ci ayant t galement t tire au hasard puisque chaque journe prsente globalement les mmes caractristiques. Les taux obtenus sont levs car les probabilits, au vu de taille de lchantillon, donnent une er reur infrieure 3%. Ces tests ont permis d'valuer la concordance dans l'indexation des articles en catgories (sujets) prdfinies. Pour avoir un test complet, il aurait galement fallu valuer la pertinence de chacune des catgories, au moment mme de leur laboration (cration d'un sujet). Toutefois, une garantie est apporte par l'expertise du chercheur impliqu dans la dfinition des sujets en 2011 suite sa participation aux premires phases des travaux en 2008 et 2010 et leur caractre collectif : la dfinition des sujets a t faite pour les corpus concerns en collaboration avec un autre chercheur du programme Ipri ainsi qu'avec la responsable du traitement documentaire TV l'Ina (nos remerciements Dominique Fackler pour sa contribution cette tape du projet).

Mercredi 16 mars Jeudi 17 mars

3723 3827

556 613

144 141

Tableau 1 - Varit des sujets abords entre le 7 et le 17 mars 2011 Le nombre d'articles est relativement stable pour chacune des journes, compris entre 3300 et 3900, hormis lors de trois journes particulires. Deux journes, dabord, se caractrisent par un nombre nettement plus rduit d'articles (environ 2 400). Il s'agit des deux journes de week-end, lors desquelles les rdactions en ligne sont beaucoup moins fournies en personnel. Une autre journe s'avre ensuite exceptionnelle durant notre priode d'observation : le vendredi 11 mars 2011, jour du tsunami au Japon, o 4068 articles ont t produits. Sur le plan des sujets, cette journe constitue paralllement un moment o la varit ditoriale baisse trs nettement, perdant une centaine de sujets d'actualit par rapport la veille. Cette dcrue se poursuit le lundi, o la varit atteint son plus bas niveau -except le week-end- avec 534 sujets d'actualit. Ce nombre plancher de sujets correspond, l'inverse, un nombre plafond de sites : 152 d'entre eux ont publi des articles ce jour-l. L'vnement exceptionnel survenu au Japon a donc suscit la production chez nombre de sites et focalis leur attention sur ce sujet prcis, ainsi que sur les sujets affrents (dbat sur le nuclaire aprs l'accident des centrales suite au tsunami, voir tableau 2) dans les jours suivants. Rang 1 2 3 4 5 6 7 8 9 10 Sujet d'actualit Accidents de centrales au Japon et risque nuclaire Conflit en Libye Violent sisme au Japon et tsunami Le dbat sur le nuclaire relanc en France et dans le monde Un sondage Harris donne Marine Le Pen en tte des intentions de vote Procs Chirac emplois fictifs Affaire Renault Conflit en Cte d'Ivoire La campagne des lections cantonales Manifestations et rpression au Bahren Nb articles 4147 4131 3101 1031 962 858 757 683 571 475

hal-00836651, version 1 - 21 Jun 2013

Tableau 2 - Sujets d'actualit majeurs entre le 7 et le 17 mars 2011 (top 10) Le vendredi 11 mars (et le week-end qui l'accompagne) a donc constitu une csure. Avant, c'est--dire entre le lundi 7 et le jeudi 10 mars, s'tale une phase d'actualit ordinaire, avec une moyenne quotidienne de 3459 articles pour 641 sujets. La phase qui suit, entre le lundi 14 et le jeudi 17 mars, affiche elle des moyennes de 3708 articles pour 566 sujets. Avec un nombre plus lev d'articles pour moins de sujets, la deuxime phase se caractrise donc par une plus grande concentration de l'information en ligne. Cette modalit particulire de distribution de l'information renvoie au deuxime critre de pluralisme, l'quilibre, sur lequel nous allons nous pencher de faon plus prcise. Un agenda mdiatique en dsquilibre quotidien L'agenda mdiatique, sur le web, est constitu d'une multitude de sujets d'actualit comme nous venons de le voir. Reste maintenant dterminer comment cet agenda mdiatique est structur, en analysant la place accorde chacun des sujets. Cette hirarchie de l'information

sera value ici en considrant l'importance d'un sujet d'actualit l'aune du nombre d'articles qu'il rassemble. De telles mesures font apparatre les rsultats suivants : un nombre rduit de sujets concentre la majorit des articles et, inversement, de trs nombreux sujets sont abords de faon isole dans un seul article ou une poigne d'articles. Cette dualit entre forte concentration d'un ct et extrme dispersion de l'autre, sur laquelle nous nous sommes dj arrts pour notamment montrer son caractre relativement classique au regard de l'hypothse de longue trane (Marty et al., 2010; Smyrnaios et al., 2010), correspond de faon plus gnrale des distributions partiennes de type 20/8011. Concernant le pluralisme de l'information sur le web, cela signifierait que 20% des sujets rassemblent eux seuls environ 80% des articles. En mars 2011, les journes du 7 au 10 mars prsentent des valeurs semblables : 20% des sujets rassemblent entre 80 et 83% des articles. En revanche, lors des journes du 11 au 17 mars, 20% des sujets rassemblent entre 85 et 88 % des articles (voir tableau 3).
Date Lundi 7 mars Mardi 8 mars Mercredi 9 mars Jeudi 10 mars Vendredi 11 mars Samedi 12 mars Dimanche 13 mars Lundi 14 mars Mardi 15 mars Mercredi 16 mars Jeudi 17 mars % d'articles rassembls par 10% des sujets 75 73 71 71 80 81 82 79 79 80 80 % d'articles rassembls par 20% des sujets 83 81 80 80 86 87 88 85 86 86 85 % d'articles rassembls par 50% des sujets 91 91 91 90 93 93 94 92 93 93 92

hal-00836651, version 1 - 21 Jun 2013

Tableau 3 - Concentration des articles dans les principaux sujets entre le 7 et le 17 mars 2011 Nous retrouvons ici la csure identifie prcdemment : un surcrot de concentration de l'information intervient partir du vendredi 11 mars, jour du tsunami au Japon. On peut donc considrer que cet vnement est l'origine d'une telle surconcentration de l'information. Cette hypothse est taye par l'observation du premier dcile des sujets lors de chaque journe : 10% des sujets rassemblent entre 71 et 75% des articles du 7 au 10 mars, puis entre 79 et 82% des articles du 11 au 17 mars. Ceci laisse penser que la diffrence entre les journes se joue bien au niveau du premier dcile de sujets d'actualit, comprenant ceux relatifs au tsunami, aux accidents dans les centrales et au dbat sur le nuclaire, compter du 11 mars et par la suite. Par ailleurs, si l'on s'intresse cette fois la mdiane des sujets, on remarque que 50% des sujets ont rassembl entre 90 et 91% des articles du 7 au 10 mars, puis entre 92 et 94% du 11 au 17 mars. Donc nouveau une csure autour du 11 mars, mais moins prononce que pour les 10% et 20 % de sujets principaux. En miroir, cela veut aussi dire que l'autre moiti des sujets n'est vraiment aborde qu'avec parcimonie, toujours confine dans moins d'un dixime des articles. Ceci confirme le dsquilibre quotidien de l'agenda mdiatique en ligne, entre surexposition d'une minorit de sujets d'actualit et confidentialit de la majorit d'entre eux.
Par exemple, avec un coefficient dajustement de 0,91, les mathmatiques (Egghe, 2005) permettent de dire : 10% des sujets totalisent 81% des articles, 20% des sujets 86,4% des articles, et enfin 50% des sujets reprsentent 93,9% des articles.
11

LA CONTRIBUTION DES DIFFERENTS SITES AU PLURALISME L'agenda mdiatique se caractrise donc, sur le web, par une sorte de grand cart quotidien. Il est constamment tir entre la focalisation sur une minorit de sujets ultra-mdiatiss, et l'ouverture une myriade d'autres sujets beaucoup plus originaux. Ce tableau gnral, que nous venons de dessiner, comprend toutefois plusieurs nuances de couleurs. Elles correspondent la contribution de chacun des sites observs. Ceux-ci psent d'un poids respectif fort diffrent sur le degr de pluralisme gnral mesur prcdemment. Nous allons prsent nous pencher sur ces diffrents sites de faon plus individualise, faisant succder l'analyse du pluralisme externe ou inter media un regard sur le niveau de pluralisme interne ou intra medium (Mc Quail, 1992) propre chaque site. Eclectisme ditorial des sites Notre premier critre d'valuation quantitative du pluralisme, la varit, tient au nombre de sujets abords. Appliqu de faon individuelle chacun des sites, il fournit des rsultats intressants et en mme temps perfectibles. Reconnaissons donc tout d'abord un avantage un tel calcul : il permet de reprer quels sites ont abord le plus grand nombre de sujets au cours de la priode d'observation (entre le 7 et le 17 mars 2011). Dans les 5 premires places (voir tableau 4), on retrouve alors quatre infomdiaires (Free12, Wikio, Voila, Newspeg) avec prs de 500 sujets, voire plus, abords au cours de cette priode d'une dizaine de jours. Nous remarquons aussi dans le haut de ce classement, aux cts de versions numriques de plusieurs mdias appartenant des groupes industriels de communication (Lagardre avec Le Journal du Dimanche et Europe 1, Roularta avec L'Express et L'Expansion), plusieurs sites natifs de l'internet prsentant une forme participative d'ouverture aux contributions d'amateurs (Franois Desouche, Bellaciao, Agora Vox)13. Site Free Actualits Le Journal du Dimanche Wikio Actualits Voila Actualits Newspeg Une Franois Desouche FranceSoir Minutebuzz Le Monde Bellaciao Agora Vox Europe 1 Le Post 20 minutes
12

hal-00836651, version 1 - 21 Jun 2013

Catgorie de site d'actualit Infomdiaire Mdia en ligne Infomdiaire Infomdiaire Infomdiaire Site natif de l'internet Mdia en ligne Site natif de l'internet Mdia en ligne Site natif de l'internet Site natif de l'internet Mdia en ligne Site natif de l'internet Mdia en ligne

Nb sujets 898 683 576 563 494 413 390 350 274 253 249 244 239 226

Le nombre de sujets obtenus pour Free est en partie biais. Cet infomdiaire agrge dans son fil d'actualits gnrales et politiques des informations d'intrt la fois national et local. Cette dernire particularit, consistant ajouter des nouvelles locales, explique en partie pourquoi il aborde un nombre de sujets bien suprieur aux autres sites dont les fils d'actualits sont exclusivement nationaux. 13 Le Post occupait une place ambivalente cet gard, site natif de l'internet vocation participative tout en tant intgr la filiale d'un groupe industriel de communication (Le Monde Interactif).

Le Point Le salon beige Le Figaro Le Nouvel Observateur L'Expansion L'Express

Mdia en ligne Blog Mdia en ligne Mdia en ligne Mdia en ligne Mdia en ligne

223 209 207 201 199 182

Tableau 4 - Sites ayant abord le plus de sujets entre le 7 et le 17 mars 2011 (top 20) Inversement, lorsque l'on s'intresse cette fois aux sites ayant abord le moins de sujets au cours de la priode, c'est--dire la queue d'un tel classement, apparaissent 101 sites avoir abord 11 sujets ou moins au cours de la priode de 11 jours, c'est--dire au mieux un sujet par jour. Ces derniers sont trs majoritairement des blogs (prcisment 78 blogs sur 101 sites). Une telle diffrence dans le nombre de sujets abords, selon les catgories de sites, s'explique en grande partie par leur volume de production d'articles, lui-mme trs ingal (voir tableau 5). Les infomdiaires se caractrisent par une forte productivit, continue tout au long de la journe, s'alimentant le plus souvent automatiquement auprs d'diteurs tiers. Les blogs fonctionnent avec un rythme de publication beaucoup plus tal et moins rgulier, que notre priode d'observation allonge onze jours permet tout juste d'embrasser pour certains d'entre eux. Catgorie de site d'actualit Infomdiaires Mdias en ligne Sites natifs de l'internet Blogs Total Nb articles Nb sites Moyenne/site Moyenne quotidienne 11 557 14 825 75 19 432 43 452 41 5 149 40 129 12 1 431 102 14 1 37 569 199

hal-00836651, version 1 - 21 Jun 2013

Tableau 5 - Production d'articles par catgorie de site entre le 7 et le 11 mars 2011 Ce constat amne considrer la valeur brute du nombre de sujets abords comme un indicateur ncessaire mais non suffisant de pluralisme interne. Une solution consiste le pondrer par le nombre d'articles produit par chacun des sites. On arrive ainsi une valeur relative apte reflter plus quitablement le niveau de varit d'un site, son niveau d'clectisme ditorial en quelque sorte. En procdant un calcul de ce type, on aboutit un nouveau classement qui place dans sa premire partie tous les sites ayant produit autant d'articles qu'ils n'auront abord de sujets. Au total, 63 sites auront respect cette ligne de conduite ditoriale consistant consacrer un seul article chaque sujet abord. Il s'agit pour l'essentiel de blogs et, dans une moindre mesure, de sites natifs de l'internet. Parmi eux, le Bondy Blog se distingue en particulier par le fait d'avoir produit un nombre assez consistant d'articles sur la priode (24 articles en 11 jours), chaque fois sur un sujet diffrent (24 sujets diffrents au total donc). L'clectisme ditorial de ce site au niveau des contenus, tel que mesur ici, pourrait tre mis en relation avec son mode de ralisation singulier, associant professionnels et amateurs, ancr dans des ralits sociales, celles des banlieues , bien diffrentes de celles caractrisant d'autres expriences de journalisme participatif (Sedel, 2011). A l'inverse, en queue de ce nouveau classement vont se retrouver des sites qui eux s'illustrent par un certain matraquage ditorial, n'hsitant pas multiplier les articles autour d'un mme sujet. Parmi eux se trouvent assez logiquement des infomdiaires et plus prcisment

des agrgateurs de nouvelles, comme Google Actualits (14 articles par sujet en moyenne) ou actu2424 (7 articles par sujet). Les rejoignent des sites de mdias professionnels connus pour tre trs actifs dans la production d'articles afin de, prcisment, favoriser leur rfrencement auprs des agrgateurs et moteurs de recherche (Smyrnaios, Rebillard, 2009). RTL (13 articles par sujet) et Le Nouvel Observateur (10 articles par sujet) sont par exemple les seuls passer la barre des 10 articles par sujet, la suite de Google justement. Le critre de varit, ainsi pondr par le nombre d'articles produits, constitue un indicateur de l'clectisme ditorial caractrisant la production de chaque site. Permettant d'valuer la propension d'un site aborder plusieurs sujets d'actualit, il ne renseigne toutefois pas sur la nature de ces derniers. Leur rpartition entre sujets utlra-mdiatiss et sujets rares constitue un critre complmentaire, critre d'quilibre interne, l'valuation du pluralisme d'un site d'actualit. Originalit ditoriale des sites Le critre d'quilibre, dans le cadre d'une apprhension externe de l'agenda mdiatique gnral, nous amenait identifier la distribution des articles entre les diffrents sujets, certains sujets s'avrant dominants tandis que d'autres se montraient minoritaires. Dans le cadre du pluralisme interne, il convient dsormais de dterminer si chacun des sites s'attache des sujets trs priss, ou au contraire peu relays par d'autres. En somme, il s'agit de mesurer l'originalit d'un site en matire de choix ditoriaux, ici au prisme du degr de raret des sujets qu'il aborde14. Le degr de raret ditoriale d'un sujet sera ainsi valu l'aune de sa couverture mdiatique, par l'ensemble des sites produisant des informations d'actualit sur le web. Moins un sujet aura t abord par des sites au cours de la priode d'observation, et plus il sera considr comme rare dans les choix ditoriaux. Nous avons considr ici qu'un sujet s'avrait rare sur le plan ditorial s'il tait abord par moins de cinq sites au cours d'une journe. A partir de la mise en place de ce seuil, les articles portant sur des sujets rares ont pu tre identifis. Et leur proportion au sein de l'ensemble des articles produits par un site a ds lors pu tre calcule. Le pourcentage ainsi obtenu traduit l'originalit ditoriale d'un site, son degr d'attention pour des sujets rares. Une telle valuation du pluralisme interne des diffrents sites amne des rsultats particuliers pour les blogs. En raison du faible volume d'articles produits par certains d'entre eux (un, deux ou trois articles produits durant la priode d'observation, dans bien des cas), les pourcentages calculs n'ont pas forcment grande signification statistique. Par exemple, le blog d'Abadinte a produit un article au cours de la priode, correspondant un sujet rare, et se retrouve donc avec un taux pouss au maximum de 100%. Quant au blog Le Monolecte, il a lui aussi publi un seul billet, mais sur un sujet abord par plus de 5 autres sites, et se trouve donc affubl d'un score de 0% de sujets rares, loin de reflter son niveau d'originalit. Afin d'viter ces cueils statistiques, nous limiterons notre valuation du pluralisme interne aux sites qui ont produit au moins un article par jour en moyenne, soit 11 articles sur la priode. Sur les 199 sites ayant produit des articles au cours de la priode, 115 sites atteignent ou dpassent ce seuil minimal. Parmi eux, ils sont une vingtaine consacrer la moiti de leur production d'articles des sujets rares (voir tableau 6).

hal-00836651, version 1 - 21 Jun 2013

14

Nous remercions notre collgue Bernhard Rieder pour l'aide fournie sur ce point. Les calculs et graphes prsents dans la suite de cet article ont t raliss par ses soins. Par rapport aux valuations prcdentes sur le niveau de pluralisme global, l'importance d'un sujet n'est dsormais plus seulement relative au nombre d'articles qu'il rassemble mais aussi au nombre de sites qui l'abordent.

Site Michel Abherv

Catgorie de site d'actualit

Blog Site natif de France Matin l'internet Site natif de Fluctuat.net l'internet Site natif de Politique.net l'internet Site natif de Bondy blog l'internet Site natif de Minutebuzz l'internet Site natif de Enqute et dbat l'internet PaperBlog Infomdiaire Le salon beige Blog Site natif de IndyMedia Paris l'internet Site natif de Franois Desouche l'internet Bivouac-ID Blog Plerin Magazine Mdia en ligne Les mots ont un sens Blog Philippe Moule Blog Site natif de Cafebabel l'internet Rezo.net Infomdiaire Tian Blog Torapamavoa Nicolas Blog L'Humanit Mdia en ligne Site natif de Rue 89 l'internet Site natif de Le Grand Soir l'internet Site natif de Contrepoints l'internet Site natif de HNS-Info l'internet Site natif de Agora Vox l'internet

Nb articles total 26 43 133 11 24 393 90 27 268 135 555 35 15 81 12 44 84 80 13 148 98 53 115 78 425

Nb articles de sujets rares 23 38 116 9 19 309 65 19 185 92 334 21 9 48 7 25 47 45 7 79 51 27 58 38 205

% articles de sujets rares 88% 88% 87% 82% 79% 79% 72% 70% 69% 68% 60% 60% 60% 59% 58% 57% 56% 56% 54% 53% 52% 51% 50% 49% 48%

hal-00836651, version 1 - 21 Jun 2013

Tableau 6 - Sites prsentant la plus grande proportion de sujets rares parmi leurs articles (seuil de 11 articles produits entre le 7 et le 17 mars 2011)

On retrouve en tte de ce classement des sites dj reprs lors de notre valuation de l'clectisme ditorial et qui cumulent donc cette proprit avec celle d'une originalit dans le choix de leurs sujets (Bondyblog et Michel Abherv, blog d'un spcialiste de l'conomie solidaire hberg par le mensuel Alternatives conomiques). De faon plus gnrale, on retrouve l aussi une majorit de blogs et de sites natifs de l'internet, la diffrence prs que plusieurs de ces sites relaient des informations partir de positions idologiques trs radicales voire extrmes, droite (Enqute et Dbat, Le Salon beige, Franois Desouche, Bivouac-ID) comme gauche (Indymedia Paris, Le Grand Soir, HNS-Infos). Ainsi, notre indicateur de raret ditoriale des sujets peut avoir tendance faire ressortir des sites envisageant l'information comme ncessairement engage. Pour preuve, les deux seuls mdias en ligne prsents dans ce haut du classement sont les dclinaisons numriques de journaux d'opinion : Plerin Magazine et L'Humanit. Et sur les deux infomdiaires, l'un est spcialis dans l'agrgation de billets de blogs (PaperBlog) dont on vient de voir le caractre souvent polmique, et l'autre assure sciemment une veille sur des sources se situant sur la gauche de l'chiquier politique (Rezo.net). Aux cts de ces sites politiquement trs marqus figurent des initiatives dont le projet ditorial revenait explicitement proposer une alternative aux mdias existants. Ces sites prsentent le point commun d'avoir assis leur mode de ralisation sur une ouverture aux amateurs, sur un mode participatif : Bondyblog donc, mais aussi Cafebabel, Rue 89 ou encore AgoraVox. Cette fois-ci, l'indicateur de raret permet d'identifier des sites ralisant, davantage qu'un filtrage idologique singulier dans leur apprhension de l'information, une opration de dcentrage ditorial par rapport l'agenda mdiatique gnral. Lorsqu'on regarde cette fois le bas de ce classement, on rencontre des sites en revanche compltement immergs dans cet agenda mdiatique gnral. Pour plusieurs d'entre eux, la proportion de sujets rares tombe bien en de des 10%, autant dire que la quasi-totalit de leurs articles s'inscrit dans le mainstream de l'information en ligne. Sans trop de surprise, on retrouve des sites qui s'taient dj illustrs par leur redondance ditoriale, occupant une place de hub (Weber, Monge, 2011) dans la circulation de l'information : les infomdiaires Google Actualits (seulement 3% des articles portant sur des sujets rares) et actu2424 (galement 3%) rejoints par MSN Actualits (5%) et Orange Actualits (5%), ainsi que les mdias en ligne Le Nouvel Observateur (6%) et dans une moindre mesure RTL (10%). Parmi les autres mdias en ligne, on notera la prsence spcifique de dclinaisons numriques de chanes de tlvision : France 3 et France 215 (4%), TV5 Monde (5%), i-tl (8%). Entre les deux extrmits de ce classement, c'est--dire entre les sites ditorialement trs dissonants et les sites moteurs du mainstream mdiatique, se situent l'essentiel des sites d'actualit (80 sites). Leur publication d'articles s'inscrit majoritairement dans l'agenda mdiatique gnral du web tout en se rservant, dans des proportions variables, des incursions vers des sujets moins courants.

hal-00836651, version 1 - 21 Jun 2013

15

Les deux chanes partagent un mme fil d'informations sur l'internet.

UNE REPRESENTATION CARTOGRAPHIQUE DE L'INFORMATION SUR LE WEB Les rsultats livrs jusqu' prsent nous ont fourni deux grands types d'enseignements. D'une part, nous savons dsormais que l'information offerte sur le web est trs varie et en mme temps trs concentre, autour de quelques sujets d'actualit qui relguent des centaines d'autres dans les confins de l'internet. D'autre part, nous avons galement appris que les sites prsentent des degrs trs diffrents d'originalit ditoriale : certains privilgient des sujets rares tandis que d'autres se rejoignent dans une mme redondance informationnelle, une majorit de sites se situant entre ces deux positionnements ditoriaux. Dans la dernire partie de cet article, nous proposons d'tablir une synthse qui croise tous ces lments, relatifs au pluralisme autant externe qu'interne. A cette fin, nous avons ralis une reprsentation cartographique qui la fois rende compte de la physionomie particulire de l'agenda mdiatique sur le web et situe le rle de chaque site, dans leurs relations au sein de cet ensemble complexe. A bien des gards, la perspective ainsi adopte relve d'une analyse du champ de l'information d'actualit sur le web, si l'on considre que l'application du concept de champ l'espace journalistique permet tout la fois de montrer ce qui fait l'unit et la diversit de cet espace et, surtout, de l'tudier en termes relationnels (Marchetti, 2002, p. 23). Une reprsentation axe sur les similarits ditoriales La cartographie labore repose sur une base double, laquelle correspond un mme double objectif. Premirement, elle intgre la production d'information dans sa totalit, autrement dit les plus de 35 000 articles produits durant la priode, et se doit de reprsenter leur rpartition dsquilibre- entre les diffrents sujets d'actualit. Deuximement, elle s'appuie sur les prs de 200 sites ayant publi au cours de la priode, et doit indiquer leur propension -variable- s'attacher des sujets rares ou au contraire quasi-incontournables. Pour joindre ces deux vises, un algorithme a t employ pour combiner similarit des articles et similarit des sites. Il aboutit rapprocher les sites qui partagent des sujets d'actualit communs, en procdant des regroupements diffrencis selon que ces sujets communs sont des sujets plutt dominants ou plutt rares au sein du corpus total d'articles. La reprsentation cartographique qui en rsulte, de type graphe de rseau et conue l'aide du logiciel libre Gephi, place ainsi en son centre les sites qui partagent les sujets les plus traits et en priphrie les sites qui partagent des sujets beaucoup plus isols. Les nuds (points) du graphe correspondent chacun des sites d'actualit, et la taille de chaque nud est relative au nombre d'articles produits. Les artes (liens) entre les nuds reprsentent les proximits thmatiques, reliant des sites lorsqu'ils abordent des sujets communs. En raison du volume de donnes traites (dizaines de milliers d'articles et centaines de sites), la reprsentation cartographique ainsi gnre peut tre aisment visualise sur un cran en couleurs mais s'avre en revanche peu lisible sur un imprim en noir et blanc. Pour cette raison, nous la prsenterons en plusieurs temps. Nous commenons par reproduire la carte dans son intgralit, de faon montrer sa forme gnrale et dcrire ses principales zones de faon schmatique (figure 1). Nous prsenterons ensuite des extraits zooms de cette carte (figures suivantes), afin d'observer plus en dtail les territoires informationnels concerns.

hal-00836651, version 1 - 21 Jun 2013

hal-00836651, version 1 - 21 Jun 2013

Figure 1 - Reprsentation cartographique des proximits ditoriales entre sites d'actualits La reprsentation cartographique fait apparatre une structure correspondant la physionomie la fois concentre et disperse de l'information sur le web. Ainsi, selon une logique de cercles concentriques, on s'loigne progressivement d'un picentre o les similarits ditoriales entre sites sont trs denses autour des sujets les plus traits, pour aller vers des relations ditoriales plus affinitaires autour de sujets moins courants. Plus prcisment, nous pouvons distinguer trois grandes zones sur cette carte, qui recouvrent les trois degrs

d'originalit ditoriale des sites mis en vidence dans la partie prcdente de cet article 16. La zone 1 est celle du mainstream mdiatique. Elle rassemble les sites les plus productifs (larges nuds), qui partagent entre eux un nombre considrable de sujets d'actualit la Une de l'agenda mdiatique. La zone 3 est celle de l'information alternative, faite de sujets d'actualit beaucoup moins repris, par des sites eux-mmes plus restrictifs dans leur production. La zone 2 constitue un espace ditorial intermdiaire, o des sites d'envergure trs ingale restent branchs sur l'actualit dominante tout en tant galement attentifs des sujets plus iconoclastes. Les diffrents territoires de l'information Un tel dcoupage de la carte de l'information sur le web, s'il prsente l'avantage d'en dgager la structure gnrale, n'en demeure pas moins schmatique et assez grossier. Il reste maintenant explorer plus profondment les territoires de l'information composant chacune des zones identifies. Avec pour valeur ajoute, au regard de nos rsultats antrieurs, de pouvoir mieux apprcier les proximits ditoriales entre sites, que celles-ci soient bilatrales ou multilatrales. hal-00836651, version 1 - 21 Jun 2013

Figure 2 - Extrait de la reprsentation cartographique - Mainstream mdiatique (zone 1)


16

La zone 3 se distingue par le fait de comprendre, pour l'essentiel, des sites prsentant plus de 50% d'articles sur des sujets rares, la zone 2 des sites prsentant entre 40% et 50% d'articles sur des sujets rares, la zone 1 des sites prsentant bien moins de 40% d'articles sur des sujets rares.

hal-00836651, version 1 - 21 Jun 2013

Un premier extrait de ce graphe concerne la zone 1 du mainstream mdiatique. Il montre la place centrale occupe par les infomdiaires et les sites de mdias en ligne (cf. figure 2). Nous pouvons distinguer aisment les sites les plus productifs en volume d'articles : Voil, Wikio, Free, du ct des infomdiaires; France Soir, Le Journal du Dimanche, Le Nouvel Observateur, du ct des mdias en ligne, ou plus exactement des journaux en ligne. Ces sites constituent ainsi les principaux moteurs du mainstream mdiatique sur le web. Par ailleurs, la proximit ditoriale entre certains sites est frappante, au point de former de vritables agrgats : ainsi des trios TF1 - LCI - Alice Actualits et TV5 Monde - MSN Actualits - Orange Actualits, ou des duos France 2 - France 3 et Yahoo Actualits - RMC. Dans certains cas, cette redondance ditoriale s'explique tout simplement par la diffusion d'un mme fil d'informations au sein d'un groupe industriel de mdias (c'est le cas pour les chanes de tlvision en ligne du groupe TF1 et de France Tlvisions). Elle peut galement provenir de la fourniture d'informations par une mme source, et en particulier par une mme agence de presse. A ct de ces mastodontes de l'information sur le web, on remarque aussi la prsence de quelques blogs : Je n'ai rien dire ! Et alors ??, Sarkofrance, Mon avis t'intresse, Le blog de Pierre Alain, C'est juste histoire de dire. Leur prsence dans le mainstream mdiatique peut s'expliquer par une forte propension commenter les informations la Une de l'agenda mdiatique. Notons, pour terminer, la position de certains sites en lisire de cette zone 1 :, France Soir, 20 Minutes, Le Nouvel Observateur, Le Monde, RTL, Le Post (ces deux deniers sites ne sont pas visibles sur l'extrait prcdent). Ces sites restent trs intgrs au mainstream mdiatique, mais sans en tre au cur, car ils partagent galement quelques sujets d'actualit avec des sites de la zone 2. La zone 2 constitue, rappelons-le, un espace ditorial intermdiaire, pour une part connect au mainstream mdiatique, et pour une autre part assez ouvert des sujets d'actualit plus rares. Il est compos de mdias en ligne, de mdias natifs de l'internet, et de blogs, qui toutefois ne se rpartissent pas de faon quitable dans toute la zone. Au sein de cette zone 2, deux grands territoires informationnels peuvent en effet tre distingus. La "partie Nord" est surtout domine par des mdias en ligne, qui semblent se rapprocher d'autres sites en fonction de proximits ditoriales et idologiques. La "partie Sud" fourmille elle de blogs, dessinant des agrgats ditoriaux typiques de la dimension conversationnelle en vigueur dans la blogosphre.

hal-00836651, version 1 - 21 Jun 2013

Figure 3 - Extrait de la reprsentation cartographique - "partie Nord-ouest" de la zone 2 La "partie Nord" de la zone 2 abrite plusieurs mdias en ligne la production d'articles assez consquente : Le Point, Le Figaro, Europe 1, Libration. Ils semblent faire le pont entre le mainstream mdiatique et l'information alternative. Pour autant, ce rle de passeur ne s'exerce pas de faon neutre au niveau ditorial : les sujets d'actualit abords par ces sites, qu'ils soient dominants ou au contraire rares, sont souvent partags avec des sites qui prsentent une proximit ditoriale et idologique. Pour illustrer une telle configuration, observons la position occupe par Le Figaro (cf. figure 3), souvent class comme le leader de l'information d'actualit sur le web en termes d'audience. Du ct de la zone 3, il partage des sujets d'actualit avec le site du quotidien catholique La Croix et un blog situ dans son orbite immdiate, Authueil, dont l'auteur revendique un ancrage politique dans la dmocratie chrtienne17. On peut alors mettre l'hypothse que les sujets rares abords par Le Figaro sont lis des proccupations d'ordre religieux. Du ct de la zone 1, Le Figaro ne partage pas non plus n'importe quels sujets d'actualit dominants, ou disons plutt qu'il les partage prioritairement avec certains sites : France Soir, et le groupe TF1 dans une moindre mesure. Ici c'est l'hypothse d'un mdia "populaire" et plutt inclin droite qui ressort. Elle semble tre confirme par le positionnement du Figaro au sein mme de la zone 2. Outre la proximit avec son satellite Le Figaro Magazine qu'on sait plus droite, Le Figaro partage galement plusieurs sujets d'actualit avec le site d'Europe 1, lui-mme accol au blog Penses d'outre-politique, tenu par un catholique convaincu lecteur de centre-droit. Notons aussi le partage de sujets d'actualit avec les radios publiques France Infos et Radio France Internationale (RFI) qui l pourrait mettre en relief la place de l'actualit internationale, traditionnellement forte, dans la couverture mdiatique du Figaro. Une configuration assez semblable se retrouve dans la partie cette fois "Nord-Est" de la zone 2, autour du site de Libration. Du ct de la zone 3, celui-ci partage des sujets rares avec par exemple StreetPress.com, un site participatif qui porte les questionnements sociaux,
17

Il faut noter la prsence d'un autre site tout proche d'Authueil et La Croix : Cui cui fit l'oiseau, blog s'ingniant tourner en drision les dclarations les plus conservatrices maillant l'actualit politique. Ceci rappelle que notre analyse partir de la notion de sujet d'actualit peut amener identifier des sites adoptant un cadrage mdiatique primaire proche alors que leur cadrage mdiatique secondaire peut tre oppos.

politiques et culturels des jeunes . Et du ct de la zone 1, Libration partage des sujets dominants avec 20 Minutes, quotidien gratuit dont la stratgie de ciblage marketing des "jeunes urbains" est encore plus pousse sur le web18. Et au sein de la zone 2, sa proximit la plus immdiate est avec le Blog d'Eric Mainville, centr sur l'conomie solidaire. Ainsi, la "partie Nord" de la zone 2 semble polarise autour d'une poigne de mdias en ligne qui s'inscrivent dans le mainstream mdiatique partir d'une orientation ditoriale et idologique particulire, base du partage de sujets d'actualits plus rares. En comparaison, la "partie Sud" de la zone 2 parat beaucoup plus homogne. Au sein de cette "partie Sud", aucun site ne se dtache vritablement par l'ampleur de sa production. Beaucoup de blogs, ayant produit un ou quelques articles par jour au cours de la priode, parsment ce territoire informationnel. Ils partagent bon nombre de sujets d'actualit entre eux, au point de parfois prsenter une grande similarit dans leurs choix ditoriaux.

hal-00836651, version 1 - 21 Jun 2013

Figure 3 - Extrait de la reprsentation cartographique - "partie Sud" de la zone 2 Des agrgats de blogs se forment ainsi sur la carte (cf. figure 3), refltant une dynamique de conversation autant que de publication, typique de la blogosphre (Cardon, Delaunay-Teterel,
18

Nicolas Hub (2008), en combinant analyse des Unes de la presse crite et observation des rdactions dans la premire moiti des annes 2000, a bien montr comment la conversion des quotidiens franais au rfrentiel de march s'tait traduite par des positionnements autour de sujets de socit plutt que d'enjeux politiques. Libration tait la pointe de ce mouvement, et son positionnement sur le web pourrait en marquer la continuit.

hal-00836651, version 1 - 21 Jun 2013

2006). Les blogueurs se rpondent par le biais de commentaires ou par articles interposs. Ces changes sont accompagns par des dispositifs tels que le blogroll, liste de blogs suivis de faon privilgie. Parfois, il s'agit mme de blogrolls spcialiss, tels que le Leftblogs, regroupant des blogs de gauche donc, et utilis ici notamment par Arnaud Mouillard, A perdre la raison, et Une autre vie. Pour la plupart d'entre eux, les blogs agrgs dans l'extrait prcdent de la reprsentation cartographique (figure 3), l'exception du Blog de dmocratie librale et de L'Hrtique li aux Modem, sont anims par des militants du Parti socialiste ou du Front de Gauche. En mars 2011, ils se retrouvent autour de positions "antisarkozystes", saisissant les mesures du Prsident de la Rpublique ou du Gouvernement faisant l'actualit pour les commenter de faon critique. Dans cette "partie Sud" de la zone 2, l'information semble donc constituer un support pour les changes entre auteurs de blogs. Il s'agit d'une zone de commentaires sur l'actualit, dans laquelle s'intgrent aussi quelques rares sites professionnels comme le site natif de l'internet Arrt sur images (cf. figure 3), les mdias en ligne Marianne ou Les Echos. Ces deux derniers sites se placent dans des parties de la zone 2 o se retrouvent des blogs penchant plus droite ou revendiquant une forme d'apolitisme. Les sites de la zone 2, donc majoritairement des blogs, puisent des sujets d'actualit dans le mainstream mdiatique, dont ils extraient des morceaux choisis et sur lesquels ils vont apposer leur point de vue. Les sites de la zone 1 avec lequel ils partagent le plus de sujets d'actualit dominants sont Le Nouvel Observateur et Le Monde, mdias communment situs au centre-gauche ou en tout cas modrs. C'est tout le contraire des sites de la zone 3 avec lesquels quelques sujets d'actualit sont partags, et dont les prises de position peuvent s'avrer beaucoup plus radicales. La zone 3 concerne l'information alternative. Elle est compose de sites qui s'attachent des sujets d'actualit l'cart du mainstream mdiatique. Un tel dcalage peut provenir de deux postures : d'un prisme idologique assum dans la slection de l'information comme d'une volont explicite de se dmarquer de l'agenda mdiatique traditionnel, en prenant appui sur les contributions d'amateurs. La premire facette de l'information alternative est donc celle d'une information engage, voire trs engage. La prsence dans la zone 3 de Valeurs Actuelles, Plerin Magazine ou La Croix, laisse ainsi penser que les journaux d'opinion ou d'obdience religieuse continuent, sur le web, apporter leur singularit mdiatique, s'attachant des sujets d'actualit peu ou pas abords par d'autres. Mais de nouveaux entrants ont pouss encore plus loin ce parti-pris idologique, portant leur attention de faon quasi-exclusive sur les sujets d'actualit qui rencontrent leurs proccupations politiques premires. On retrouve ainsi dans cette zone 3 des sites dont nous avions dj soulign l'originalit ditoriale, en liant cette dernire un extrmisme politique. La reprsentation cartographique des proximits ditoriales nous apporte un nouvel d'lment d'intellection, mettant en relief le partage de sujets d'actualit entre sites d'extrme droite et sites d'extrme gauche : Franois Desouche et Enqute et dbat ont visiblement des proccupations communes avec l'infomdiaire Rezo.net et la galaxie de sites auxquels il renvoie, ou encore avec le site du quotidien communiste L'Humanit (cf. figure 4). Sans cder une interprtation htive et usite selon laquelle les extrmes se rejoignent , nous remarquerons nanmoins que ces sites semblent se focaliser sur des sujets d'actualit assez identiques (par exemple la question de l'immigration), sur lesquels ils greffent sans doute des points de vue opposs.

Figure 4 - Extrait de la reprsentation cartographique - Information alternative trs engage (zone 3) Aux cts de ces sites la ligne ditoriale ouvertement soumise des parti-pris idologiques, apparaissent dans cette zone 3 des sites moins unanimement engags sur le plan politique. Fait notable toutefois, plusieurs s'taient donns comme objectif de transformer le modle mdiatique dominant, en ouvrant leur espace de publication aux contributions d'amateurs. Plus exactement, hormis Le Post dans la zone 1, tous les sites de notre chantillon possdant une dimension participative se logent dans cette zone 3 : Agora Vox, Alterinfo, Bellaciao, Cafebabel, Charlie Enchan, Citizenside, Enqute et dbat, Franois Desouche, HNS-Info, IndyMedia, Le Gaulois, Le Grand Soir, Mediapart, Minutebuzz, Rseau Voltaire, Rue 89, StreetPress.com, Voie militante, WikiNews. Certains d'entre eux, tels que AgoraVox, BellaCiao ou Mediapart, se distinguent par leur volume de production d'articles et le fait d'agglomrer autour d'eux des blogs, dans une certaine proximit ditoriale. Ces mmes sites voyaient dans le journalisme participatif un moyen de rvolutionner l'information. Leur pari semble en partie tenu, dans la mesure o ils ont amen de l'originalit ditoriale, porteurs de sujets rares n'ayant sans eux peut-tre jamais connu d'existence mdiatique. Nanmoins, leur loignement du cur du mainstream mdiatique, et le risque de constituer des niches d'information relativement fermes et confidentielles, nous amne rflchir de faon plus globale la structuration de l'information sur le web. Retours sur d'autres cartographies du web La structuration de l'information sur le web, telle que nous l'avons identifie travers cette analyse des proximits ditoriales, entre en rsonance avec d'autres travaux reposant eux sur une cartographie des hyperliens entre sites. Aux Etats-Unis, la reprsentation de la global news arena (Reese et al., 2007) avait mis en vidence l'arrimage hypertextuel des blogs aux sites de mdias traditionnels. Cette relation est confirme ici au niveau des contenus, tout en tant affine : si les blogs s'appuient dans bien des cas sur l'actualit divulgue par des sites professionnels pour la commenter, ils vont surtout s'arrter sur les sujets livrs par des sites prsentant une orientation ditoriale et idologique compatible avec la leur. Ce type de proximits caractrise les sites de la zone 2 dans notre recherche, que ce soient les relations des mdias en ligne de la "partie Nord" ou l'appui des blogs de la "partie Sud" sur certains mdias en ligne de la zone 1. Cependant, les relations ditoriales les plus nourries des blogs s'tablissent avec les sites natifs de l'internet, en particulier au sein de la zone 3, le plus souvent sur la base de proximits idologiques l encore. Il s'agit d'ailleurs l sans doute de l'axe le plus structurant dans la reprsentation cartographique que nous avons analyse : les blogs et nombre de sites natifs de l'internet semblent relgus la priphrie de l'information sur le web tandis que, globalement, les mdias en ligne s'avrent davantage en prise avec les infomdiaires pour ce qui est de la constitution de l'agenda mdiatique gnral. A cet gard, notons qu'une possible fermeture de la liaison entre mdias en ligne et blogs avait dj t signale par une cartographie des liens

hal-00836651, version 1 - 21 Jun 2013

hal-00836651, version 1 - 21 Jun 2013

hypertextuels des principaux sites de mdias franais (De Maeyer, 2010). Cette cartographie avait mme montr une tendance au repli sur soi des mdias en ligne, rservant leurs liens aux autres entits de leur groupe industriel de communication : certaines des fortes proximits ditoriales, voire des identits ditoriales uniques, releves via notre analyse de discours, pourraient s'inscrire dans une mme logique. Au-del de l'information sur le web, des rapprochements peuvent galement tre tablis avec des recherches portant sur la politique en ligne. Depuis le travail inaugural de Adamic et Glance (2005) sur la blogosphre tats-unienne au moment de la campagne prsidentielle amricaine de 2004, on sait en effet que les sites web ont tendance privilgier un entre-soi hypertextuel (Flichy, 2008). Les travaux mens en France ont abouti au mme constat d'une partition de la blogosphre en fonction des diffrents partis politiques ou courants de pense, avec toutefois des passerelles hypertextuelles plus nombreuses au fil des ans (Cardon et al., 2011). Ces travaux ont aussi mis en vidence le rle des sites de mdias et de commentateurs, correspondant aux sites d'actualit, en tant que relais hypertextuels entre les diffrents camps politiques. Notre recherche apporte sur ce point une couche d'intelligibilit supplmentaire, en renseignant sur la nature des contenus des sites d'actualit. Les plus engags politiquement parmi eux sont aussi ceux qui traitent des sujets d'actualit les moins partags. Ceci n'est pas de nature confrer une accessibilit mdiatique l'ensemble des questions de socit, et les mettre et en discussion, comme on pourrait l'esprer dans une perspective habermassienne de l'espace public. Cependant, il faut remarquer les quelques relations thmatiques de certains sites engags politiquement, aux avis moins tranchs, avec d'autres sites d'actualit davantage relis au mainstream mdiatique. On peut donc faire l'hypothse que ces sites intermdiaires entre centre et priphrie du paysage de l'information sur le web pourraient constituer occasionnellement- les courroies de transmission par lesquelles des ides ou des informations alternatives quelque peu confines dans les mandres de l'internet viennent alimenter un espace mdiatique plus large. C'est plus gnralement l'hypothse d'un espace public rticularis au sens de la networked public sphere de Benkler (2006), qui trouverait l une description plus empirique de ses ramifications smantiques autant qu'hypertextuelles.

CONCLUSION Avec cette recherche, l'offre d'informations d'actualit sur le web a pu tre apprhende dans sa totalit. En intgrant des sites de mdias dj existants (issus de l'imprim ou de l'audiovisuel) autant que des nouveaux entrants (blogs, sites participatifs, portails et agrgateurs), tous les types de sites ont t considrs. Leurs temporalits respectives de publication ont t galement prises en compte, au cours d'une analyse grande chelle, sur une dizaine de jours. Ainsi, tout au long d'une priode d'observation faisant succder une phase exceptionnellement charge sur le plan de l'actualit une phase plus ordinaire, ce sont plusieurs dizaines de milliers d'articles, produits par prs de deux cent sites, qui ont t soumis analyse. Les rsultats obtenus permettent d'valuer le niveau de pluralisme de l'information sur le web, en France. Tout d'abord, l'identification des sujets d'actualit autorise se prononcer sur le niveau de varit ditoriale. Indniablement, ce niveau est lev voire trs lev sur le web franais, avec plusieurs centaines de sujets abords chaque jour. L'agenda mdiatique qui en rsulte n'est pas pour autant quilibr, bien au contraire. Le prsent travail met en relief une dichotomie permanente entre l'ultra-mdiatisation de certains sujets, retraits l'envi, et la dissmination de sujets peinant trouver une visibilit en dehors de leurs sources d'origine. Les choix ditoriaux conduisant une telle situation ont t galement approchs, autre apport

hal-00836651, version 1 - 21 Jun 2013

de cette tude, par une apprciation du pluralisme interne chacun des sites. Selon qu'ils s'inscrivent pleinement dans le courant mdiatique dominant, ou l'inverse dans une information alternative, ou encore qu'ils soient des passeurs entre mainstream et originalit ditoriale, les sites concourent dessiner des territoires informationnels spcifiques. La prsente recherche a ainsi permis de cartographier l'espace web des sites d'actualit franais, et d'analyser la nature des informations qui y sont proposes. Une telle analyse de discours requrait une posture quantitative, afin de pouvoir traiter un corpus de cette envergure. Elle gagne tre prolonge par une perspective plus qualitative. Un mme sujet d'actualit peut en effet tre trait de faon fort disparate, et l'analyse de discours smiopragmatique, comme propose dans un autre article de ce dossier (Touboul et al., 2012), viendra alors opportunment en rendre compte. L'analyse du pluralisme de l'information, mme avec cette granularit plus fine, n'en reste pas moins une analyse de la diversit offerte, laquelle chappe la diversit consomme (Benhamou, Peltier, 2006). Pour passer, en d'autres termes, du stade de diversity as sent au stade de diversity as received (Van der Wurff, 2011), il faut cette fois inscrire ces discours mdiatiques dans leur contexte social de rception. L'article consacr la circulation des sujets d'actualit sur Twitter (Rieder et al., 2012) nous fournira des lments ce sujet. Mais nul doute que ce travail mriterait d'tre amplifi l'observation des pratiques des internautes dans leur ensemble pour savoir ce qui, entre la redondance et l'originalit, l'emporte lors de la circulation sociale des informations.

RFRENCES ADAMIC L., GLANCE N., 2005, The Political Blogosphere and the 2004 US Election; Divided They Blog , Proceedings of the 3rd international workshop on Link discovery LinkDD '05, en ligne, [http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.59.9009], consult le 27 mars 2012. ARQUEMBOURG, J., 2011, L'vnement et les mdias. Les rcits mdiatiques des tsunamis et les dbats publics (1755-2004), Paris, Editions des Archives Contemporaines. BENHAMOU F., PELTIER S., 2006, Une mthode multicritre dvaluation de la diversit culturelle. Application ldition de livres en France , in Cration et diversit au miroir des industries culturelles. Actes des journes dconomie de la culture, X. Greffe (d.), Paris : La Documentation franaise, pp. 313-344. BENKLER Y., 2006, The Wealth of Networks. How Social Production Transforms Markets and Freedom, New Heaven / London : Yale University Press. BERGER P., LUCKMANN T., 1996, La Construction sociale de la Ralit, Paris : Masson/Armand Colin [premire publication anglophone : 1966]. BOCZKOWSKI P. J., 2010, News at Work. Imitation in an Age of Information Abundance, Chicago : University of Chicago Press. BOUQUILLION P., MATTHEWS J., 2010, Le Web collaboratif. Mutations des industries de la culture et de la communication, Grenoble : PUG. BOURDIEU P., 1996, Sur la tlvision (suivi de Lemprise du journalisme), Paris : Liber. BRUNS A., 2008, The Active Audience : Transforming Journalism from Gatekeeping to Gatewatching , in Making Online News. The Ethnography of New Media Production, C. Paterson and D. Domingo ed., New York : Peter Lang, pp. 171-184. CARDON D., 2010, La dmocratie Internet. Promesses et limites, Paris : Seuil.

CARDON D., DELAUNAY-TETEREL H., 2006, La production de soi comme technique relationnelle. Un essai de typologie des blogs par leurs publics , Rseaux, n 138, pp. 15-71. CARDON D., FOUETILLOU G., LERONDEAU C., PRIEUR C., 2011, Esquisse de gographie de la blogosphre politique (20072009) , in Continuer la lutte.com, F. Greffet (dir.), Paris : Presses de Sciences Po. CARPENTER S., 2010, A study of content diversity in online citizen journalism and online newspaper articles , in New Media and Society, 12 (7), pp. 1064-1084. CHARAUDEAU P., 2005, Les mdias et linformation. Limpossible transparence du discours, Bruxelles : De Boeck-Ina. CHARON J.-M., 2010, Stratgies pluri-mdias des groupes de presse , in Les Cahiers du journalisme, n 20, p. 54-74. DAGIRAL E., PARASIE S., 2010, Presse en ligne : o en est la recherche ? , in Rseaux, La Dcouverte, n 160-161, pp. 13-42. DEARING J. W., ROGERS E. M., 1992, Communication Concepts 6. Agenda-setting, Thousand Oaks: Sage. hal-00836651, version 1 - 21 Jun 2013 DEUZE M., 2003, The web and its journalisms: Considering the consequences of different types of newsmedia online, in New Media & Society 2(5), pp.20330. EGGHE L., 2005, Power Laws in the Information Production Process : Lotkaian Informetrics, Oxford: Elsevier Academic Press. ESQUENAZI J.-P., 2002, L'criture de l'actualit : pour une sociologie du discours mdiatique, Grenoble : PUG. FENTON N. (ed.), 2010, New Media, Old News. Journalism and Democracy in the Digital Age, London, Thousand Oaks, New Delhi, Singapore : Sage. FLICHY P., 2008, Internet et le dbat dmocratique , in Rseaux, La Dcouverte, n 150, pp. 159-185. GAMSON W., MODIGLIANI A., 1989, Media Discourse and Public Opinion on Nuclear Power: A Constructionist Approach, in American Journal of Sociology, 95 (1), pp. 1-38. GOFFMAN E., 1991, Les cadres de lexprience, Paris : Les Editions De Minuit. GREFFET F., WOJCIK S., 2008, Parler politique en ligne : une revue des travaux franais et anglo-saxons , in Rseaux, La Dcouverte, n 150, pp. 19-50. HUBE N., 2008, Dcrocher la Une . Le choix des titres de premire page de la presse quotidienne en France et en Allemagne (1945-2005), Strasbourg : P.U.S. LANCELOT A., 2005, Les problmes de concentration dans le domaine des mdias, Rapport pour le Premier ministre, Paris : La Documentation franaise, en ligne [http://lesrapports.ladocumentationfrancaise.fr/BRP/064000035/0000.pdf], consult le 27 mars 2012. LESKOVEC J., BACKSTROM L., KLEINBERG J., 2009, Meme-tracking and the dynamics of the news cycle , in kdd09 - International Conference on Knowledge Discovery and Data Mining, Paris, en ligne, [http://www.cs.cornell.edu/home/kleinber/kdd09quotes.pdf], consult le 27 mars 2012. MAEYER (de) J., 2010, Mapping the hyperlinked environment of online news. Issues and challenges for the French news sites, in IAMCR Conference, en ligne

[http://juliettedm.files.wordpress.com/2010/06/demaeyer_mapping-hyperlinkenvironment.pdf], consult le 27 mars 2012. MARCHETTI D., 2002, Sociologie de la production de l'information. Retour sur quelques expriences de recherche , Cahiers de la recherche sur l'ducation et les savoirs, n 1, p. 1732. MARTY E., 2010. Journalismes, discours et publics : une approche comparative de trois types de presse, de la production la rception de linformation, Thse de doctorat en Sciences de linformation et de la communication sous la direction de P. Marchand & A. Burguet, Universit de Toulouse. MARTY E., REBILLARD F., SMYRNAIOS N., TOUBOUL A., 2010, Varit et distribution des sujets dactualit sur linternet. Une analyse quantitative de linformation en ligne , in Mots. Les langages du politique, n 93, pp. 107-126. NEVEU E., QUERE L., 1996, Prsentation du dossier "Le temps de l'vnement",Rseaux, n 75, pp. 7-21 MC QUAIL D., 1992, Media Performance: Mass Communication and the Public Interest, London: Sage. McCOMBS M., SHAW D., 1972. "The agenda-setting function of mass media", in Public Opinion Quarterly 36 (2), pp. 176-187. MERCIER A., PIGNARD-CHEYNEL N., 2011, L'appropriation des rseaux sociaux par les webjournalistes en France , colloque Mdias'011, Universit d'Aix-en-Provence, en ligne, [http://www.medias011.univcezanne.fr/fileadmin/Medias11/Documents/A4/MERCIER_PICHARD.pdf ], consult le 27 mars 2012. MIGE B., 2010, L'espace public contemporain. Approche info-communicationnelle, Grenoble : PUG. OUAKRAT A., 2011, Publicit en ligne sur les sites de presse issus de l'imprim. Construction du march, logiques de fonctionnement et perspectives d'volution, Thse de doctorat en Sciences de linformation et de la communication sous la direction de N. Sonnac, Universit Panthon-Assas Paris 2. PATERSON C., 2007, International News on the Internet : Why More is Less, Ethical Space: The International Journal of Communication Ethics, vol. 4, n 1/2, pp. 57-66. PETERS J., 2004, The market-place of ideas: A history of a concept, in Toward a Political Economy of Culture: Capitalism and Communication in the Twenty-first Century, A. Calabrese & C. Sparks (eds), Lanham, MD: Rowman and Littlefield, pp. 6582. QUANDT T., 2008, News Tuning and Content Management : An Observation Study of Old and New Routines in German Online Newsrooms , in Making Online News. The Ethnography of New Media Production, C. Paterson & D. Domingo (eds.), New York : Peter Lang, pp. 77-97. REBILLARD F., 2006, "Du traitement de linformation son retraitement. La publication de linformation journalistique sur linternet", in Rseaux, La Dcouverte, n 137, pp. 29-68. REESE S., RUTIGLIANO L., HYUN K., JEONG J., 2007, Mapping the blogosphere. Professional and citizen-based media in the global news arena, in Journalism, vol. 8, n 3, pp. 235-261.

hal-00836651, version 1 - 21 Jun 2013

RINGOOT R., ROCHARD Y., 2005, Proximit ditoriale. Normes et usages des genres journalistiques , in Mots. Les langages du politique, n 77, Proximit, p. 73-90. RUELLAN D., 2007, Le journalisme ou le professionnalisme du flou, Grenoble : PUG. SCHEUFELE D. A., 2000, Agenda-Setting, Priming, and Framing Revisited: Another Look at Cognitive Effects of Political Communication, in Mass Communication & Society, 3(2&3), pp.297-316. SEDEL J., 2011, Bondy Blog. Le travail de reprsentation des habitants de la banlieue par un mdia d'information participative , in Rseaux, La Dcouverte, n 170, pp. 103-133. SERFATY V., 2006, Les blogs et leurs usages politiques lors de la campagne prsidentielle de 2004 aux tats-Unis , in Mots. Les langages du politique, n 80, La politique mise au net, p. 25-35. SMYRNAIOS N., MARTY E., REBILLARD F., 2010, Does the Long Tail apply to online news? A quantitative analysis of French-speaking websites, in New Media and Society, Sage Publications, vol. 12, n 8, pp. 1244-1261. hal-00836651, version 1 - 21 Jun 2013 SMYRNAIOS N., REBILLARD F., 2009, Lactualit selon Google. Lemprise du principal moteur de recherche sur linformation en ligne , in Communication et langages, n 160, pp. 95-109. TESSIER M., 2007, La presse au dfi du numrique, Rapport pour le Ministre de la culture et de la communication, en ligne, [http://www.ddm.gouv.fr/IMG/pdf/rapport-tessierfev2007.pdf], consult le 27 mars 2012. TOUBOUL et al., 2012 VAN DER WURFF R., 2011, "Do audiences receive diverse ideas from news media? Exposure to a variety of news media and personal characteristics as determinants of diversity as received", in European Journal of Communication, vol. 26, n 4, pp. 328-342. VERON E., 1981, Construire lvnement les mdias et laccident de Three Miles Island, Paris : ditions de Minuit. WEBER M.S., MONGE P., 2011, The Flow of Digital News in a Network of Sources, Authorities, and Hubs, in Journal of Communication, n 61, pp. 10621081.

ANNEXES Echantillon final - Sites ayant publi des articles entre le 7 et le 17 mars 2011. Mdias en ligne : 43 Cette catgorie inclut des sites dpendant de journaux, radios, et tlvisions. 20 minutes Alternatives Economiques Arrt sur images Arte Radio Causeur Europe 1 Fakir France 2 France 24 France 3 France Infos FranceSoir Itl L'Expansion L'Express L'Humanit La Croix La Tribune LCI Le Figaro Le Figaro Magazine Le Journal du Dimanche Le Monde Le Monde Diplomatique Le Nouvel Observateur Le Parisien Le Point Les 4 Vrits Les Echos Libration Marianne Metro Notre Temps Paris Match Plerin Magazine Politis Radio France Internationale Radio Monte-Carlo RTL France TF1 TV5 Monde Valeurs Actuelles VSD

hal-00836651, version 1 - 21 Jun 2013

Sites natifs de l'internet : 40 Cette catgorie inclut des sites dominante participative pour certains d'entre eux. Acrimed Actualit Franaise Agora Vox Alterinfonet Basta Bellaciao Bondy blog Brave Patrie Cafebabel Charlie Enchan Citizenside Contrepoints Dlits d'Opinion Enquete et dbat Fluctuat.net France Matin Franois Desouche HNS-Info Indymdia Paris LaTlLibre.fr Le Gaulois Le Grand Soir Le Post Le volontaire Les infos Mediapart Minutebuzz Oulala Owni Planet.fr Politique.net Rseau Voltaire Respublica Riposte laque Rue 89 Slate.fr StreetPress.com Toulouse 7 Voie militante WikiNews

hal-00836651, version 1 - 21 Jun 2013

Blogs : 102 Cette catgorie inclut des blogs indpendants et des blogs rattachs d'autres sites. [Unhuman] A perdre la raison A toi l'honneur Abadinte Alain Godard Arnaud Mouillard Article 11 Au comptoir de la comte Aurlien veron Autheuil Avec nos Gueules Bah !? by CC Bibifa/pour tout vous dire Bivouac-ID Blog de Claude Guillon Blog de Paul Jorion Blog gaulliste libre Bruno Roger petit Bug brother C'est juste histoire de dire Carnet de notes de Yann Savidan Chez Homer Christophe Ginisty Clmentine Autain Comit de salut public Coulisses de Bruxelles Coulisses de Sarkofrance Cpolitic Cui cui fit l'oiseau Des Pas Perdus Didier Goux Didier Goux chez les modernoeuds Diner's Room Exprimeo.fr Extrme centre Fucking disgrace Hashtable Humeurs de Gauche Intox 2007 Je n'ai rien dire ! Et alors ?? Jean Gadrey Jeune garde 87 koztoujours L'Hrtique L'insolent La chronique du yti La maison du faucon La plume d'Aliocha La rpublique du peuple La toile de David Abiker Lait d'Beu Le blog d'Eric Mainville Le blog de dmocratie librale Le blog de Gabale Le Blog de Guy Birenbaum Le blog de Jean-Michel Apathie Le blog de Pierre Alain Le blog de Polluxe Le Blog de Superno Le blog politique de Ddalus Le Coucou de Claviers Le grumeau Le Monolecte Le salon beige Les eaux glaces du calcul goste Les chos de la gauchosphre Les Entrailles de Mademoiselle Les Jours et l'Ennui de Seb Musset Les mots ont un sens Les Privilgis parlent aux franais Marc Vasseur Merle moqueur Michel Abherv Mon avis t'intresse Mon Mulhouse Nouvel Hermes Objectif Libert Olympe et le Plafond de Verre Partageons mon avis Penses d'Outre-Politique Philippe moule Philippe Sage Piratages Plume de presse Rebelles.info Richard trois Rimbus le Blog Ruminances Sarkofrance Sarkostique Sarkozy an 3 / Christophe Barbier SLOVAR les nouvelles Thierry Crouzet Tian Tizel Torapamavoa Nicolas Toreador.fr Tryblyonne voit la Vie en Rouge Une autre vie Variae Yves Thrard Yvon Rioufol

hal-00836651, version 1 - 21 Jun 2013

Infomdiaires : 14 Cette catgorie inclut des services d'actualit de portails et des services d'agrgation automatique de nouvelles. actu2424 Alice Actualits EditoWeb Magazine Free Actualits Google Actualits Info2424.info MSN Actualits Newspeg Une Orange Actualits PaperBlog Rezo.net Voila Actualits Wikio Actualits Yahoo Actualits France

hal-00836651, version 1 - 21 Jun 2013

Vous aimerez peut-être aussi