Vous êtes sur la page 1sur 31

Corpus

8 (2009) Corpus de textes, textes en corpus


................................................................................................................................................................................................................................................................................................

Patrick Charaudeau

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique


................................................................................................................................................................................................................................................................................................

Avertissement Le contenu de ce site relve de la lgislation franaise sur la proprit intellectuelle et est la proprit exclusive de l'diteur. Les uvres figurant sur ce site peuvent tre consultes et reproduites sur un support papier ou numrique sous rserve qu'elles soient strictement rserves un usage soit personnel, soit scientifique ou pdagogique excluant toute exploitation commerciale. La reproduction devra obligatoirement mentionner l'diteur, le nom de la revue, l'auteur et la rfrence du document. Toute autre reproduction est interdite sauf accord pralable de l'diteur, en dehors des cas prvus par la lgislation en vigueur en France.

Revues.org est un portail de revues en sciences humaines et sociales dvelopp par le Clo, Centre pour l'dition lectronique ouverte (CNRS, EHESS, UP, UAPV).
................................................................................................................................................................................................................................................................................................

Rfrence lectronique Patrick Charaudeau, Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique, Corpus [En ligne], 8|2009, mis en ligne le 01 juillet 2010, consult le 16 janvier 2013. URL: http://corpus.revues.org/1674 diteur : Bases, corpus et langage - UMR 6039 http://corpus.revues.org http://www.revues.org Document accessible en ligne sur : http://corpus.revues.org/1674 Ce document est le fac-simil de l'dition papier. Tous droits rservs

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique Patrick CHARAUDEAU
Universit de Paris 13, CAD Les problmes que pose la notion de corpus sont relativement bien connus pour avoir t longuement discuts dans le champ des sciences du langage1, mais ils n'ont toujours pas donn lieu un consensus qui aurait permis de s'en remettre une dfinition faisant autorit et laquelle on se rfrerait chaque fois que l'on aurait justifier un corpus d'analyse. Cela est peuttre le symptme de ce que le corpus n'existe pas en soi, mais dpend comme en tmoigne l'article corpus du Dictionnaire d'analyse du discours2 du positionnement thorique partir duquel on l'envisage. S'agissant du langage, on connat les problmes dont je ne cite que les principaux : - le problme qui concerne le recueil des donnes, recueil qui dpend du choix de la matrialit langagire (paroles orales, paroles crites), du choix du support qui vhicule ces paroles en relation avec une situation de communication (pour l'crit : lettres, rapports, journaux, tracts, circulaires, affiches, etc. ; pour l'oral : radio, tlvision, runions diverses, meetings, conversations du quotidien, etc.). Ce sont autant d'aspects qui ont des incidences sur la manire de recueillir des donnes : exploration du terrain, procds d'enregistrement libres ou contraints, au su ou l'insu des acteurs de parole, etc. ; - le problme qui concerne l'importance du matriel recueilli et de sa valeur de reprsentativit ; le corpus peut-il tre considr exhaustif et clos, ou partiel et ouvert, et,
1 Voir la Revue Corpus dite par l'universit de Nice-Sophia Antipolis, particulirement les numros 1 (2000) et 4 (2005). 2 Charaudeau P. et Maingueneau D. (2002), Dictionnaire d'analyse du discours, Paris : Seuil.

Corpus n8 Corpus de textes, textes en corpus (2009), 37-66

P. CHARAUDEAU

consquemment, peut-il tre considr comme un objet en soi ou un simple outil (Mayaffre 2005). On sait que l'hypothse de l'exhaustivit vieux rve de l'attitude positiviste n'est plus tenue, et ce malgr le dveloppement rcent de la dnomme linguistique de corpus initie dans le monde anglo-britannique3, et prolonge en France par quelques auteurs avec une certaine prudence4, car le langage est en perptuelle production. Il peut se faire cependant que la clture du corpus soit revendique, titre exprimental, par certains analystes5. Si le corpus est considr comme partiel se pose alors le problme de sa valeur comme chantillon, et de la possibilit de le faire varier en sous-corpus. Quant considrer si le corpus est un objet en soi ou un instrument, cela renvoie la question du contexte que nous analyserons plus loin ; - le problme qui concerne, l'intrieur du matriau langagier, les catgories qui vont faire l'objet de l'analyse : grammaticales (connecteurs, pronoms, verbes, etc.), lexicales (par champs ou de faon alatoire), syntaxiques (selon divers types de construction) ; mais aussi les variables externes la production des actes langagiers, telles que les types de locuteurs, les dispositifs de communication, de mme que les variables concernant le temps (l'historicit) et l'espace (les cultures) ; - le problme enfin qui concerne l'outil de traitement des donnes : dpouillements manuels, traitement informatique l'aide de logiciels ad hoc, constitution d'chantillons partir de bases de donnes (voir ci-dessous). Dans tous ces cas, se pose la question de la pertinence de ces choix en relation avec les prsupposs thoriques, et de l'ventuelle circularit qui peut s'instaurer entre ceux-ci et le corpus.
3 Voir particulirement Williams G. (2005). 4 Voir Habert B. et alii (1997) et Mayaffre D. (2005). 5 Dans l'article Lexicomtrie du Dictionnaire d'analyse du discours, op.cit., M. Tournier crit : la lexicomtrie n'est pas une thorie mais une mthodologie d'tude du discours, qui se veut exhaustive, systmatique et automatise ; et plus loin : [Le corpus d'tude] Il est ferm, au moins le temps d'une exprience, car on ne peut compter que sur des ensembles stabiliss .

38

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

Je voudrais montrer dans cet article de quelle faon la construction d'un corpus, en analyse de discours, dpend d'un positionnement thorique li un objectif d'analyse, ce que j'appelle une problmatique. On envisagera trois types de corpus selon qu'ils se rfrent une problmatique dite cognitive, communicative ou reprsentationnelle. Puis on montrera comment un corpus de textes se construit dans un jeu de dconstruction et de reconstruction selon des critres d'ouverture ou de clture (intertexte et hypertexte), de contraste (interne et externe) et de pertinence quantitative et/ou qualitative. On terminera par le renvoi un exemple d'analyse pratiqu par le Centre d'Analyse du Discours propos du discours d'information tlvis, afin de montrer comment on peut tirer parti de certaines de ces options, et comment elles peuvent se combiner. Mais auparavant, il est ncessaire de circonscrire la spcificit de l'analyse du discours au sein des sciences du langage, car on ne peut traiter la question des corpus de discours sans s'interroger sur certaines notions souvent employes dans ce domaine. 1. De quelques distinctions indispensables pour former des corpus de discours Dans les sciences humaines et sociales, certaines disciplines privilgient des tudes de terrain avec des procdures suivant une dmarche descriptivo-empirique (sociologie, anthropologie), d'autres privilgient des procdures d'exprimentation (psychologie sociale), d'autres des analyses partir d'archives ou en construisant des corpus avec des procdures plus ou moins systmatiques de recueil et traitement du matriel smiologique runi (histoire, sciences du langage). Les sciences du langage font donc partie des disciplines de corpus : rassemblement de donnes linguistiques (sous forme de textes crits ou oraux, de documents divers, d'observations empiriques raisonnes ou d'enqutes provoques) que l'on constitue en objet d'analyse. Ds lors se pose la question de savoir quelle est la nature de ces donnes. On ne peut donc traiter de la question du corpus si l'on n'est pas au 39

P. CHARAUDEAU

clair (c'est--dire si on ne prend pas position) sur certaines notions qui sont au cur des sciences du langage, dont j'envisagerai ici les distinctions qui me paraissent les plus fondamentales : langue / discours, texte / discours, texte / contexte. 1.1 Langue / discours Vieille lune diront certains. Et pourtant, malgr Saussure luimme dclarant que la langue n'est cre qu'en vue du discours, de nombreuses dfinitions de la notion de discours ont eu cours depuis les annes soixante-dix qui ne facilitent pas la clart de son opposition langue. Renvoyons Maingueneau qui, en 19766 puis 19967, en rpertorie les dfinitions, et rappelons que certaines de ces dfinitions font du discours un prolongement de la langue, opposant l'unit de phrase une unit transphrastique (Harris 1969), d'autres intgrent des catgories de discours dans la langue8, d'autres encore opposent discours nonc en rapportant cette notion aux conditions de production dun texte9 ; d'autres enfin qui font de ce terme de discours un usage que Maingueneau qualifie de paralinguistique dans la mesure o il sintgre dans une rflexion qui participe de plusieurs disciplines telles que lhistoire, la philosophie, la smiologie, voire la psychanalyse10. Ici n'est pas le lieu de discuter ces dfinitions. Il s'agit seulement de bien marquer la diffrence entre langue et discours dans ce qu'elle implique du point de vue de l'analyse et de la constitution de son objet. Ces deux notions signalent deux lieux de structuration du langage. 1) La langue, comme lieu de conformation entre des formes et du sens s'organisant en systmes, c'est--dire en rseaux de relations entre des units minimales selon des rgles
6 Initiation aux mthodes de lanalyse du discours, Paris, HachetteUniversit, 1976. 7 Les termes cls de l'analyse du discours, Paris, Seuil, coll. Mmo, 1996. 8 Comme O. Ducrot qui relie cette notion son composant rhtorique mais l'intrieur de la langue, jusqu' dire que l'argumentation est dans la langue . 9 Voir sa mise en application dans le numro 81 de la revue Langages, mars 1986, Analyse de discours, nouveaux parcours, Paris, Larousse, 1986. 10 A travers les crits de Michel Foucault, Julia Kristeva et Jacques Derrida.

40

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

de combinaisons syntagmatiques et paradigmatiques, systmes dont on pourra dire qu'ils tmoignent de catgories de pense prenant position sur des visions du monde11. Les units prises en compte sont des units phonologiques, morphologiques, smantiques, d'ordre grammatical ou lexical, et les corpus sont constitus d'un ensemble de co-occurrences par ressemblances de forme ou de sens. 2) Le discours, comme lieu, la fois, de structuration des usages en fonction des conditions de production dans lesquels ces usages se manifestent, tmoignant des comportements langagiers des sujets parlants, et de catgorisation de sens qui tmoigne des systmes de connaissance et de croyance auxquels adhrent les individus ou groupes sociaux. Ici, on n'est plus dans une combinaison d'units, seraient-elles transphrastiques, car si l'on est dans un au-del de la phrase, le sens de discours rsulte d'une multiplicit de facteurs d'ordre contextuel (voir ci-dessous) qui font que le sens n'est reprable dans aucune des units qui composent une production discursive quelconque, et ne peut tre infr que par le jeu des combinaisons de tous ces facteurs. Pour reprendre un mot de Roland Barthes, le sens s'attache aux formes de faon diffracte 12. Un corpus de discours ne peut tre constitu que par un ensemble de productions langagires en situation d'usage. De l, la constitution de deux linguistiques, l'une que l'on appellera linguistique de la langue oriente vers la description des systmes intrinsques chaque langue, corpus plus ou moins clos, et qui prsuppose l'existence d'un sujet oprateur de catgories cognitivo-linguistiques ; l'autre que l'on appellera linguistique du discours oriente vers la description des usages et des significations sociales, corpus,

11 Voir la tradition de l'analyse linguistique franaise depuis A. Martinet en passant par G. Guillaume, B. Pottier, R. Martin, A. Culioli. 12 Roland Barthes par roland barthes, Paris, Le Seuil 1975. Je me permets de renvoyer galement le lecteur aux ides de texte toil et texte bris que R. Barthes dveloppe dans S / Z, Paris, Seuil, 1970.

41

P. CHARAUDEAU

par dfinition ouvert, et qui prsuppose un sujet oprateur de catgories sociodiscursives et porteur d'imaginaire social13. Prenons un exemple pour illustrer cette diffrence. Un nonc comme J'ai trente ans pourra faire l'objet d'une analyse linguistique de langue lorsque, insr dans un corpus d'noncs similaires conformes au schme : < Pr. x Vb. x quant. x Sb. > on en dterminera l'actant (celui qui parle) auquel est attribu (avoir) une certaine proprit (ans), laquelle est quantifie (trente), le tout dans un acte d'nonciation qui dit que cette assertion doit tre rapporte au sujet parlant lui-mme (Je) dans une modalisation locutive affirmative ; de plus, en observant un certain paradigme lexical, on dira que ce ans dsigne un certain segment du temps qui renvoie l'ge de la vie. Mais globalement, J'ai trente ans ne signifiera ici rien d'autre que / j'ai trente ans /. Si l'on considre maintenant cet nonc dans son contexte de production, savoir un sportif rpliquant la rflexion d'un ami qui s'tonne de le voir quitter la comptition : J'ai trente ans , alors cet nonc signifie entre autres choses : / Je suis trop vieux /. Mais s'il s'agissait d'une personne qui, venant d'tre licencie d'une entreprise, rpond un ami lui suggrant que c'est peut-tre parce qu'il a pass l'ge, alors le J'ai trente ans signifie : / Mais je suis encore jeune ! /. Ces sens dpendent videmment de la suite des mots contenus dans l'nonc, mais ils ont t obtenus par opration d'infrence partir de la connaissance que l'interlocuteur peut avoir de l'identit de celui qui lui parle (sportif / employ) et de l'univers de sens dont il est chaque fois question (sport / entreprise), autant d'lments inclus dans un corpus mmoriel de discours. Reste que le sens de discours, s'il est infr, l'est partir de formes dont la combinaison constitue un texte. Il s'agit donc de savoir si texte et discours sont une seule et mme chose.

13 Je ne peux discuter ici la notion d'imaginaire pour laquelle je renvoie provisoirement le lecteur ce que j'en dis dans mon Le discours politique. Les masques du pouvoir, Paris, Vuibert, 2005, et dans Tiers o es-tu ? , in La voix cache du Tiers. Des non-dits du discours, Paris, L'Harmattan, 2004.

42

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

1.2 Texte / discours tant donn le nombre d'crits qui existent sur ces notions, voire sur cette distinction qui n'est pas toujours opre, on ne pourra s'tendre longuement. Seulement faire un constat et prendre position, car cela est ncessaire pour dterminer un corpus de discours. Le constat : rarement sont opposs de faon nette texte et discours. Au point que des ouvrages se rclamant de l' analyse textuelle emploient souvent le terme analyse de discours et inversement. Conscient de la chose, Jean-Michel Adam propose de distinguer texte et discours comme les deux faces complmentaires d'un objet commun pris en charge par la linguistique textuelle 14, prcisant que celle-ci privilgie l'organisation du cotexte selon des critres de cohsion, alors que l'analyse du discours s'occupe davantage du contexte selon des critres de cohrence. Cette distinction pointe bien que l'objet texte se dfinit par l'organisation de sa configuration en rapport avec ce qui l'entoure et que le discours concerne davantage l'organisation smantique, mme si le premier est aussi porteur de sens et le second se repre travers des formes. Mais cette distinction ne me semble pas assez nette pour distinguer ensuite corpus de textes et corpus de discours. D'autant que si l'on fait intervenir la srie des notions proposes par G. Genette : paratexte, mtatexte, pitexte, intertexte et hypertexte, quoi on peut ajouter la notion d'interdiscours introduite par l'cole franaise d'analyse du discours des annes soixante-dix / quatre-vingt15, on ne voit pas toujours bien o se trouve le frontire entre ces deux notions. La prise de position. Je ne pense pas avoir un point de vue trs diffrent de celui de Jean-Michel Adam, sauf considrer que le rapport de complmentarit entre analyse de texte et analyse de discours n'est pas de symtrie. Ce ne sont pas les deux faces d'une mme pice, parce qu'il y a des discours
14 Voir l'article Texte du Dictionnaire d'analyse du discours, op. cit. 15 Voir Pcheux M. Les Vrits de La Palice. Linguistique, smantique, philosophie, Paris, Maspero, 1975 ; et Courtine J.-J. Quelques problmes thoriques et mthodologiques en analyse du discours. A propos du discours communiste adress aux chrtiens , Langages 62, 1981.

43

P. CHARAUDEAU

dans un mme texte, et un mme discours dans plusieurs textes. Le discours nest pas le texte mais il est port par des textes. Le discours est un parcours de signifiance qui se trouve inscrit dans un texte, et qui dpend de ses conditions de production et des locuteurs qui le produisent et l'interprte. Un mme texte est donc porteur de divers discours et un mme discours peut irriguer des textes diffrents. Du discours traverse des textes diffrents, et un mme texte peut tre porteur de discours diffrents. Pour comprendre le slogan publicitaire : Obernai, la premire grand bire avec un tiers de calories en moins , je suis amen mobiliser une srie de discours qui ne sont pas dits explicitement dans ce slogan, mais qui s'y trouvent implicitement, savoir : / je dois avoir des connaissances en dittique / > / cette bire ne fait pas grossir / > / la minceur est valorise dans ma socit / > / les femmes peuvent boire cette bire, traditionnellement rserve aux hommes /. Cela n'empche pas que par ailleurs les discours sur la dittique, la minceur et sa valeur culturelle puissent se trouver configurs dans d'autres types de texte des plus savants aux plus vulgariss. Comme le discours a besoin de configuration textuelle pour signifier, cela veut dire que cette signifiance, un moment donn, a t texte. Il se produit alors un phnomne trange de va-et-vient entre diffrents textes se faisant cho, au terme duquel se construit une signifiance abstraite qui se trouve dans diffrents textes sans tre uniquement l'un d'entre eux. Pour prendre un exemple simple, le discours du pch originel et l'imaginaire de culpabilit et de rdemption dont il est porteur s'est construit en Occident du fait de l' chosation entre divers textes (Bible, vangiles, crits des thologiens, commentaires de philosophes, prdications de l'glise, jusqu' des textes publicitaires, des magazines people, des films, etc.). Ainsi se dposent des discours dans la mmoire collective. 1.3 Texte / contexte A considrer le discours comme un lieu de signifiance abstrait se configurant diversement dans des textes, on retrouve les notions de d'intertextualit de Genette et de dialogisme de Bakhtine. Partant de cette dernire notion qui a donn lieu

44

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

diverses interprtations16, je dirai que ce jeu d'chos peut s'oprer entre des textes mais aussi entre des discours. Dans le premier cas, on aura affaire, au sens strict du terme, une intertextualit qui se manifeste dans divers types de citation - ce que Jacqueline Authier-Revuz nomme l'htrognit montre 17 : il y a du texte dans du texte, mme partiel, mme dform. Dans le second cas, on aura affaire une interdiscursivit, un jeu de renvois entre des discours qui ont eu un support textuel mais dont on n'a pas mmoris la configuration 18. Cela nous explique qu'un corpus ne peut tre que de textes et non point de discours, moins de dcider que les textes runis le sont au nom d'un certain discours. Mais n'anticipons pas, je reviendrai l-dessus. Nous voil, en tout cas, arriv la notion de contexte. Depuis, les premiers travaux en linguistique de la langue, la notion de contexte s'est considrablement tendue avec des dnominations variables. En rsum, on parlera : de contexte strictement linguistique, lorsqu'il s'agit de se rfrer l'environnement verbal qui se trouve avant et/ou aprs une unit dtermine ; de contexte textuel, lorsqu'il est constitu de textes produits par une mme source (par exemple, les divers crits d'un mme auteur) ; de contexte paratextuel (Genette), lorsqu'il est constitu de textes ou fragments de textes se trouvant en coprsence dans un mme espace scriptural (les titres, soustitres, chapeaux, lgendes d'une page de journal) ; de contexte mtatextuel (Genette), lorsqu'il est constitu de textes qui se commentent les uns les autres ; de contexte hypertextuel (Genette), lorsqu'il est constitu de textes qui se citent, se renvoient les uns aux autres, se reprennent et se transforment, comme sont les pastiches et parodies ; enfin, de contexte intertextuel et interdiscursif (au sens o je viens de dfinir ces
16 Voir l'article Dialogisme du Dictionnaire d'analyse du discours, op. cit. 17 Authier-Revuz J. (1982), Htrognit montre et htrognit constitutive : lments pour une approche de l'autre dans le discours , DRLAV 26 : 91-151. 18 Parce que, pour reprendre ce que dit D. Maingueneau : Tout discours () a pour proprit constitutive d'tre en relation multiforme avec d'autres discours , voir l'article Interdiscours dans le Dictionnaire d'analyse du discours, op. cit.

45

P. CHARAUDEAU

notions), lorsque sont convoqus des textes et discours pour justifier les interprtations du sujet interprtant (ou analysant). Autrement dit, dans cet largissement progressif de la notion de contexte, apparat une prise de conscience progressive, non seulement du rapport entre texte et tout l'environnement textuel qui peut s'y rapporter, mais aussi entre le texte et un horstexte (parfois appel cotexte), c'est--dire des donnes prsentes dans les conditions de production de l'acte de langage. Ce que je voudrais souligner ici, c'est un aspect, qui est rarement pris en compte par les diffrents courants d'analyse du discours, et qui me permet d'introduire la notion de contexte situationnel. L'aspect qui concerne, dans les conditions de production, non seulement les prsupposs de positionnement interdiscursif (prsupposs idologiques pour certains), mais aussi le conditionnement de la situation de communication ellemme : la nature de l'identit des partenaires de l'acte de langage, la finalit de la situation, les dispositifs et les circonstances matrielles de celle-ci. Cet ensemble constitue ce que j'appelle un contrat de communication, lequel contraint le sujet parlant en lui donnant les instructions discursives qu'il devra suivre pour procder son acte d'nonciation19. Certes les ethnographes et ethnomthodologues de la communication interactionnelle nous ont habitu prendre ces variables en considration pour analyser les conversations, mais elles ne sont pas suffisamment prises en compte dans l'analyse du discours20. C'est que l'analyse du discours a surtout travaill sur l'hypothse que la force du langage se trouve davantage dans ce que disent les mots que dans ce qu'ils transmettent. Et donc on s'est longtemps pench sur ce que dit le langage sans s'interroger sur le pouvoir du langage comme effet d'influence. Autrement dit, pour reprendre une observation de Roland Barthes, on pense toujours que le signe signifie et on oublie qu'il signifie 21. Or le phnomne de signifiance rsulte des deux : le langage signifie en mme temps quil transmet ; cest dans
19 Charaudeau P. (2004). 20 Et pourtant, de mon point de vue, l'analyse conversationnelle fait partie de l'analyse du discours. 21 Roland Barthes par roland barthes, op. cit.

46

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

lacte mme de transmission quil signifie avec leffet quil produit sur lautre, cest--dire son interprtation. Ne pas se poser la question des effets, cest amputer lacte de langage de sa signification phnomnale, savoir qu'il est le rsultat d'une co-construction. On ne peut saisir le sens d'une expression comme prfrence nationale que si on la considre dans son contexte situationnel, lequel nous dira qui l'emploie (Jean-Marie Le Pen), l'adresse de qui (citoyens-lecteurs), dans quel dispositif communicationnel (campagne lectorale), avec quelle finalit (sduire), et, videmment, en le rapportant une certaine tradition historique franaise (interdiscours). Le problme qui se pose alors est celui de l'articulation entre, d'une part ce quoi renvoient les discours du point de vue des valeurs, et d'autre part les effets quils sont susceptibles de produire. Par exemple, le pouvoir d'influence des mots du discours politique n'est pas seulement dans la force du projet d'idalit sociale dont ils sont porteurs, mais aussi, et de plus en plus, dans leur cho aux systmes d'attente des citoyens (effet de miroir), lesquels sont davantage sensibles au charisme des personnalits politiques, l'motion que celles-ci suscitent, quaux ides. Le contexte situationnel doit donc tre pris en compte l'gal des autres pour former des corpus. videmment, aucun corpus ne peut prendre en compte la totalit des ces contextes, mais c'est de la prise en considration de cette multiplicit contextuelle que l'on pourra construire des corpus de faon raisonne. 2. Spcificits du corpus en analyse du discours A considrer ces diffrentes distinctions : le discours comme signifiance / le texte comme configuration ; le contexte sous ses trois aspects (paratextuel, interdiscursif et situationnel)22, on est

22 C'est que, au bout du compte, on peut attribuer contexte une fonction englobante se composant du contexte paratextuel, qui prend en compte tout ce qui est coprsent dans un mme espace textuel, du contexte interdiscursif, qui prend en compte tout texte (y compris les mtatextuels) et discours se rfrant un mme univers de discours, et du contexte situationnel qui prend en compte les conditions

47

P. CHARAUDEAU

conduit justifier le fait quun corpus de discours soit toujours une construction rsultant de divers types de regroupement : corpus selon le paratexte (de mots, dnoncs, de modes dnonciation), corpus selon l'interdiscours (savoirs de connaissance, savoirs de croyance), corpus selon la situation (locuteurs, finalit et dispositif). Ces regroupements se font en fonction de la problmatique d'analyse et de la mise en contraste choisies. 2.1 Corpus et problmatique d'analyse On n'utilisera pas le terme problmatique avec le sens qu'il a dans l'usage courant, comme dans l'expression C'est problmatique pour signifier qu'une question est difficile expliquer, voire sans solution, ou qu'une affirmation est incertaine, douteuse ou parfois suspecte. Une problmatique (emploi substantif) est un ensemble cohrent de propositions hypothtiques (ou de postulats) qui, l'intrieur d'un champ d'tude, dterminent la fois un objet, un point de vue d'analyse et un questionnement par opposition d'autres questionnements possibles. On ne confondra donc pas problmatique et thorie qui se diffrencient en ce que cette dernire a un corps de concepts et de catgories plus ou moins modlis s'accompagnant d'un cadre mthodologique. En observant les tudes qui se rclament de prs ou de loin du discours, et en les interrogeant selon le type d'objet qu'elles analysent et la conception qu'elles se font du sujet qui en est l'ordonnateur, on peut reprer trois grandes problmatiques qu'on appellera cognitive, communicative et reprsentative, chacune dterminant un type de corpus. 2.1.1 Une problmatique dite cognitive et catgorisante : Lobjet dtude est considr comme un ensemble de mcanismes discursifs dont il sagit soit de reprer lexistence et le mode dagencement lintrieur dune production discursive quelconque (texte ou noncs alatoires), soit de dcrire le comment de leur fonctionnement, et particulirement leur mode de production. Dans le premier cas, on tudie, par exemple, les
nonciatives, quitte oprer, pour autant que de besoin, des distinctions au sein de chacun d'eux.

48

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

jeux de cohrence et cohsion dans un texte, ou certains mots du discours (connecteurs, modalits). On trouve le second cas dans les travaux de certains psycho-cognitivistes du langage qui cherchent dcrire des parcours d'organisation discursive down ou up de ralisation des schmes, scripts et scnarios. Dans ces deux cas, il en sort des catgories instrumentales danalyse qui servent reprer ou produire des configurations discursives. Le sujet concern par la dtermination dun tel objet sera appel cognitif dans la mesure o nest pris en compte chez celui-ci que son aptitude produire ou reprer des oprations darticulation discursive : relations anaphoriques ou cataphoriques, connexions coordonnes ou subordonnes, relations de cohrence et de cohsion, de progression et de non contradiction, etc., sans aucune prise en compte de sa nature sociale. Dans une telle problmatique, le corpus n'a pas besoin dtre finalis en fonction dune situation de communication particulire. De ce point de vue, il peut tre dit alatoire, et seulement contraint par les contextes linguistiques dans lesquels apparaissent ces mcanismes. On a affaire un corpus de cooccurrents par catgories d'opration linguistico-discursive. Appartiennent cette problmatique, des travaux dans la ligne des thories de la prsupposition23 et du sens des mots du discours24, des topo et de l'orientation argumentative25 et de la pragmatique (les connecteurs, les embrayeurs et les actes de parole)26, ainsi que les travaux en grammaire de texte qui traite des problmes de cohrence et cohsion textuelles27.

23 Ducrot O., Dire et ne pas dire, Paris, Hermann, 1991. 24 Ducrot O. et alii, Les mots du discours, Paris, Minuit, 1980. 25 AnscombreJ.-C. et Ducrot O., L'argumentation dans la langue, Bruxelles, Mardaga, 1983. 26 On pourra, sur ces questions, consulter le Dictionnaire encyclopdique de Pragmatique de J. Moeschler et A. Reboul, Paris, Seuil, 1994. 27 Charolles M. (1995) Cohrence, cohsion et pertinence du discours , Travaux de linguistique 29 : 125-151 ; et l'on pourra se rfrer aux travaux de Van Dijk T.A. et Kintsch W., particulirement : Strategies of discourse comprhension, New York, Academic Press, 1983.

49

P. CHARAUDEAU

2.1.2 Une problmatique dite communicative et descriptive Lobjet dtude est ici empirique, ou plus exactement il est dtermin partir de lobservation (plus ou moins nave) des manifestations du monde phnomnal. Par exemple, nous pouvons observer que les comportements des individus dans leurs actes dchange social ont une certaine rcurrence ce qui permet de faire lhypothse quils sont soumis des conditions de ralisation et quils obissent des rgles ; cest cela qui autorise les constituer en objet danalyse. Ds lors, lobjet dtude issu de cette empirie peut tre structur en types idaux (au sens durkhemien) de communication partir, et lintrieur, desquels sont dcrites les caractristiques discursives qui sattachent chacun deux (identit des locuteurs, finalit, dispositif). Une telle dmarche aboutit, entre autres choses, ltablissement de diverses typologies dites de discours, de textes, de genres, ou de situations communicatives, mais qui supposent toutes une thorisation de ces types idaux de communication. Cette problmatique peut tre appele descriptive du fait quelle vise dcrire des types de situation communicative. Le sujet, ici, est li cette empirie des changes communicatifs, mais il est lui aussi construit et thoris en fonction de la faon dont on construit et thorise ces changes. Le sujet est donc un sujet de communication qui se dfinit par son identit psychologique et sociale, par un comportement qui est finalis la fois par les contraintes quil subit sil veut sinsrer dans lchange (de ce point de vue il est un on , un sujet de la norme contractuelle), et par ses propres intentions vis vis de lautre (de ce point de vue il est un je , un sujet s'individuant). Le corpus se ressent de cette vision empirique de lobjet dtude. Il est gnralement constitu de textes (productions langagires en situation) qui sont regroups en fonction de leur appartenance tel ou tel type de situation. Par exemple, textes publicitaires, textes journalistiques, textes de manuels scolaires, textes administratifs, textes de programmes politiques, et divers textes conversationnels (changes tlphoniques, demandes de renseignements, interviews, entretiens, dbats, etc.). Ce type de

50

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

regroupement permet ensuite de procder des comparaisons autour dun mme contexte paratextuel et situationnel. Appartiennent cette problmatique, des travaux autour de la description des genres du discours et des objets empiriques catgoriss en situation de communication28 2.1.3 Une problmatique dite reprsentationnelle et interprtative Lobjet dtude de cette problmatique est dfini travers des hypothses de reprsentations socio-discursives dont on suppose quelles sont dominantes un moment donn de lhistoire dune socit (elles sont donc socio-historiques), et quelles caractrisent tel ou tel groupe social. En cela elles sont interprtatives, puisquil faut bien avoir, au dpart, une hypothse sur ce que sont les positionnements sociaux en relation avec les pratiques discursives et les types de sujets qui sy attachent. La difficult de cette problmatique rside justement dans le fait quil faut faire ces hypothses et que pour ce faire on doit sappuyer sur des manifestations discursives extrmement diverses, non toujours explicites, voire diffuses et mme floues, ce qui est un problme pour la constitution du corpus. Le sujet, dans cette perspective, fait lui aussi problme et a t souvent discut. Du fait quil est lorigine des pratiques discursives qui construisent les reprsentations, il peut tre considr comme un sujet passif ou actif. De l, deux positions : - lune, radicale, qui ne confre ce sujet dautre existence que celle dune illusion 29, car il serait compltement surdtermin par ce que Pcheux appelle le pr-construit des formes discursives . Le sujet ne
28 Branca-Rossof S. (1997), Les lettres de rclamation adresses au service de la redevance , Langage et socit 81 ; et Charaudeau P. (2001), Vises discursives, genres situationnels et construction textuelle , in Analyse des discours. Types et genres, Toulouse : d. Universitaires du Sud. 29 Pcheux dit se situer dans un champ socio-historique o se construisent les sens, dans lobscurit invitable des illusions du sujet , in Mise au point et perspectives propos de lAnalyse Automatique du Discours , Langages 37, 1975.

51

P. CHARAUDEAU

sappartient pas, il est parl par un ailleurs30 qui sera appel tantt idologie (Althusser), tantt inconscient (Authier-Revuz) en se diluant dans la conscience du groupe social. Dans un cas comme dans lautre, le sujet nest pas une je mais un a (idologique ou inconscient) qui parle travers le sujet parlant, et ce nest pas un hasard si les tenants de cette position ont toujours opr un paralllisme entre idologie et inconscient. - Lautre position est moins globalisante. Elle ne nie pas le jeu de la surdtermination du sujet, mais au lieu den faire une illusion, elle en fait quelque chose de positif. Il existe dans toute socit des discours de doxa (lieux commun, strotypes, savoirs partags). Ceux-ci circulent et se rpartissent de faon non alatoire dans les diffrents groupes sociaux. Tout sujet est donc porteur, pour une part, de certains de ces discours, et du mme coup cet appariement rvle son positionnement social. On peut donc dire que, dune certaine manire, ce sujet est responsable de ses reprsentations, ce qui ne veut pas dire qu'il en soit conscient. Font cho cette position que nous qualifierons de sociologique, les travaux de certains sociologues franais qui s'inscrivent dans une sociologie constructiviste31, ainsi que ceux qui travaillent analyser les reprsentations de lespace public dans les mdias32. Le corpus varie selon lune ou lautre position. Dans la premire, le corpus est constitu dun ensemble de textesarchives qui sont slectionns pour leur valeur emblmatique de discours dominant, le plus souvent lis une institution sociale : dictionnaires, encyclopdies, productions discursives de groupes constitus (cahiers de dolances, partis politiques, syndicats) et toutes productions ayant valeur de discours fondateur33.

30 Voir l'effet Munchausen dcrit par Michel Pcheux dans Les Vrits de La Palice, op. cit. 31 Voir ce propos Choses dites de Pierre Bourdieu. 32 Qur L. (1995). 33 Voir, ce que Dominique Maingueneau et Frdric Cossutta appellent des textes constituants (religieux, scientifiques, philosophiques, littraires, juridiques, etc.) dans L'analyse des discours constituants , Langages 117, mars 1995.

52

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

Dans la deuxime position, le corpus est constitu dun ensemble de ce que l'on appellera des signes-symptmes qui reprsentent de faon emblmatique des systmes de valeurs. Ces signes peuvent tre des mots ( racisme , immigration , solidarit etc.)34 ou des formules diverses ( purification ethnique )35 rvlatrices de manires de dire ; ce peut tre galement des signes iconiques (des mises en scne dimages) qui permettent dtudier par exemple les reprsentations de la femme 36 dans les publicits ou de la violence la tlvision37. Le corpus est ici d'ordre interdiscursif, mais il pourrait inclure d'autres composantes dans la mesure o l'on peut faire lhypothse que les divers lments d'une situation de communication (identits, finalit, dispositifs) tmoignent galement des valeurs et des idologies. Par exemple, si lon compare la faon dont la presse concevait son rubriquage et ses genres dcriture il y a 50 ans et maintenant, on peut voir que la faon d'envisager son rle dans la symbolique dmocratique a chang. Ce qui nous renvoie la problmatique prcdente. 2.2 La mise en contraste : un jeu de dconstruction / reconstruction Suivant l'hypothse saussurienne qui dit que le sens nat de la diffrence, le sens de discours ne peut tre saisi que dans ce qui fait contraste, du fait de la mise en regard de diverses squences discursives. Ainsi les corpus doivent-ils tre construits selon certaines variables permettant de les comparer, des variables externes ou internes. Les variables externes permettent de mettre en regard des ensembles textuels ou discursifs appartenant des poques diffrentes (variable temporelle) : par exemple, la presse du XIXme sicle compare celle daujourdhui. Ou bien, ces ensembles peuvent appartenir des espaces diffrents (variable
34 Boyer H. (1983) ; et voir Sans distinction de race, le numro 33 de la revue Mots, Presse de la Fondation nationale des Sciences politiques, Paris, dcembre 1992. 35 Krieg-Planke A. (2009). 36 Soulages J.-C. (2003). 37 Boyer H. et Lochard G. (1998).

53

P. CHARAUDEAU

spatiale et culturelle) : par exemple, la publicit franaise compare la publicit brsilienne. Ou encore ils peuvent appartenir des dispositifs situationnels diffrents (variable de genre) : par exemple, le discours politique et le discours publicitaire afin de savoir si les stratgies de persuasion sont les mmes. Ces corpus contrasts permettent de trancher dans les discussions qui opposent divers points de vue : celui qui dfend la prennit des discours ( c'est toujours la mme chose travers le temps et l'espace )38, oppos celui qui dfend tout prix le changement des discours ( ce n'est jamais pareil selon les poques)39 ; ou encore le point de vue qui globalise divers genres discursifs : tout a (discours politique, discours publicitaire), cest de la propagande , oppos celui qui les distingue. Ressemblances et diffrences entre les caractristiques de divers corpus permettent de prendre acte des changements ou de la prennit des discours, de leur gnralit ou de leur spcificit quant au contexte de production ou quant au genre. Mais il y a aussi des variables dites internes dans la mesure o elles se situent l'intrieur d'un mme champ de discours. Elles correspondent aux composantes situationnelles qui structurent un domaine de pratiques sociales. Le champ politique, par exemple, se compose de divers domaines dactivit : ceux du gouvernement, des parlements, des partis, des Conseils (constitutionnel, dtat, conomique et social), etc. La parole n'y circule pas de la mme faon, les normes contractuelles ne sont pas les mmes, les stratgies discursives ne s'y dploient pas de la mme manire, partant, le sens des mots varient selon ces situations. Sans compter le fait que le discours politique nest pas le mme non plus selon que les acteurs se trouvent en situation de conqute du pouvoir (campagnes lectorales) ou dexercice du pouvoir, la premire conduisant produire des discours de promesse qui sont de
38 Par exemple, comme on l'a entendu propos de la dernire campagne lectorale : les campagnes se ressemblent toutes, les discours lectoraux ne changent pas quelle que soit lpoque . 39 Par exemple, comme on l'a galement entendu au cours de la mme campagne lectorale : Cette campagne n'est pas comme les autres ; On n'a jamais aussi peu parl des questions de fond .

54

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

lordre du souhaitable, la seconde des discours de justification qui sont de lordre du possible. Il conviendra alors de construire l'intrieur d'un vaste corpus politique des sous-corpus contextes situationnels divers. Il est galement une autre faon doprer des contrastes variables internes. Cest celle qui consiste procder des rapprochements entre textes traitant de mmes notions. C'est le travail que l'on est conduit faire lorsque, analysant des dclarations d'acteurs politiques, on cherche comprendre le sens attribu des mots comme autorit , galit , devoir et droit . Il est alors ncessaire d'avoir recours des crits philosophiques traitant de la rpublique ou de la dmocratie40. Cette varit de corpus selon les diverses problmatiques auxquelles ils se rattachent et selon un jeu de dconstruction / construction aboutissant des sous-corpus, nous renvoie deux questions qui sont largement discutes en analyse du discours : la question de l'ouverture / clture du corpus ; la question de son traitement quantitatif / qualitatif. 2.3 Une question heuristique : l'ouverture / clture du corpus En rsumant les considrations prcdentes, on dira qu'un corpus dpend du traitement que l'on a dcid de lui appliquer (sous influence d'une problmatique et d'un certain jeu de construction contraste). On pourra dire qu'il s'agit l d'une circularit peu dmonstrative, mais comment faire autrement ? On n'ira pas jusqu' dire que C'est finalement le corpus qui fait la thorie 41, car ce serait nier le double mouvement dductivo-inductif de la recherche en sciences humaines et sociales, mais on dira : Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique / dis-moi quelle est ta problmatique, je te dirai quel est ton corpus . Le corpus participe ainsi d'une dmarche heuristique, en ce que celle-ci propose un certain cheminement intellectuel
40 C'est ce quoi je me suis employ dans l'analyse de la dernire campagne lectorale : Entre populisme et peopolisme. Comment Sarkozy a gagn, Paris, Vuibert, 2008. 41 Dalbera.J.-Ph. (2002), Le corpus entre donnes, analyse et thorie , Corpus 1 : 99.

55

P. CHARAUDEAU

partir d'hypothses de base pour dcouvrir des faits et des ides 42, c'est--dire pour interprter. Or, interprter est une opration dlicate qui ne peut se faire qu'aprs coup, mme lorsque dans une dmarche plus exprimentale on fait des hypothses pralables. Interprter consiste en une opration de mise en relation des faits observs avec d'autres faits pour en tirer, par infrence, des hypothses de sens. Mais il est une autre activit interprtative, celle qui consiste mettre en relation les rsultats d'une analyse descriptive avec ceux d'autres analyses : ceux d'autres corpus connexes (confrontation des articles de diffrents journaux pour en interprter les ressemblances et diffrences) ; ceux de corpus de textes d'un mme domaine mais de situations diffrentes (confrontation des crits journalistiques de diffrentes poques) ; ceux, enfin, des analyses proposes par d'autres disciplines sur le mme domaine discursif (philosophie, histoire, sociologie, psychologie sociale), sur, par exemple, le domaine politique. Dans les sciences humaines et sociales la dmarche est double : empirico-descriptive et hypothtico-dductive . Lune ne va pas sans lautre : la premire est davantage dpendante doutils mthodologiques, la seconde de concepts fondateurs et de catgories explicatives. La premire se droule selon un mouvement centripte, la seconde selon un mouvement centrifuge, ce qui explique que les corpus qui s'inscrivent dans ces mouvements tendent, tantt se fermer sur eux-mmes, tantt s'ouvrir. Cest pourquoi un corpus nest jamais quun prtexte, au sens de ce quil est un point de dpart indispensable pour une analyse du discours, les textes devant tre confronts en permanence d'autres textes et d'autres corpus. Car les significations sociales se rpartissent dans une large combinatoire des mots en rapport avec leurs diffrents contextes. C'est galement pourquoi aucun corpus nest jamais dfinitivement ferm, sa clture ne pouvant tre que le fait d'une dcision provisoire des fins opratoires. Ce sont les

42 Voir le Dictionnaire de philosophie (entre Heuristique ), de Christian Godin, Paris, Fayard, 2004.

56

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

paramtres de contrastivit (externe et interne) du corpus qui par le jeu des ressemblances / diffrences font sens. Comment faire, ds lors, entre la conception d'un corpus compltement ferm sur lui-mme, mais dont on sait qu'il a besoin de se confronter d'autres corpus pour signifier, et la conception d'un corpus dclar ouvert, mais dont il faut chercher matriser les horizons sous peine de ne pouvoir le rendre opratoire ? Je procde pour ma part selon la mthode de l'escargot : partir d'un premier corpus noyau dtermin selon des paramtres de temps, d'espace, de genres, de dispositifs, de locuteurs, de thmes, etc., et ce en fonction des objectifs d'analyse que l'on se propose ; puis tendre progressivement ce corpus en le confrontant d'autres, autant que de besoin, en fonction des questions qui surgissent au fur et mesure des analyses. J'en donnerai pour exemple l'tude des discours d'une campagne lectorale. D'abord, on construit le corpus des dclarations du candidat X dont on fait l'analyse selon diffrentes catgories. Puis on peut confronter ces rsultats aux corpus des dclarations des candidats concurrents pour en reprer les diffrences et les jeux de renvois des uns aux autres, une sorte de jeu de miroir, comme le dit D. Mayaffre qu'il dsigne par l'expression corpus rflexifs 43. On peut aussi comparer ces rsultats aux corpus des candidats du mme parti des lections antrieures pour reprer en quoi ce candidat suit la mme doctrine que ses prdcesseurs ou s'en diffrencie, et l'on peut mme largir encore la comparaison en y intgrant le corpus des dclarations et crits qui concernent l'idologie d'appartenance du candidat afin de mesurer les degrs de filiation politique ; et l'on peut faire ce mme travail de confrontation pour chacun des autres candidats. On peut aussi comparer les prestations d'un mme candidat selon les situations de communication dans lesquelles il se trouve (meeting, interviews journalistiques, dclarations tlvise, dbats, etc.), afin de vrifier si ses stratgies de persuasion sont les mmes ou diffrentes dans chacun de ces cas.
43 Voir : Les corpus rflexifs : entre architextualit et hypertextualit , Corpus 1 : 51-69.

57

P. CHARAUDEAU

Tout corpus renvoyant d'autres corpus dans un enchanement de contextes situationnels, paratextuels et interdiscursifs, se construit progressivement sous forme de ce que G. Genette appelle une architextualit, notion reprise par les tenants d'un traitement informatis des textes44. Un jeu de rflexivit entre les corpus dont on voit qu'il ne peut tre qu'ouvert, car c'est la dcouverte progressive des questions qui se posent lors des analyses issues de ces confrontations qui renvoie d'autres textes et donc d'autres corpus. 2.4 La question du traitement quantitatif / qualitatif du corpus Je partage donc le point de vue de ceux qui disent que le corpus n'est pas l'outil de la recherche mais l'objet de la recherche45, du moins l'objet que l'on a construit en corpus en fonction de prsupposs thoriques et mthodologiques. Se pose alors la question du mode de traitement du corpus, corrlativement la question de la pertinence d'une analyse quantitative au regard de l'analyse qualitative. De ma pratique de sujet analysant et de la mthode d'analyse que nous avons prouve dans les travaux du Centre d'analyse du discours46 sur des corpus mdiatiques, j'en tire qu'il faut distinguer ce qui est de l'ordre du recueil des donnes, du relev des rcurrences, du reprage des conditions de communication. Le recueil des donnes relve d'une logique documentaire. L'objectif est de recueillir, dcrire et classer les objets du monde et les phnomnes sociaux, selon des critres de forme, sans hypothses particulires orientant la recherche dans une direction ou une autre, et ce avec un idal d'exhaustivit. Cela produits classements archivistiques divers, catalogues et bases de donnes. La dmarche est ici empirico-inductive , s'appuyant sur une mthodologie techniciste : les marqueurs de description et les catgories de classement sont penss simultanment avec les caractristiques de l'outil technologique (la performance de
44 Ibid. 45 Voir l'introduction de Damon Mayaffre au numro 4 de Corpus (2005) : 10. 46 Avec Claude Chabrol, Guy Lochard et Jean-Claude Soulages.

58

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

l'outil peut influer en retour sur les marqueurs et les catgories), ainsi que les modes de reprsentation de ces classements (arbres, nuages statistiques, tableaux corrlations diverses) et d'extractions des donnes pour fournir l'utilisateur les moyens de les consulter47. C'est une mthode descriptiviste . Un tel catalogage est indispensable toute recherche sur corpus, mais il ne faudrait pas faire passer ce stade de recueil d'un matriel d'analyse pour l'analyse elle-mme, car il se situe en amont de l'analyse. C'est en utilisant la base de donnes de l'Inathque sur la tlvision, la radio et le Web (en constitution) que l'quipe du CAD a procd ses analyses48. Le relev des rcurrences implique que la recherche soit oriente. Ici, contrairement au cas prcdent, les donnes sont corrles des variables externes qui sont en rapport de pertinence avec un objectif d'analyse, et les rcurrences sont releves et classes dans un certain ordre en fonction de ces variables. Par exemple, un ordre de rcurrence de mots et expressions corrl un type de locuteur dans une situation donne (un candidat dans une campagne lectorale), ou un ordre de rcurrence thmatique corrl un certain support, comme par exemple le relev des thmes traits par un journal propos d'un certain vnement et compar ceux relevs dans d'autres journaux. On peut videmment multiplier les variables, et l'on obtiendra un panorama des rsultats statistiques d'occurrences corrles diverses variables externes. Ici, on peut dire que, contrairement au cas prcdent, on a affaire une analyse quantitative fournissant de prcieux renseignements pour d'autres analyses postrieures, d'autant que le dveloppement d'outils techniques de plus en plus performants (logiciels et numrisation) permettent l'heure actuelle de procder rapidement de tels relevs.

47 Voir, par exemple, l' Hyperbase de l'Inathque de France. 48 Voir : La tlvision et la guerre. Dformation ou construction de la ralit ? Le conflit en Bosnie (1990-1994), in Charaudeau P. (dir.) (2001) ; et La mdiatisation de la science. Clonage, OGM, manipulations gntiques, in Charaudeau P. (dir.) (2008).

59

P. CHARAUDEAU

C'est dans ce genre d'analyse quantitative que s'inscrivent nombre de chercheurs en se rclamant, chacun sa faon, d'une linguistique de corpus de grands corpus faudraitil dire, car il n'y a aucune linguistique qui ne soit de corpus. Ces travaux livrent des rsultats prcieux, parfois indispensables pour fonder plus objectivement certaines analyses smantiques. Mais pour qui s'intresse, non seulement au sens des mots mais leur effet social en situation de communication (les mots comme facteur d'influence sociale), on ne peut s'empcher de faire les remarques suivantes. - L'importance et l'impact d'un mot (c'est--dire l'effet de sens) ne sont pas ncessairement lis sa rcurrence : l'expression fracture sociale employe par Jacques Chirac lors de la campagne prsidentielle de 1995, les mots karcher et racaille employs par Nicolas Sarkozy, ne furent employs qu'une seule fois par leurs auteurs, et l'effet qu'ils ont produit tient videmment au sens qu'ils avaient dans leur contexte situationnel et interdiscursif, mais aussi au fait qu'ils ont t relays par les mdias, donc par d'autres corpus. L'impact des mots n'obit pas ncessairement un critre quantitatif. L'important est qu'ils s'inscrivent dans un certain rseau discursif et qu'ils fassent cho un systme d'attente plus ou moins conscient. - Le sens des mots, on le sait, est pluriel. Non seulement du fait de leur polysmie, mais aussi parce qu'ils acquirent selon les contextes linguistique, paratextuel et interdiscursif ce que l'on pourrait appeler une polydiscursivit . Et cela est bien difficile mesurer quantitativement. J'en donnerai un exemple : rcemment, l'occasion de la dernire campagne lectorale, des relevs lexicomtriques49 ont mis en vidence la propension des deux principaux candidats, Nicolas Sarkozy et Sgolne Royal, employer le pronom de premire personne, Je. Cela a confort les commentateurs qui ont conclu la grande personnalisation de cette campagne. On fera remarquer,
49 Voir entre autres relevs ceux de l'Equipe PSYchologie de la COMmunication , LERASS / IUT Information & Communication de l'universit de Toulouse, dirige par Pierre-Olivier Dupuy et Pascal Marchand (consultables en ligne).

60

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

tout d'abord, que pour pouvoir juger de cette personnalisation, il faudrait comparer ces relevs avec ceux des campagnes prcdentes. Or, si l'on se reporte la campagne de 1988, on peut observer galement un emploi important du pronom Je, de la part de certains candidats50. Cela est bien naturel dans la mesure o un jeu d'alternance Je / Nous est inscrit dans le contrat communicationnelle du discours de campagne lectorale : le candidat se prsente la fois comme le porteur de la souverainet populaire (Nous), et comme un leader diffrent des autres (Je). Mais surtout, si l'on tudie l'emploi de ces je, non seulement dans leur contexte linguistique, mais en rapport avec l'environnement propre chaque dclaration politique (paratextuel) et avec l'ensemble des discours auxquels il est fait rfrence (interdiscours), on peroit deux choses. D'une part, que les Je de Nicolas Sarkozy et Sgolne Royal obissent un mme souci de se dmarquer de l'appareil de leur parti ; ce sont l des je de diffrenciation. Mais d'autre part, on observe une diffrence entre les deux : les Je (plus exactement les Je veux) de Nicolas Sarkozy construisent la figure d'un chef puissant et fort, prenant en charge toutes les responsabilits et les dcisions, s'instituant en homme d'action avec ardeur guerrire ; alors que les Je de Sgolne Royal construisent la figure d'une femme combattante anime d'une conviction profonde, tmoignant d'une attitude de protection et d'coute, de sincrit des sentiments, d'une ardeur faite davantage de courage, de tnacit que de dsir de puissance51 ; ce sont l des je d'appropriation. De ce point de vue, les analyses quantitatives, sans tre rcuses, ne peuvent fournir les rsultats que les analyses qualitatives, soucieuses de prendre en compte des rseaux d'interdiscursivit, pourront livrer. Il faudra mme se garder (tant donn l'engouement actuel pour ces analyses du nombre)
50 Voir : Groupe Saint-Cloud, Les prsidentielles. Regards sur les discours tlviss, Paris, Ina-Nathan, 1995. 51 Je rsume ici, de faon quelque peu cavalire, l'tude que j'ai faite de cette campagne, et laquelle je me permets de renvoyer le lecteur : Entre populisme et peopolisme. Comment Sarkozy a gagn, op. cit.

61

P. CHARAUDEAU

de rifier les premires, car cela aboutirait la neutralisation des secondes, ce qui rduirait considrablement le pouvoir explicatif de l'analyse du discours. Rappelons que la logique de la recherche repose sur une dmarche empirico-dductive de va-et-vient entre, d'un ct, dtermination des objectifs d'analyse et des hypothses signifiantes, et de l'autre, les mthodes d'observation des objets et de recueils de donnes selon une instrumentation qui doit pouvoir rendre compte des objectifs et des hypothses pralablement tablis. C'est dans un va-et-vient entre ces deux ples que s'laborent concepts, instruments d'analyse et interprtation des rsultats. Conclusion Il me reste renvoyer le lecteur aux tudes entreprises pas le Centre d'analyse du discours, pour illustrer cette dmarche d'articulation entre analyse quantitative et analyse qualitative que je rsume ici en quelques mots52. S'agissant de la faon dont la tlvision rend compte d'vnements sociaux (une guerre, une controverse sociale), doivent tre relevs, dans un premier temps, les sujets diffuss sur la question traite ; pour ce faire, on se plonge dans la base de donnes de l'Inathque dont un extrait les sujets la question et dont on constitue une sous-base (cela correspond la phase de relev des donnes). Puis on procde un dcryptage systmatique du matriel runi, en fonction dun certain nombre de paramtres externes renvoyant la situation d'nonciation et la thmatique. Ainsi, a-t-on pu tablir pour chacune de nos tudes : - pour le dispositif nonciatif : le type d'mission (Journal tlvis, reportage, interviews, dbats, etc.) qui permet de dterminer l'importance accorde par chaque chane au mode de traitement discursif (description, rcit, commentaire, argumentation) ;
52 Voir : La tlvision et la guerre. Dformation ou construction de la ralit ? Le conflit en Bosnie (1990-1994), op. cit. ; La mdiatisation de la science. Clonage, OGM, manipulations gntiques, op. cit.

62

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

l'identit des acteurs impliqus (politique, scientifique, journaliste spcialis, envoy spcial, institution, citoyen, etc.) qui permet de reprer la lgitimit et l'autorit des prises de parole ; - pour la thmatique : le capital thmatique (en nombre de sujets et en dure d'apparition) que chaque chane consacre l'vnement-thme. Cela fournit une donne objective quant l'importance donne l'vnement par chaque chane comparativement sa concurrente ; la hirarchisation thmatique (en heure moyenne) relative au moment d'apparition de l'vnement-thme dans chaque dition de JT (dbut, milieu, fin), donne objective quant la stratgie de traitement l'intrieur de la programmation (le conducteur ) de chaque chane. la distribution des domaines scniques53, comme variable de contenu, pour dterminer l'importance respective des univers de rfrence convoqus dans le traitement de l'vnement (scnes civile, humanitaire, diplomatique, etc. pour la guerre en Bosnie ; scnes scientifique, politique, thique, etc. pour la controverse sur le clonage), qui tmoignent de l'orientation dramatisante ou argumentative que propose chaque chane. Cette phase quantitative permet d'une part de constituer des indices reposant sur des rsultats statistiques, indices qui sont susceptibles de jouer le rle de symptme, et sur lesquels on fera porter les analyses qualitatives ultrieures54 ; elle permet, d'autre part, de constituer un corpus-chantillon, cest--dire un ensemble de fragments de texte qui peut tre considr comme reprsentatif au regard des catgories qui serviront l'analyser de faon qualitative : la parole des acteurs, les caractristiques du dispositif, le traitement de la thmatique. Ainsi peut-on
53 Pour la dfinition de domaine scnique , voir les tudes elles-mmes (note 49). 54 Voir la justification de cette dmarche in Charaudeau P., Lochard G., Soulages J.-C. (1996), La construction thmatique du conflit en exYougoslavie , Mots 47.

63

P. CHARAUDEAU

chapper la critique qui est faite parfois l'chantillonnage, savoir que ce n'est qu'une partie qui prtend reprsenter un tout. Notre chantillon n'est pas la partie d'un tout (comme serait un chantillon de mots reprsentatifs d'un tout textuel) ; il est constitu de catgories dont chacune joue le rle d'un point focal sur lequel faire porter l'analyse qualitative (les locuteurs, les genres, les thmes). Ainsi l'tude quantitative fait-elle sens en soi, mais un sens provisoire devant tre confirm, corrig, voire contredit, et en tout cas tendu et approfondi par l'analyse qualitative. Rfrences bibliographiques Anscombre J.-C. et Ducrot O. (1983). L'argumentation dans la langue. Bruxelles : Mardaga. Authier-Revuz J. (1982). Htrognit montre et htrognit constitutive : lments pour une approche de l'autre dans le discours , DRLAV 26 : 91-151. Barthes R. (1975). Roland Barthes par roland barthes. Paris : Seuil, coll. crivains de toujours . Barthes R. (1970). S / Z. Paris : Seuil. Bourdieu P. (1987). Choses dites. Paris : Minuit. Boyer H. (1983). Solidarit. Fortune politique, drive lexicale , Mots 7. Boyer H. (2002). Sociolinguistique : faire corpus de toute(s) voix ? , Mots 69 : 97-101. Boyer H. et Lochard G. (1998). Scnes de tlvision en banlieue. Paris : Ina-L'Harmattan. Branca-Rossof S. (1997). Les lettres de rclamation adresses au service de la redevance , Langage et socit 81. Charaudeau P. (dir.) (2001). La tlvision et la guerre. Dformation ou construction de la ralit ? Le conflit en Bosnie (1990-1994). Bruxelles : Ina-De Boeck. Charaudeau P. (2001). Vises discursives, genres situationnels et construction textuelle , in Analyse des discours. Types et genres. Toulouse : d. universitaires du Sud, 45-73. 64

Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

Charaudeau P. (2004). Le contrat de communication dans une perspective langagire : contraintes psychosociales et contraintes discursives , in Bromberg M. et Trognon A (dir.) Psychologie sociale et communication. Paris : Dunod. Charaudeau P. (2005). Le discours politique. Les masques du pouvoir. Paris : Vuibert. Charaudeau P. (dir.) (2008). La mdiatisation de la science. Clonage, OGM, manipulations gntiques, Bruxelles : InaDe Boeck. Charaudeau P. (2008). Entre populisme et peopolisme. Comment Sarkozy a gagn. Paris : Vuibert. Charaudeau P., Lochard G., Soulages J.-C. (1996). La construction thmatique du conflit en ex-Yougoslavie , Mots 47 : 89-107. Charaudeau P. et Maingueneau D. (2002). Dictionnaire d'analyse du discours. Paris : Seuil. Charolles M. (1995). Cohrence, cohsion et pertinence du discours , Travaux de linguistique 29 : 125-151. Courtine J.-J. (1981). Quelques problmes thoriques et mthodologiques en analyse du discours. A propos du discours communiste adress aux chrtiens , Langages 62 : 9-128. Dalbera.J.-Ph. (2002). Le corpus entre donnes, analyse et thorie , Corpus 1 : 89-101. Ducrot O. et alii (1980). Les mots du discours. Paris : Minuit. Ducrot O. (1991). Dire et ne pas dire. Paris : Hermann. Godin C. (2004). Dictionnaire de philosophie. Paris : Fayard. Groupe Saint-Cloud (1995). Les prsidentielles. Regards sur les discours tlviss. Paris : Ina-Nathan. Habert B. et alii (1997). Les linguistiques de corpus. Paris : Colin. Harris Z.S. (1969). Analyse du discours , trad. fr. in Langages, 13 : 8-45 (1re d. 1952, Discourse analysis , Language 28 : 1-30).

65

P. CHARAUDEAU

Krieg-Planke A. (2009). La notion de formule en analyse du discours. Cadre thorique et mthodologique. Besanon : Presses Universitaires de Franche-Comt. Maingueneau D. (1976). Initiation aux mthodes de lanalyse du discours. Paris : Hachette-Universit. Maingueneau D. (1996). Les termes cls de l'analyse du discours. Paris : Seuil, coll. Mmo ,. Maingueneau D. et Cossutta F. (1995). L'analyse des discours constituants , Langages 117 : 112-125. Mayaffre D. (2002). Les corpus rflexifs : entre architextualit et hypertextualit , Corpus 1 : 51-69. Mayaffre D. (2005). Les corpus politiques : objet, mthode et contenu , Corpus 4 : 5-19. Moeschler J. et Reboul A. (1994). Dictionnaire encyclopdique de Pragmatique.Paris : euil. Pcheux M. (1975). Les Vrits de La Palice. Linguistique, smantique, philosophie. Paris : Maspero. Pcheux M. (1975). Mise au point et perspectives propos de lAnalyse Automatique du Discours , Langages 37 : 7-80. Qur L. (1995). L'espace public comme forme et comme vnement , in Isaac J. (dir.) Recherches, Paris. Soulages J.-C. (2003). Identits discursives et imaginaires figuratifs , in Houdebine A.-M. (dir.) L'imaginaire linguistique. Paris : LHarmattan, 103-109. Tournier M. (2002). Article Lexicomtrie , in Dictionnaire d'analyse du discours. Paris : Seuil. van Dijk T.A. et Kintsch W. (1983). Strategies of discourse comprehension. New York : Academic Press. Williams G. (d.) (2005). La linguistique de corpus. Rennes : Presses Universitaires de Rennes.

66