Vous êtes sur la page 1sur 8

Analyse de discours et informatique

par

Michel PECHEUX
L./.S.H. - C.N.R.S. - PARIS

699

Actes du Congrs international informatique et sciences humaines


1981 - L.A.S.L.A. - Universit de Lige - Tous droits rservs.

Je commencerai par une remarque terminologique concernant l'expression "analyse de discours", en


soulignant que l'vidence de sa traduction littrale par "discourse analysis" dissimule une profonde
quivoque.
En effet, dans l'espace anglophone, la notion de "discourse analysis" semble surtout renvoyer l'tude
des processus interactifs de la conversation et de. la parole ordinaires. Il s'agit donc essentiellement
d'tudes psycho-linguistiques (mettant en jeu des notions telles que codage/dcodage, niveaux de
mmoire et systmes cognitifs individuels) ou sociolinguistiques (concernant les variations d'usages
langagiers, travers l'analyse des tours de parole et des actes de langage).
QUant aU domaine des tudes spcifiquement textuelles, il est principalement occup. par les mthodes
d'analyse de contenu, mettant en oeuvre, sur des corpus textuels de.dimension variable, une lecture
qu'on peut appeler "artificielle", dans la mesure o cette lecture suppose le dtour par un certain
nombre d'oprations systmatiques de lemmatisation, extraction, comptage, comparaison, etc...
Le caractre artificiel de cette lecture devient seulement plus vident quand le recours l'informatique
impose d'expliciter ces oprations travers des algorithmes. Dans cette perspective, le but gnral de
l'analyse textuelle informatise serait de construire des procdures automatiques de lecture-traduction,
allant de la surface des textes vers une reprsentation formalise non-ambigu susceptible de se prter
divers calculs (logiques, smantiques etc... ) que ne supportent pas les langues naturelles :en somme,
il s'agirait de "nettoyer" les textes pour en extraire le sens univoque, comme si on voulait se dlivrer
des embarras (ambiguits, glissements etc ... ) du langage naturel, afin de se retrouver le plus vite possible dans ces espaces logiquement stables qu'il est convenu d'appeler des "langages de reprsentation".
N'est-ce-pas, d'ailleurs -dira-t-on- ce que fait tout sujet humain quand, entendant ou lisant une squence,
il s'en construit une reprsentation utilisable (c'est--dire un schma, un modle simplifi et manipulable) ?
Or, c'est prcisment cette vidence logico-empirique de la lecture qui s'est trouve mise en question,
travers l'existence de ce que, depuis une quinzaine d'annes, la tradition francophone dsigne sous
le terme d' "analyse de discours" : il est bon de rappeler que, historiquement, cette problmatique
s'est forme (en ce qui concerne la France) autour de .Ia question de l'idologie, et en particulier de
celle de la lecture des discours idologiques.
\
Cette problmatique de la lecture idologique, qui au dbut des annes 60 tait en train de se condenser sous le nom de "structuralisme" autour de quelques noms comme ceux de Lvi-Strauss, Foucault,
Barthes, Lacan, Althusser ... tait en fait un dispositif polmique contre les conceptions dominantes
de l'poque, tout autant qu'un programme de travail.
Les conceptions dominantes de l'poque, c'est--dire: la fois l'hermneutique littraire spiritualiste
lisant les thmes travers les oeuvres comme les traces visibles d'un crateur invisible, mais aussi les
formes scularises, plus quotidiennes, de cette pratique spontane de la lecture qui, sous les

701

Actes du Congrs international informatique et sciences humaines


1981 - L.A.S.L.A. - Universit de Lige - Tous droits rservs.

multiples formes empirico-Iogiques de l'analyse de contenu, que je viens d'voquer, commenait


envahir les sciences humaines et sociales. Et enfin l'objectivisme quantitatif, ragissant par une rfrence au srieux des sciences, et d'abord, en l'occurrence, aux thories de l'Information et aux statis'
tiques, avant de faire appel la logique mathmatique comme c'est le cas aujourd'hui.
Face ces diverses formes (spontanes ou savantes) d'vidence empirique de la lecture, le mouvement
structuraliste europen des annes 60 ouvrait la question de savoir ce que c'est que parler; couter et
lire, travers des concepts comme ceux de "lecture symptmale" et d' "effet de discours", et des
mots d'ordre thoriques comme celui du "reprage de l'efficace d'une structure sur ses effets, travers
ses effets" : "c'est depuis Freud, crivait Louis Althusser au dbut de Lire le Capital, que nous commenons souponner ce qu'couter, donc ce que parler (et se taire), veut dire; que ce "veut-dire" du
parler et de l'couter dcouvre, sous l'innocence de la parole et de l'coute, la profondeur assignable
d'un double-fond, le "veut-dire" du discours de l'inconscient - ce double fond dont la linguistique
moderne, dans les mcanismes du langage, pense les effets et conditions formels"(1).
Ainsi, l'appui stratgique sur le structuralisme linguistique tait clairement revendiqu: s'il tait question d'analyser le "discours inconscient" des idologies, la linguistique structurale, science moderne de
l'poque, apparaissait comme le moyen scientifique privilgi d'un changement de terrain. Si les discours idologiques taient bien les mythes propres nos socits, comparables ceux qu'avaient tudis, dans leur domaine particulier, des thoriciens comme Vladimir Propp, puis Claude Lvi-Strauss,
il devait tre possible de construire des procdures effectives capables de restituer la trace de leur
structure invariante (le systme de leurs "fonctions") sous la srie combinatoire de leurs variations
superficielles, "empiriques" : donc de reconstituer quelque chose de cette "structure prsente dans la
srie de ses effets".
La mise au point du programme d'Analyse Automatique du Discours (publi en 1969 et informatiquement oprationnel partir de 1971) constitue une tentative parmi d'autres de raliser cet objectif en
s'efforant de prendre "la linguistique moderne" au srieux, en particulier F. de Saussure, et les travaux du linguiste amricain Z. Harris, auteur d'un texte providentiellement intitul "Discourse
Analysis", qui servit pendant toute une priode de rfrence concrte aux linguistes, historiens et
philosophes travaillant dans le champ de l'analyse de discours, sur la lance des travaux de Jean
Dubois.
De ce point de vue, la spcificit de AAD 69 dans l'espace francophone des travaux d'analyse de
discours, ce fut d'abord de pousser la linguistique harrissienne jusqu'au bout de ses consquences, du
point ,de vue thorique que je viens de rappeler, en ignorant plus ou moins dl ibrment, aussi bien
la linguistique gnrative-transformationnelle que la smiotique, les grammaires de texte et les tudes
analytiques du "langage ordinaire" qui se dveloppaient pendant ce temps-l dans la sphre anglophone.
Je reviendrai tout l'heure sur les consquences rtrospectives de ces ignorances, mais j'ind ique
d'abord comment Discourse Analysis de Harris s'est trouv incorpor, transform (et peut-tre

702

Actes du Congrs international informatique et sciences humaines


1981 - L.A.S.L.A. - Universit de Lige - Tous droits rservs.

dfigllr ?) dans cette entreprise : si l'on pose, selon .Ia perspective structural iste, que le sens d'une
surface textuelle existe dans le .jeu des rapports (d'quivalence, cOmmutation, paraphrase ... ) qui
s'tablissent .ncessairemen.t entre elle et d'autres sur.facestextuelles spcifiques, il en rsulte que
l'tude des processus discursifs (inhrents. la structur.e sous-jacente tudier) suppose la rfrence
des ensembles de surfaces (ou "corpus discursifs") que le dispositif informatique aura pour effet de
mettre en tat {j'auto-paraphrase potentielle, pour l'interroger sur sa structure, en gnralisant des
corpus ainsi. reprs par leurs "conditions (socio-historiques) de production", les procdures que
Harris avait conues et appliqlles sur certaines squences .trs particulires, marques par des rptitions et des strotypies internes, dont le fameux "Millions can't be wrcing" reste l'exemple princeps.
L'ordre et la disposition de la procdure AAD 69 se trouvaient par l mme dtermins, dans une
forme qui a .t effectivement applique diffrents corpus socio-historiques, le plus souvent rfrs
des doctrines idologiques homognes (2).
Je n'exposerai pas icile.dtail de cette procdure (on peut se reporter sur ce point au document
annexe mis la disposition des participants), mais simplement son principe, savoir:
1) Une phase de constructionsocio,historique dll systme de corpus soumis l'analyse, chaque
corpus t;;lnt constitu d'un ensemble de "squences discursives ;;lutonomes" (SDA) de dimension
gnralement suprieure la phrase, et pouvant atteindre la taille d'un paragraphe.
2) Une phase de dlinarisation syntaxique (manuelle) des SDAde chaque corpus, dgageant des
noncs lmentaires (munis d'une forme fixe, nonciative et grammaticale, remplie d'lments
lexicaux) et des connecteurs (de dtermination, subordination et coordination) entre ces noncs;
chaque SDA est ainsi restructure sous la forme d'un graphe dont les noncs constituent les
noeuds, les connecteurs constituant des arcs valus entre les noeuds.
Les donnes du programme informatique sont donc constitues par une liste d'noncs, et une
liste de relations binaires entre les noncs.
3) Une phase de traitement informatique, justifiant la prtention automatique de AAD 69, et
comportant:
un algorithme de comparaison des relations binaires deux deux, sur la base de leurs contenus
lexicaux identiques ou diffrents, ~ des places morpho-syntaxiques donnes, et aboutissant
une liste ,des couples de relations binaires dtermines commelexicalement proches ( partir
d'un calcul galement indiqu dans le docllment annexe);
un algorithme construisant, partir de ces couples de relations (ou "quadruplets") des chanes
de proximit, elles-mmes regroupes par transitivit en "domaines smantiques", qui constituent ainsi des points de rassemblement des sous-squences (portions de SDA) lies entre
elles par des relations de synonymie, mtonymie ou paraphrase;

703

Actes du Congrs international informatique et sciences humaines


1981 - L.A.S.L.A. - Universit de Lige - Tous droits rservs.

enfin, un algorithme calculant les rapports de dpendance entre les domaines smantiques, sur
la base des relations amont/aval entre les sous-squences l'intrieur du corpus, et ralisant
ainsi une reconstitution des trajets tnicro-argumentatifs propres ce corpus (le document
annexe fournit galement des exemples de rsultats concrets ces diffrents niveaux).
Je conclurai cette prsentation rtrospective de AAD 69 par quelques remarques lies l'tat actuel
des travaux du groupe de recherche ADELA ("Analyse de discours et lectUres d'archive") dont
plusieurs orateurs de cette session sont partie prenante, sous diverses formes qu'ils prciseront euxmmes.
Plus de quinze ans aprs l'pisode structuraliste que j'ai voqu avec ses a priori et ses ignorances
dlibres, il est temps pour nous de faire le point, sur les diffrents aspects philosophiques, sociohistoriques, linguistiques et informatiques engags dans cette entreprise interdisciplinaire.
Ma premire remarque concerne le rapport entre variation de forme (syntaxique et lexicale) et variation de sens. Nous avons dsormais les moyens de soutenir de manire argumente sur le terrain de
l'informatique la thse selon laquelle les ambiguts, mtaphores et glissements propres aux langues
naturelles sont des proprits incontournables du champ de l'analyse de discours, qui se diffrencie
par l mme de toute perspective strictement informationnelle, documentaire ou "intellectique" (3).
Un corpus d'archive textuelle n'est pas une "banque de donnes".
Simultanment, je soulignerai combien les procdures AAD 69 restent loin de compte quant l'apprhension de ce jeu entre le mme et l'autre, qui caractrise l'htrognit contradictoire de tout champ
d'archive: tant par les mthodes de calcul des proximits que par la rigidit pesante de l'analyse
syntaxique (manuelle de surcrdt) qu'elles supposent, et aussi l'obstination reconstruire des identits
paraphrastiques, les procdures AAD 69 demeuraient bien plus proches que je ne pouvais le supposer
l'poque des vidences empirico-Iogiques de la lecture. Encore une fois: l'quivoque du rapport
Harris !
Quant au refus historique de tout langage logique de reprsentation a priori, il apparat de plus en
plus justifi dans le domaine de l'informatique en sciences humaines, face l'largissement prvisible
de l'emprise des langues logiques rfrents univoques, importes du domaine des scien.ces de la
nature, des technologies industrielles ou des dispositifs de gestion-contrle administratifs. Mais tenir
cette position n'implique pas ncessairement que l'analyse de discours informatise doive tendre
raliser une auto-lecture de la structure des corpus par les corpus eux-mmes, comme AAD 69 le
sous-entendait: ce ne serait finalement qu'une nouvelle thologie, une thologie de la structure
taye sur une conception orthopdique de la connaissance; pour tout dire, l'informatique comme
prothse de la lecture, machine laver les textes, ou appareil rayons X !
L'ignorance des recherches de la "philosophie du langage ordinaire" semble avoir eu pour consquences de surestimer, en analyse de discours, le principe de l'homognit socio-historique des corpus

704

Actes du Congrs international informatique et sciences humaines


1981 - L.A.S.L.A. - Universit de Lige - Tous droits rservs.

discursifs, en restant aveugles sur le rle thorique que doivent y jouer l'vnement, la question, la
rplique, l'interruption et l'irruption.
C'est une situation assez intressante, pour un francophone comme moi, de pouvoir reconnatre de
tels dfauts, sans tomber immdiatement dans l' "empirisme anglophone", tout en s'adressant lui.
De manire plus gnrale, c'est mme, mon avis, une condition pour que l'analysede discours puisse
aujourd'hui continuer suivre son propre chemin.

NOTES
1)

L. Althusser, Lire le Capital, t. l, Paris, Maspro, 1968, p. 14-15.

2)

Cf. en annexe la liste non -exhaustive des travaux raliss l'aide de AAD 69.

3).

De ce point de vue, la manire dont Maurice Gross et Marcel-Paul Schutzenberger prsentent les
recherches menes actuellement en ce domaine apparat partielle, partiale et quelque peu tendancieuse : "Les mthodes (maintenant traditionnelles) d'analyse du discours ou de documentation automatique reposent, sans exception, sur l'utilisation de mots-cls". Suivent des remarques sur les tentatives de raffinements mthodologiques pour remdier ce dplorable tat de
fait dans les sciences humaines, et les deux auteurs poursuivent: "Toutes ces mthodes mettent
en jeu un langage documentaire particulier, 'est--dire un systme formalis dans lequel il est
ncessaire de traduire textes et questions." ( Complments sur le traitement des langues naturelles, in Les enjeux culturels de l'informatisation, La Documentation Franaise, 1980, p. 136137).

705

Actes du Congrs international informatique et sciences humaines


1981 - L.A.S.L.A. - Universit de Lige - Tous droits rservs.

BIBLIOGRAPHIE SUR L'ANALYSE DE DISCOURS EN FRANCE.


COU RTl NE Jean-Jacques, "Quelques problmes thoriques et mthodologiques en analyse du discours,

propos du discours communiste adress aux Chrtiens", Langages, 62, juin 1981, pp. 9-128.
DUBOIS, Jean, SUMPF Joseph, "L'analyse du discours", Langages, 13, mars 1969.
FUCHS Catherine, "Rfrentiation et paraphrase; variation sur une valeur aspectuelle", DR LA V, 21,

novembre 1979, pp. 32-41.


GADET Franoise, PECH EUX Michel, La langue introuvable, Paris,

Ma~pro,

1981.

GUI LHAUMOU Jacques, MALDI DI E R Denise, "Courte critique pour une longue histoire",

Dialectiques, 26, 1979.


HAROCHE Claudine, HEN RY Paul, PECH EUX Michel, "La smantique et la coupure saussurienne :
langue, langage, discours", Langages, 24, dcembre 1971, pp. 93-106.
HAROCHE Claudine, PECHEUX Michel, "Manuel pour l'utilisation de la mthode d'analyse automatique du discours (AAD)", T.A. Informations, 1, 1972, pp. 13-55.
HENRY Paul, Le mauvais outil, Paris, Klincksieck, 1977.
LEON Jacqueline, TORRES-LIMA Maria Emilia, "Etude de certains aspects du fonctionnement de
l'AAD; traitement des syntagmes nominaux complexes en expressions figes et segmentation d'un
corpus'en Squence Discursives Autonomes", T.A. Informations, 1, 1979, pp. 25-46.
MARANDI N Jean-Marie, "Problmes d'analyse du discours. Essai de description du discours franais
sur la Chine", Langages, 55, septembre 1979, pp. 17-88.
PECH EUX Michel, Analyse automatique du discours, Paris, Dunod, 69.
PECH EUX Michel, FUCHS Catherine, "Mises au point et perspectives propos de l'analyse automatique du discours", Langages, 37, mars 1975, pp. 7-80.
PECH EUX Michel, Les vrits de la Palice, Paris, Maspro, 1975.
PECHEUX Michel, HENRY Paul, POITOU Jean-Pierre, HAROCHE Claudine, "Un exemple d'ambigut
idologique: le rapport Mansholt", Technologies, Idologies et Pratiques, vol. Il,2, avril-juin 79, pp.
3-83.
CONEIN Bernard, COURTINE Jean-Jacques, GADET Franoise, MARANDIN Jean-Marie, PECHEUX
Michel, Matrialits Discursives 1., (actes du colloguqe de Nanterre, Paris X, avril 1980), Lille, PUL,
1981.
ROBI N Rgine, Histoire et Linguistique, Paris, Armand Colin, 73.

706

Actes du Congrs international informatique et sciences humaines


1981 - L.A.S.L.A. - Universit de Lige - Tous droits rservs.

LISTE NON-EXHAUSTIVE DE TRAVAUX REALISES A L'AIDE DE AAD 69.


BONNAFOUS, S. 1980.
Les motions du congrs de Metz (1979) du parti socialiste: processus discursifs et structures
lexicales. Thse de Illme cycle en linguistique, Universit de Paris X, Nanterre, rono, 259 p. +
annexes.
COTE, P. 1981.
L'analyse automatique du discours (AAD) de Michel Pcheux, DocumerHs gnraux du GRIDEQ
(Universit du Qubec Rimouski), n. 8, 78 p.
GAYOT, G. 1981.
Du pouvoir et des lumires dans la fraternit maonnique au XVlllme sicle, in Peuple et Pouvoir,
Essais de lexicologie, Lille, PUL.
GAYOT, G. et PECH EUX, M. 1971.
Le "Portrait" de Claude de Saint-Martin. Annales, XXVI (3-4) : 681-704.
PECH EUX, M. 1978.
Are the masses an animate object? in D. Sankoff (ed), Linguistic Variation: models and methods,
New York: Academie Press, 251-266.
PECH EUX, M., HENRY, P., POITOU, J.-P. et HAROCHE CI., 1979. Un exemple d'ambiguit idologique : le rapport Mansholt, Technologies, Idologies et Pratiques, 1 (2) : 3-83.
POITOU, J.-P., 1978.
La dynamique des groupes: une idologie au travail. Paris, Ed itions du CN RS, 257 p.

707

Actes du Congrs international informatique et sciences humaines


1981 - L.A.S.L.A. - Universit de Lige - Tous droits rservs.

Vous aimerez peut-être aussi