Vous êtes sur la page 1sur 31

Michel Pcheux Jacqueline Lon Simone Bonnafous Jean-Marie Marandin

Prsentation de l'analyse automatique du discours (AAD69) : thories, procdures, rsultats, perspectives


In: Mots, mars 1982, N4. pp. 95-123.

Citer ce document / Cite this document : Pcheux Michel, Lon Jacqueline, Bonnafous Simone, Marandin Jean-Marie. Prsentation de l'analyse automatique du discours (AAD69) : thories, procdures, rsultats, perspectives. In: Mots, mars 1982, N4. pp. 95-123. doi : 10.3406/mots.1982.1053 http://www.persee.fr/web/revues/home/prescript/article/mots_0243-6450_1982_num_4_1_1053

Abstract AUTOMATIC DISCOURSE ANALYSIS (AAD69) This set of four texts concerning Automatic Discourse Analysis is a critical restatement of the 1969 method, related to the development of a 1980 version. Michel Pcheux retraces the history of the method, conceived in the framework of the philosophical and linguistic structuralism of the sixties. The presentation of the AAD69 method (J. Lon), and the exposition of some recent results (S. Bonnafous) concerning socialist discourse can now only be considered as reference points in establishing a new viewpoint; thus, J. M. Marandin s criticism of the 1969 results and of certain failures of the method, such as the lack of enunciation and of sequential phenomena, leads on to a planned presentation of new algorithms conceived according to two dimensions: the "vertical" algorithms will handle statements, leaving a preponderant part to the lexicon and a relatively smaller part to paraphrase; and the "horizontal" algorithms will handle the discursive sequence itself. Discourse analysis was a "prosthesis for reading" ; AAD80, the method now under development, would like to make it a reading incentive. Rsum PRSENTATION DE L'ANALYSE AUTOMATIQUE DU DISCOURS (AAD69) Cet ensemble de quatre textes concernant l'Analyse Automatique du Discours constitue une mise au point critique de la mthode version 1969, en liaison avec l'laboration d'une version 1980. Michel Pcheux retrace l'historique de la mthode, conue dans le cadre du structuralisme (philosophique et linguistique) des annes 1960. La prsentation de la mthode AAD69 (J. Lon) et l'expos de certains rsultats rcents (S. Bonnafous) sur le discours socialiste ne peuvent se considrer l'heure actuelle que comme un point de repre pour la mise en place de perspectives nouvelles. Ainsi la critique de J.M. Marandin sur les rsultats et sur certaines carences de la mthode telles que l'absence de renonciation et du fait squentiel, dbouche sur une prsentation programmatique de nouveaux algorithmes envisags selon deux espaces: les algorithmes verticaux traiteront des noncs, accordant au lexique une place dterminante et la paraphrase une place relative; et les algorithmes horizontaux traiteront la squence discursive elle-mme. L'analyse de discours tait une prothse de la lecture; l'AAD80, en cours d'laboration, voudrait la transformer en provocation la lecture.

MICHEL PCHEUX LABORATOIRE DE PSYCHOLOGIE SOCIALE, PARIS VII, CNRS JACQUELINE LON LABORATOIRE D'INFORMATIQUE POUR LES SCIENCES DE l'HOMME, CNRS SIMONE BONNAFOUS UNIT DE RECHERCHE LEXICOLOGIE ET TEXTES POLITIQUES INSTITUT DE LA LANGUE FRANAISE, SAINT-CLOUD JEAN-MARIE MARANDIN INSTITUT DE LA LANGUE FRANAISE UNIVERSITY OF CALIFORNIA LOS ANGELES

Mots, 4, 1982

Prsentation

de

l'analyse

automatique

du

discours

(AAD69) Thorie, procdures, rsultats, perspectives

PRESENTATION THORIQUE DE L/AAD69

Les rfrences thoriques (positives et ngatives) qui, partir de 1966, ont prsid la construction du dispositif A AD (Analyse automatique du discours paru en 1969 chez Dunod, premier programme informatique oprationnel en 1971), s'inscrivent dans l'espace du structuralisme philosophique des annes 1960, autour de la question de l'idologie, et en particulier celle de la lecture des discours idologiques. La problmatique structuraliste, qui tait en train de se condenser autour de quelques noms comme ceux de Lvi-Strauss, Foucault, Barthes, Althusser..., tait un dispositif polmique contre les ides dominantes de l'poque, tout autant qu'un programme de travail.

96

PECHEUX, LEON, BONNAFOUS, MARANDIN Les ides dominantes de l'poque, c'est--dire : Les restes <, qui ne se portaient pas si mal (et qui ont la vie dure !) d'un

spiritualisme philosophique adepte d'une conception religieuse de la lecture : de l'hermneuti que littraire, pourchassant les thmes travers les uvres, la conception phnomnologique du . projet comme projection du sens sur la matire verbale par le pouvoir constituant du sujet-lecteur... l'ide que le sens des textes est le corrlat d'une conscience-lectrice, installe dans une subjectivit interprtative sans rivages. Mais aussi les formes scularises, plus quotidiennes, de cette pratique spontane de la lecture, qui, sous les multiples formes de l' analyse de contenu, tait en train d'envahir les sciences humaines. Et enfin, l'objectivisme quantitatif ragissant aux spiritualismes impressionnistes par une rfrence au srieux des sciences, et d'abord, en l'occurrence, aux thories de l'information: le projet de traiter les textes comme des populations de mots, susceptibles d'une sorte de dmographie statistique des textes (telle qu'elle se ralise par exemple dans les tudes lexicomtriques). Le structuralisme philosophique des annes 1960 partait en guerre contre ces diverses formes (spontanes ou savantes) d'vidence empirique de la lecture, avec sur ses drapeaux des concepts comme ceux de lecture symptmale et de thorie du discours, et des mots d'ordre comme celui du reprage de l'efficace d'une structure sur ses effets, travers ses effets. Marx, Nietzsche, Freud et Saussure taient recruts pour un mme combat, portant en l'occurrence sur la question de savoir ce que c'est que parler, couter et lire. C'est depuis Freud, crivait Louis Althusser au dbut de Lire Le Capital, que nous commenons du "veut-dire" souponner parler et de ce l'couter qu'couter, dcouvre, donc sous ce que l'innocence parler (et desela taire), parole veut et de dire; l'coute, que ce la profondeur assignable d'un double fond, le "veut-dire" du discours de l'inconscient ce double fond dont la linguistique moderne, dans les mcanismes du langage, pense les effets et conditions formels (p. 14-15). Ainsi, l'appui stratgique sur le structuralisme linguistique tait clairement revendiqu; s'il tait question d'analyser le discours inconscient des idologies, la linguistique structurale, science moderne de l'poque, tait le moyen scientifique de dplacer le

ANALYSE AUTOMATIQUE DU DISCOURS

97

terrain des questions du domaine du quantitatif vers celui du qualitatif, de la description statistique vers une thorie quasi algbrique des structures, tout en repoussant le n'importe quoi des lectures littraires. Si les discours idologiques taient bien les mythes propres nos socits, comparables ceux qu'avaient tudis Vladimir Propp, puis Claude Lvi-Strauss, il devait tre possible de construire des procdures effectives capables de restituer la trace de leur structure invariante (le systme de leurs fonctions) sous la srie combinatoire de leurs variations superficielles, empiriques : donc de reconstituer quelque chose de cette structure prsente dans la srie de ses effets. La mise au point de TAAD69 constitue une tentative, parmi d'autres, de raliser ce programme, en s'efforant de prendre au srieux la linguistique moderne, et en particulier les travaux d'un linguiste amricain, auteur d'un texte providentiellement intitul Discourse Analysis qui servit pendant toute une priode de rfrence scientifique concrte aux linguistes travaillant dans le champ de l'analyse de discours, sur la lance des travaux de Jean Dubois. De ce point de vue, la spcificit de l'AAD version 69, dans l'espace des travaux d'analyse de discours, ce fut d'abord, me semble-t-il, de pousser la linguistique harrissienne jusqu'au bout de ses consquences, du point de vue thorique que je viens de rappeler. Si le sens d'une surface textuelle existe dans le jeu des rapports (d'quivalence, commutation, paraphrase...) qui s'tablissent ncessairement entre elle et d'autres surfaces textuelles spcifiques, il en rsulte que l'tude des processus discursifs (inhrents la structure sous-jacente tudier) suppose la rfrence des ensembles de surfaces (ou corpus discursifs) que le dispositif aura pour effet de mettre en tat d'auto-paraphrase potentielle, pour l'interroger sur sa structure, en gnralisant des corpus ainsi reprs par leurs conditions (socio-historiques) de production les procdures que Harris avait appliques certaines squences particulires, marques par des rptitions, des strotypies internes, comme le fameux exemple de Millions can't be wrong, prsent au n 13 de Langages. L'ordre et la disposition des procdures AAD69 se trouvaient par l mme fixs; TAAD69 comportait ncessairement: une phase de construction socio-historique des corpus soumis^ l'analyse ; puis une phase harrissienne de dlinarisation syntaxique des surfaces textuelles du corpus, dgageant les noncs lmentaires et les relations linguistiques entre ces noncs ;

98

PECHEUX, LEON, BONNAFOUS, MARAND1N et une phase de traitement automatique des donnes issues de l'analyse syntaxique. C'est cette dernire phase qui justifie la prtention automatique de l'AAD.

L'objectivit d'un processus fonctionnant par soi-mme visait explicitement djouer les vidences subjectives de la lecture, en esprant mettre jour des traces de cette fameuse structure sous-jacente du corpus textuel tudi. La mise en uvre de procdures algorithmiques effectives tait donc une condition essentielle de l'entreprise, et elle le demeure aujourd'hui, travers les restructurations assez radicales des diffrents aspects de l'AAD dans lesquels nous sommes actuellement engags.

PRESENTATION DE LA PROCEDURE D'ANALYSE AUTOMATIQUE DU DISCOURS

Cette prsentation n'a d'intrt que d'un point de vue historique : elle constitue une sorte de bilan, sinon de point final aux utilisations de la mthode d'analyse du discours mise au point par Michel Pcheux en 1969. Ce texte prsente en effet un rsum, une mise plat mme de cette mthode, dans la mesure o il ne reprend pas les aspects thoriques qui ont prsid son laboration et qui viennent d'tre voqus. Il peut servir de point de repre au lecteur qui s'intresserait de nouveaux algorithmes (version AAD 80) d'analyse du discours, dont les perspectives sont exposes la fin de cet article. Dans le nouveau projet, la structuration des donnes prsentes ci-dessous, rtrospect ivement inacceptable d'un point de vue linguistique, sera compltement transforme. Cependant, l'ide d'un algorithme paradigmatique de mise en paraphrase, celle d'un reprage de chemins apparents au fil du discours ne sont pas invalides: elles peuvent en effet constituer un aspect, interprt diffremment, des nouveaux algorithmes.

99 Les donnes LE CORPUS En vue d'illustrer par un exemple l'expos de l'algorithme AAD69, nous avons choisi une partie du corpus de Simone Bonnafous sur les motions du Congrs de Metz du PS, de 1979, dont elle prsentera ci-aprs des rsultats. Ce corpus de type archives l a t constitu partir de trois motions de ce congrs : la motion A (Mitterrand), la motion (Rocard) et la motion E (CERES), choisies en fonction des hypothses politico-historiques de Simone Bonnafous. Deux thmes (l'union de la gauche et l'conomie), pour chaque motion, ont permis de construire six corpus de base. Le traitement portera sur onze corpus : les six corpus de base et les cinq compactages 2 (trois compactages regroupant deux corpus par motion et deux compactages regroupant trois corpus par thmes). Exemple 1. Les 6 corpus de base + les 5 compactages

Economie Motion A (Mitterrand) Motion (Rocard) Motion E (CERES) ACE

Union de la gauche A CU ecu ECU . Union de la gauche . . .

CCE ECE

. Economie

1. Les corpus traits par TAAD69 ont t de deux types: les corpus exprimentaux et les corpus archives. Ces derniers constituant, en fonction des perspectives thoriques actuelles, les seuls types de corpus traitables par l'analyse de discours. 2. On appelle compactage le regroupement de deux ou plusieurs corpus qui seront alors traits comme un seul corpus.

100

PCHEUX, LON, BONNAFOUS, MARANDIN Nous avons dcid de nous intresser au corpus de base ACU, en raison de la taille des

rsultats pouvant tre exposs aisment. LES SQUENCES DISCURSIVES AUTONOMES La premire tape, manuelle, de la procdure consiste diviser le corpus en Squences discursives autonomes (dites SDA) constituant les units maximum de comparaison. L'ide d'une segmentation en SDA est cohrente avec une des hypothses principales de l'AAD concernant le processus de production d'effet de sens. C'est en effet partir de la mise en relation de deux squences, de l'tude de leurs capacits de commutation, de substitution, ventuellement d'quivalence, qu'on va pouvoir mettre en vidence les processus discursifs. Les SDA sont nanmoins le produit d'un arrachement de morceaux de texte qui interdit tout traitement de ce texte dans sa squentialit. Ainsi, si l'on prend comme exemple le corpus ACU, la srie de paragraphes, initialement retenue par l'analyste, est divise en vingt-cinq squences discursives autonomes, l'issue de la procdure de segmentation. Cette procdure de segmentation d'un corpus en SDA s'effectue selon les critres linguistiques tels que les liens interphrastiques (anaphores, ellipse, connecteurs de jonction3), auxquels il faudra rajouter, aprs une srieuse tude linguistique, les questions de modalit, aspect, temps, dterminants. Les SDA, au minimum une phrase, se dfinissent par leur unit thmatique: Soit une phrase i, si la phrase j suivante commence par un connecteur de jonction (mais par exemple), on ne segmente pas; il y a continuit thmatique de i j, et les phrases i et j appartiennent la mme SDA. Si la phrase j contient une anaphore dont le rfrent est contenu dans la phrase i (type anaphor simple4: Jean... Il), les phrases i et j appartiennent la mme SDA dans la mesure o l'anaphore assure une unit thmatique entre les phrases i et j5. 3. Par connecteur de jonction on entend: les conjonctions de coordination, les locutions conjonctives, les locutions prpositionnelles, les locutions adverbiales et adverbes de phrases. 4. Ne sont pas examins ici tous les types d'anaphores, qui, dans certains cas, posent des problmes complexes de segmentation. 5. Cette nouvelle condition sur la non-segmentation discursive dans le cas de l'anaphore simple constitue une rectification des propositions prsentes dans l'article de J. Lon et M.E. Torrs-Lima, qui ne prenaient pas en compte la dfinition de la SDA en tant qu'unit thmatique.

ANAL YSE A VTOMA TIQ UE DU DISCO URS Ces deux conditions segmentation. L'ANALYSE SYNTAXIQUE constituent ainsi les deux conditions principales

101 de non-

L'analyse syntaxique des SDA correspond une dlinarisation manuelle de la surface du texte. Chaque SDA est analyse sous forme d'un graphe dont les points sont des propositions (au sens de la grammaire traditionnelle), huit places morpho-syntaxiques, et dont les arcs sont les connexions entre ces propositions. Les huit catgories morpho-syntaxiques constituant les propositions (ou noncs lment aires) sont les suivantes: Dl, dterminant du N1 N1, en gnral un nom ou mtaterme en position du sujet V, verbe ou mtaterme indiquant la prsence d'un syntagme nominal complexe ADV, adverbe d'adjectif, de verbe ou de phrase PP, prposition lie la rection du verbe ou introduisant un complment circonstanciel D2, dtermination du N2 N2, nom en position de complment, adjectif, ou mtaterme image d'une compltive/infinitive. Le graphe est reprsent par une liste de relations binaires associant deux noncs lmentaires par un connecteur, not CO (voir graphe de la SDA 9, p. 103). Nous donnons ici, pour les besoins de notre expos, les exemples d'analyse syntaxique des SDA ACU5 et ACU9 : Exemple 2: SDA ACU5 Le Parti communiste n'a particip (avec de Gaulle, Gouin, Bidault et Ramadier) qu' des gouvernements d'union nationale de concentration rpublicaine. a) Liste des noncs F D, ACU0540410003L ACU0540420000R ACU0540430000R ACU0540440000R ACU0540450000R ACU0540460003R ACU0540470003R ACU0540480003R ACU0540490003R V N, PC PARTICIPER GOUVERNEMENTE UNION E GOUVERNEMENTE CONCENTRATIO E PC PARTICIPER PC PARTICIPER PC PARTICIPER PC PARTICIPER ADV PP D2 SEULA DS 0 DE 0 0 0 0 DE 0 0 0 SEULAVECO SEULAVECO SEULAVECO SEULAVECO N2 GOUVERNEMENT UNION NATIONAL CONCENTRATIO REPUBLICAIN DE GAULLE GOUIN BIDAULT RAMADIER

102

PECHEUX, LEON, BONNAFOUS, MARANDIN b) Liste des relations binaires

4041924042 4042924043 4041924044 4042404044 4044924045 4041094046

4041094047 4041094048 4041094049 4046404047 4047404048 4048404049

Exemple 3: SDA ACU9 Le point qui nous importe aujourd'hui est de savoir s'il est imaginable que le PC change d'attitude, cesse bientt de considrer les socialistes comme ses adversaires principaux, et de prfrer le gouvernement de la droite et du grand capital la victoire des travailleurs. Rien ne le montre. a) Liste des noncs V IMPORTER SAVOIR ETRE CHANGER CESSER CONSIDERER CONSIDERER E PREFERER E E E PREFERER E MONTRER ADV

F D, ACU0941 1700000 ACU0941 1800000 ACU0941 1900000 ACU0941200020L ACU0941210020R ACU0941220000R ACU0941230000R ACU0941240000R ACU0941250000R ACU0941260000R ACU0941270000R ACU0941280000R ACU0941290000R ACU0941300000R ACU09413101000

N, S NOUS S PC PC PC PC ADVERSAIRE PC GOUVERNEMENT GOUVERNEMENT CAPITAL PC VICTOIRE RIEN

D2 AUJ 0 * 0 0 DE 0 OTOTO 0 * LS SES 0 * L DE L DE L 0 L DE LS * 0

N2 NOUS S IMAGINABLE ATTITUDE 0 SOCIALISTE ADVERSAIRE PRINCIPAL GOUVERNEMENT DROITE CAPITAL GRAND VICTOIRE TRAVAILLEUR CELA

103

Graphe ACU9

Uns

104

PCHEUX, LON, BONNAFOUS, MARAND1N b) Liste des relations binaires 4117054118 4118134119 4119054120 4119054121 4120404121 4121064122 4122104123 4123924124 4121064125 4122404125 4125924126 4125924127 4126404127 4127924128 4125084129 4129924130 4117604131

L'algorithme Un programme en FORTRAN IV, mis au point par Philippe Duval et Michel Pcheux en 1971-1972, a permis de raliser l'algorithme expos ci-dessous. LA FORMATION DES QUADRUPLETS La procdure est la suivante : le programme compare toutes les relations binaires d'une SDAi toutes les relations binaires des autres SDA du corpus, l'exclusion des relations binaires de la SDAi ; ceci dans la mesure o les SDA peuvent prsenter une rptition interne qui viendrait brouiller les effets de paraphrase rparables dans le corpus. Nous allons illustrer la procdure de mise en paraphrase de deux relations binaires en empruntant au corpus ACU la relation binaire 4041 92 4042 (SDA5) et la relation binaire 4125 92 4126 (SDA9). On compare les deux relations binaires catgorie (morpho-syntaxique) par catgorie. On construit alors un vecteur boolen : 1 si le lexique est identique dans la catgorie explore, 0 s'il est diffrent. On multiplie ensuite ce vecteur par un pattern entr en donne, qui affecte chaque catgorie morpho-syntaxique un poids dtermin de faon empirique6. La somme des poids obtenue est compare une borne, galement entre en

6. Le terme empirique, en ce qui concerne le systme de pondration, renvoie la fois une hirarchie intuitive (videmment fort discutable) institue entre les catgories syntaxiques, et au fait que cette hirarchisation optimise les rsultats, du moins quantitativement.

ANALYSE AUTOMATIQUE DU DISCOURS

105

donne et tablie de faon empirique7. Si cette somme est suprieure ou gale la borne, le couple de relations binaires compar est retenu et constitue ce qu'on appelle un quadruplet.

Exemple 4: comparaison de deux relations binaires F ACU5 ACU9 D,N, V ADV PP D2 N2 DS GOUVERNEMENT L 0 0 0 GOUVERNEMENT 1 6 6 CO 92 92 1 6 6

4041 0003 L PC 4125 0000 R PC 0 1 0 6 0 6 Dj N,

PARTICIPER SEUL A PREFERER 0 6 0 0 0 0 0 V* E E 1 3 3 * 0 5 0

vecteur boolen 0 poids 5

vecteur x poids 0 F ACU5 ACU9

ADV PP D2 N2 0 0 1 0 0 DE 0 DE L 10 5 5 0 0 UNION DROITE 0 6 0

4042 0000 R GOUVERNEMENT 4126 0000 R GOUVERNEMENT

vecteur boolen 111 poids 5 0 6 0 6

vecteur x poids 5 I vecteur x poids = 37

7. Le terme empirique, dans le cas de la borne, signifie que c'est l'exprience compare des rsultats obtenus sous diffrentes conditions, et non pas telle ou telle procdure de validation statistique, qui a conduit retenir certaines valeurs de variables. 8. Les mtatermes, entrs en paramtres l'intrieur du programme, sont affects d'un poids moins fort qu'un item lexical plein.

106

PCHEUX, LON, BONNAFOUS, MARANDIN La borne entre en paramtre tant gale 36, le quadruplet form des deux relations

binaires est retenu9. On obtient sept quadruplets l'issue de la comparaison des relations binaires des SDA5 et SDA9. Par ailleurs, la comparaison des relations binaires de l'ensemble des SDA du corpus a fourni vingt-cinq quadruplets.

Exemple 5: Liste des quadruplets forms l'issue de la comparaison des SDA: ACU5 et ACU9. 1. 2. 3. 4. 4041 4125 4041 4125 4041 4125 4041 4125 92 92 92 92 92 92 92 92 4042 4126 4042 4127 4044 4126 4044 4127 7. 5. 4042 4127 4042 4126 4044 4127 92 92 40 40 92 92 4043 4128 4044 4127 4045 4128

6.

LA FORMATION DES CHAINES Les vingt-cinq quadruplets constituent la premire tape quantitativement exhaustive des rsultats sur l'ensemble du corpus ACU. Ces rsultats vont maintenant tre rorganiss par transitivit selon deux axes, vertical et horizontal.

9. Soulignons titre indicatif que le chiffre maximum de la somme des poids, obtenu lorsque les deux relations binaires sont identiques, est gal 62.

ANALYSE AUTOMATIQUE DU DISCOURS Exemple 6 : Liste des chanes regroupant les 7 quadruplets chane 1 chane 2 chane 3 - chane 4 4041 4125 4041 4125 4041 4125 4042 4126 4041 4125 4041 4125 92 92 92 92 92 92 40 40 92 92 92 92 4042 4126 4042 4127 4044 4127 4044 4127 4042 4126 4044 4126 40 40 92 92 92 92 92 92 40 40 4044 4127 4043 4128 4045 4128 4045 4128 4044 4127 92 92 4045 4128

107

chane 1 et 4 quad 3

chane 5 quad 3

Si les numros d'noncs droits d'un quadruplet sont identiques aux numros d'noncs gauches d'un autre quadruplet, ils formeront une chane par transitivit. Reprenons le cas des SDA5 et 9. Dans un premier temps, les sept quadruplets issus de leur comparaison donneront par transitivit horizontale les quatre premires chanes ci-dessous, le quadruplet 3 restant isol. Dans un second temps, les chanes 1 et 4 sont regroupes pour donner la chane 5 ; l'tape de formation des chanes s'achve lorsque tous les regroupements par rcursivit ont t effectus. FORMATION DES DOMAINES Si deux chanes ont une squence commune, c'est--dire si la suite des numros d'noncs et de connecteurs suprieurs d'une chane est identique une suite d'une autre ne* chane, par transitivit verticale on formera un domaine. On regroupera que des chanes de longueur semblable.

108

PECHEUX, LEON, BONNAFOUS, MARANDIN En ce qui concerne la formation des domaines pour les SDA5 et SDA9, on obtient trois

domaines : Exemple 7: Liste des domaines regroupant les 7 quadruplets

chane 5 chane 2 et 3

Dj D2

4041 4125 4041 4125 4041 4041 4125

92 92 92 92 92 92 92

4042 4126 4042 4127 4044 4044 4126

40 40 92 92 92

4044 4127 4043 4128 4045

92 92

4045 4128

quad 3

D4

La mise en paraphrase des squences est donc ralise deux niveaux, vertical et horizontal. Les domaines prsentent des classes d'quivalences qu'il s'agira d'interprter partir des invariants ayant permis le regroupement des squences. Sur l'ensemble du corpus ACU on a obtenu treize domaines, parmi lesquels les trois domaines voqus l'instant et dont la liste figure la page suivante (exemple 8). RELATIONS ENTRE DOMAINES Aprs la liste des domaines un second type de rsultats est constitu par les relations entre domaines. Elles sont de deux types : l'une paradigmatique aboutit la construction des hyperdomaines, l'autre syntagmatique tablit des relations de dpendance entre les domaines et les hyperdomaines entre eux. a) Constitution des hyperdomaines Les hyperdomaines sont forms partir des numros d'noncs gauches des domaines en fonction de trois types de relations: l'inclusion (ICL), l'intersection (INT), et l'identit d'origine (IRG).

ANALYSE AUTOMATIQUE DU DISCOURS

109

ICL: tous les numros d'noncs gauches d'un domaine Di appartiennent galement Dj ; exemple: Dl ICL D2, le domaine 1 est inclus dans le domaine 2. Dl et D2 forment un hyperdomaine. INT: le domaine Di a en commun avec le domaine Dj un ou plusieurs noncs gauches; exemple: D12 INT Dl, D12 et Dl forment un hyperdomaine. IRG: les domaines Di et Dj ont tous leurs numros d'noncs gauches communs; exemple: D4 IRG Dl, Dl et D4 forment un hyperdomaine.

'Exemple 8 : FORMATIOR MDIUI-II DCS Ont4-^~ INES i ooon fc farmciper imiHintit I 40*1 *1*1 - - 9scui*|- j .- j *->- caacsaraaTaf us freferer t l!MIII(lf a ta* * ouverrehcrte 141- --14- 0t^ t- CAFITAL a- *-* cafital 1ni*it s a -1 OOOSL FC articiper --- seul--: o- - a0*1 UftlOR a -tas- fc rfrer . . t- 1.. a- ui- 120 OOOOR CAFITAL 0 -0*1-00011 - FC- - ARTICIFER IUl -* - (s oooo o a o icruiitctii 00 ! . 0000 FRtPOSITIOR ICC *ts *IO-0e00l URIOR EfOIR li OOOOC FROFOSITIOR SUERER I?- R0TRF4RT! 0IVOIR-- . OlAtRC 0 1-00OJV- FC- -' FARTICIFER 0110 ?a - - : : tas 0000 FC FREFERER OUVERREnERT a ia *OUVRRE*ERTE 001- 0 SOSO OOOIL FC .. *((-O((ll FC - - CHOISIR i 0 O SI- OOOOR.- -ALLIARCt --E li run *2-*2-000* FARTI ^E- , ' f EirLS MHI 2 ll OOOOR FARTI *2J* 00000 - - ASSOCIER ! *JJ*-O((R AT. : E 2*0 00110 EfTRL OISCOURS 2 lT 000(R OISCOURS E ! ni ooor ai sta a* ooooo LS DOUAIRE OOOOR FORCE a - Foacc -sa sai oooo force 0 FORCE o aooiR CHOISIR L CCORO ta oO oooo ACCORD OR* OOOIt ( re CHOISIR a * ooooR CCOR 1 ACCORD 01 0 f a OOOOR E*OLUTId E a..-oi-L coRHuatsnt a -. SSI 0100R t 0 S L FOIITIRUE a isa ooooR politique - 1( - ! Of* OOOOR FC ROHPRE Fl UIIO< 122. OOOOR. FC.- CORStaCRER 0 -.. LS - SOCIALISTS 1 RO It attT 000(0.- %. . inatcR s- !. aoes svala IK 00020 S s sas nous . oox*ic ta tas oooR fc FREFERER tat 15* OOOOO . a- aisa ooooe FREFERER IS* * isf FREFERER DS ROTIOR 01 R4 tl IT* 0(00 FARM S LIER LIER as ooooo Raws ROS LIE* a-aa LU* IT* 0000 FARM tTtitI 9 S LIER a tTt LIE* - ' . . . . .

ooite RA*a

- - I. 1 - - -a -( BE - -

a - a L L L a L vfcts AfECLS

IRECT SOCIALISTE -RREPERCRTIEL SOCtRLtSTI 0 FRARCAI* IS SOCIALISTE. s - - - ialocwe VICTOIRE *| FRATtawc svaticar ASSOCIATIOR

110

PCHEUX, LEON, BONNAFOUS, MARANDIN Par transitivit, on peut former un seul hyperdomaine comprenant les domaines Dl, D2,

D4 et D12 : HD1 = (Dl, D2, D4, D12) Les hyperdomaines constituent des classes d'quivalence de dimension suprieure celles des domaines, partir d'une mise en paraphrase sur l'axe paradigmatique. b) Relations de dpendances entre domaines Deux domaines sont en relation de dpendance s'ils contiennent des numros d'noncs appartenant un mme chemin de la mme SDA : ex. : D10 -> D4 Le domaine D10 domine le domaine D4: D10 contient l'nonc 4122 appartenant au mme chemin (4117 -+ 4118 -* 4119 -+ 4120 - 4121 -+ 4122 -> 4125 - 4126 -+ Mil -* 4128) voir page 103 que l'nonc 4125 de D10. L'nonc 4122 domine l'nonc 4125 dans la mesure o il apparat en amont dans le chemin du graphe de la SDA. Cette localisation en amont dans le graphe d'une SDA correspond la position relative des noncs dans une phrase ou dans la SDA (proposition principale/proposition subordonn e, dtermin/dterminant, succession de deux principales dans deux phrases diffrentes). On pourrait dire alors que ces relations de dpendances sont l'image d'une sorte de micro-argumentation interne la SDA. Ces relations de dpendances regroupent ainsi des domaines selon un axe syntagmatique (appartenant un mme chemin). Cependant, elles introduisent une relation paradigmatique entre les autres parties du domaine n'appartenant pas ncessairement un mme chemin, telles les relations binaires 4041 92 4044 et 4094 40 4095. La question est alors de savoir si l'on peut interprter l'ensemble des relations entre domaines d'un corpus comme l' argument ation sous-jacente du corpus. L'ensemble de ces relations de dpendance peuvent se reprsenter sous la forme d'un graphe qui sera comment plus avant (p. 111-116) lors de l'analyse des rsultats du corpus ACU, compars aux rsultats du corpus CCU.

Ill PRSENTATION DE RSULTATS DE L'AAD69 SUR DEUX SOUS-CORPUS

Nous avons choisi de prsenter un exemple de rsultats de l'AAD partir de deux sous-corpus tudis dans notre thse, qui sont ACU et CCU, c'est--dire les corpus (C), Union de la gauche (U), des motions Mitterrand (A) et Rocard (C). Pour le chercheur en analyse du discours, le travail d'analyse vritable ne commence qu'aprs tout le processus prsent ci-dessus: segmentation en SDA, analyse syntaxique manuelle et analyse automatique. La base du travail est alors constitue par la liste des domaines (et hyperdomaines) correspondant chaque corpus, ainsi que par les relations de dpendance qui lient les diffrents domaines.

Deux pistes de recherche possibles Nous aurions pu tudier dans le dtail l'organisation de chaque domaine pour distinguer synonymie contextuelle, implication et contradiction (cf. M. Pcheux, Un exemple d'ambigut idologique: le rapport Mansholt). Cela nous aurait permis de classer les domaines par thmes, d'tudier les mergences de sens dans chaque corpus, et de prciser identifications, divergences et contradictions d'un corpus l'autre. Ce n'tait pas l notre but principal. Plus qu'au dtail des domaines, nous nous sommes attachs aux relations de dpendance qui s'tablissent d'un domaine l'autre, et permettent donc de construire un trajet discursif de chaque corpus ; pour nous, les domaines n'ont constitu qu'une tape vers les trajets discursifs. Pour que ces trajets puissent tre tablis de faon lisible, il fallait pouvoir prsenter sur un tableau unique le contenu de chaque domaine. Nous avons donc essay de reprsenter chaque domaine ou hyperdomaine par une phrase de base le rsumant de faon exacte. Le rle ainsi jou par les phrases de base dans notre tude est sans rapport avec celui qu'il joue dans d'autres travaux d'AAD. Dans la mesure o ceux-ci s'intressent d'abord aux relations internes chaque domaine, et ensuite seulement la structure gnrale des processus discursifs, le contenu mme des domaines n'est rappel qu'occasionnellement et pour mmoire dans cette seconde phase.

112

PCHEUX, LON, BONNAFOUS, MARANDIN Pour nous, au contraire, les phrases de base qui figurent dans les graphes reprsentant

les trajets discursifs, permettent de recomposer une sorte de second texte dont la lecture constitue la base de notre interprtation. Les principes qui ont prsid l'laboration de ces phrases de base sont simples: coordination ou juxtaposition des lments qui occupent la mme place dans le domaine, suppression des redondances et adjonction entre parenthses des lments du contexte absolument indispensables l'intelligibilit de ces phrases. Soit par exemple l'hyperdomaine HD1 de ACU, constitu des domaines Dl, D2, D4 et D12 (cf. listing page 16), nous avons form la phrase de base suivante : HD1 = 1. Le PC a seulement particip des gouvernements d'union nationale et de concentration rpublicaine ; il a prfr le gouvernement de la droite et du grand capital la victoire (des travailleurs). 2. (Certains suggrent) de prfrer (d'autres) notions la notion et la pratique (d'union de la gauche et de front de classe). Chaque domaine ou hyperdomaine de ACU a t ainsi rsum, et son contenu reprsent dans des cadres relis par des flches, qui symbolisent les relations de dpendance. On obtient ainsi un trajet discursif avec des domaines sources, puits, ou passages qui permettent de voir ce qui, dans l'argumentation de chaque texte, est point de dpart, conclusion ou lieu de passage oblig. L'intrt de la manuvre rside bien sr dans la comparaison de deux graphes ; c'est pourquoi nous commenterons ici la fois ACU et CCU, tous deux trs courts et commodes.

Analyse du trajet discursif de ACU Une premire conclusion se dgage du schma de la motion A : le rle prpondrant reconnu aux partis (on verra qu'il en va autrement dans la motion C). Le parti, notre parti, nous, le PS, les socialistes, et en face le PCF, ou le communisme constituent deux sries de termes qu'une dialectique runit autour des notions de dialogue, accord, alliance, pacte, union. Le problme central est clairement pos comme celui de la relation PS-PC. Mais il faut noter ce propos que la dissymtrie entre les deux sries: d'un ct on parle des socialistes, tandis que de l'autre on n'voque jamais que le PCF ou le communisme. Cela tient l'analyse faite par le courant A, comme d'ailleurs

113

U rouvestiitt ti tt p\r*. lit.it i entretiecdrt avte lociaux. yr.dieiti, tt renforcera uaesittl

ACU

1 Lc .C.F. tcaesert pvtici;f du (uvernennti 'union pttiemlr tt ecneentr.llen rpuilieint s 11 > prffrf ie fourn;ent de 1 Droit.t du gmA pital I It victoirt (ds trtTtillturt) i (Ctrttint tjcgfrtnt tt ) prfrer 4'tutrtt Botiont 1 It notion et 1 It prttiqut (d'Union dt It Gtucht tt it front dt el)

Cettt proportion txpria* airpltatnt ur* (vieree (i tile tpiif* ut l'union diUl-..- vftue far cet cillions de francaii ,-^t); cle ttt jutifie il tilt veut n:rt t.ve notrt doit (tntrtttnir (ici litnt sv>e parti Ir nouveacnt tocial).

II nout lsportt dt savoir chancerat 4 ttti tudt ) ti It ... II nout tppertitndrt 4'tn(tgtr It dialogut (tvte It P. CF. dana t.aoil)

jaaait avte artout (avtc ltt etntrt, eboiti alllturt aoeialiitti. l'tocial aeeord It ... (eoeratit. Sauf dirtct, tn a chtrehf Franct. prffertntitl te...) l'allianet aait o'

ita* francail ottvr du) polititut franjaitt 1 - 1 P.C.F. (a chtrehf aillturt) l'allianet we partit du eentrt Es France, rontradietion entre ton titcpjrt (tt It tabotafe at l'union). 3 P. S. 23 i tt 1er parti dt France. Dolt aux partit dt (tueht un paste (dt on acrtttion) tt luttt cesjnt (pour taploi). 3 - (pas louhaittfelt ai raliitt) inclure let partit politique! (dut ui rbttcmbleotat avee ty&dicat% tt anociationt.

par tout le Parti socialiste, et qui distingue entre direction et base du PCF (cf.

Introduction'

de la motion A : Chacun sait dans quelles conditions les dirigeants communistes, s'ils n'ont pu empcher que le Parti socialiste devienne le premier parti de France, ont maintenu la droite au pouvoir). Centre sur les relations PS-PC, la motion A n'accorde pas' la mme place aux deux partis. Tout le raisonnement est ax sur le PC: sources (DU et HD2) et centres (D10 et

114

PCHEUX, LON, BONNAFOUS, MARANDIN

HD1) sont en effet consacrs analyser son attitude, tandis que puits (D13, D7, D9, D6) et domaines latraux (D3) traitent principalement de la stratgie du PS: le PCF est ainsi pos comme le point aveugle dont tout dpend, et en particulier l'avenir du PS. De HD2 DU, en passant par D10, point de rencontre des deux premiers, on a un raccourci de l'volution du PC avec en HD2 le rappel de l'accord prfrentiel pass en France entre communistes et socialistes, en D10, la mention de la rupture et en DU les hypothses sur le changement d'attitude du PC. S'articulant sur le noyau central, apparaissent deux types de chemin : l'un, qui passe surtout par HD1, D3, D13, mais aussi partiellement par D6, est une rfutation des suggestions formules par certains, et qui viseraient inclure les partis politiques dans un vaste rassemblement avec syndicats et associations; l'autre qui dbouche sur les puits D7, D9, D6, argue de la force du PS pour prner une politique de proposition offensive, en direction des partis de gauche (D9, D6) en gnral et du PC en particulier (DU). Du fait de cette double polarisation, sur les rapports PC-PS, et l'intrieur de ceux-ci, sur le PC, deux absences majeures sont produites. L'une concerne la responsabilit du PS dans la rupture, dont l'ventualit n'est mme pas mentionne. L'autre concerne les luttes. Ces deux thmes tiennent une place importante dans l'argumentation de la motion CERES.

Analyse du trajet discursif de CCU Si la motion ne manque pas d'affirmer sa fidlit la stratgie d'union de la gauche, la dlinarisation du texte qui est la base de l'AAD permet de constater que l n'est pas le thme rcurrent de la motion. PS, PC et Union de la gauche ne figurent en tant que tels dans aucun domaine, et les accords politiques voqus sont des accords lectoraux du pass, qui plus est, rejets hors circuit dans le domaine isol (D6). L'essentiel des deux circuits centraux est consacr l'ide d'un dbat et d'une action commune avec les mouvements sociaux, les partis, syndicats, associations, mouvements sociaux, bref avec toutes les forces, mais la plus grande mfiance s'exprime l'gard d'un dialogue avec le PC (D2). Alors que nous n'avions pas inclus dans notre corpus d'AAD le paragraphe sur les mouvements sociaux, que nous jugions trop spcifique cette motion, et que nous n'avions retenu que les paragraphes centrs sur l' Union des forces populaires et l' Union

115 ecu ! 2avec politic..* 1 nfcetiite aociale politique. IPS)toute* i etl'initiative etrnovatioa ltl trantforaalion aoeial forcci; tt d' action usait n dbat f'pg'f I 1. it' reipMiaiiliti accorc* avec ledani N.lt.afflict G. 2. bilaa de 1' application det ixcords it i?77 ) dveloppement batailiei euvTiret ? confrontation aouvcmenla eociaux 3 ersaniattioa du aouveent ouvrier I I paa de dialogue (avec PClillrilisant l'action eouum. 3 peite du eorp social aur(fC)

S confrostation i'rtion ;:tKiti, avec accoci et ti tout initiative let oi. partit, et bouw

dT reprendre il faut (dibloeue avec nouveseiitt prendre et initiative avee PC11' et* action

de la gauche, il est intressant de noter que les mouvements sociaux figurent malgr tout dans deux domaines (Dl et D5). La priorit au social sur le politique est donc bien la caractristique de la motion C, par del ses protestations de conformit la ligne d'Epinay : la recherche d'un accord PC-PS est renvoye des jours meilleurs, au profit de l' Union des forces populaires. Cette expression ne figure jamais dans les domaines d'AAD, mais c'est elle qui sous-tend tout le circuit argumentatif et est clairement dveloppe en D5 (confrontation et initiative d'action avec tous les partis, syndicats, associations et mouvements sociaux).

116

PECH EV X, LEON, BONNAFOVS, MARANDIN On voit par ces deux exemples trs simples que la comparaison des fils argumentatifs de

deux ou plusieurs corpus n'est pas sans intrt: la dlinarisation du texte opre par la constitution des domaines fait clater l'uniformit des rfrences ( l'union de la gauche en particulier), et rvle des cheminements trs divergents, d'une motion l'autre. A cause du pass politique et de l'ambigut de la position de beaucoup de membres du PS, cause de l'ambivalence fonctionnelle des motions, cause aussi du climat trs particulier du congrs de Metz, notre corpus relevait de ces textes qui divisent le sujet et dont les lecteurs ont l'intuition, pour reprendre l'expression de M. Pcheux, que a peut aller dans un sens ou dans l'autre. L'AAD peut permettre de lever cette ambigut discursive, et de prciser dans quel sens vont les uns et les autres.

D'AAD69 A AAD80: NOUVELLES PERSPECTIVES

La procdure AAD69 date, au sens o elle correspond bien une problmatique, celle que rappelait M. Pcheux en introduction. Il ne peut s'agir, pour nous, que de tirer les enseignements des expriences qu'elle a permises et d'esquisser, ici grands traits, un nouveau projet.

AAD69 QUELS RSULTATS? Le programme AAD69 produit, on l'a vu, deux types de rsultats: une liste de domaines smantiques et une liste de relations de dpendance entre domaines. Le problme est de savoir ce qui est saisi dans ces deux listes. a) Les domaines smantiques Ils ont t conus et sont interprts comme des paradigmes o se dcide la valeur des items lexicaux par diffrence dans un contexte distributionnel quivalent. Cette conception

ANALYSE AUTOMATIQUE DU DISCOURS

117

repose (comme la totalit de la procdure) sur une interprtation particulire de l'analyse harrissienne, qui assimile quivalence et identit de sens (synonyme lexical et paraphrase). Les domaines smantiques, tels qu'ils sont produits et lorsqu'ils sont confronts aux discours dont on a extrait le corpus, semblent plutt reprer des objets de discours': un rfrentiel parpill dans ses ralisations lexicales. Si tel est le cas, ce sont les modalits particulires de construction d'un objet10 (valant comme actant, procs, situation...) qui devraient retenir l'attention dans une problmatique qui considre les suites discursives n comme la trace d'une pratique discursive ou d'une manire de parler. L'interprtation smantique des domaines smantiques dtourne de ce qui semble l'objet d'une analyse du discours 12. Les domaines smantiques exhibent trs souvent une proposition modalise, telle que: X faire Y, X devoir faire Y, X ne pas faire Y, .... Ce type de rsultat a toujours retenu l'attention des analystes de discours qui y voient un point de division d'une formation discursive ou d'interfrence entre formations discursives. Si cette interprtation semble fonde (par rapport aux hypothses de AD), elle ne peut tre assure que par la prise en compte gnralise de toutes les modalits nonciatives. Non seulement parce qu'elles marquent la distance (telle que Dubois la dfinit, Langages, n 13) de renonciation par rapport son nonc, mais parce que les diffrentes zones d'une formation discursive peuvent se raliser dans des places et des formes nonciatives diffrentes. C'est dire que l'tude de renonciation peut tre un angle d'attaque pour dcrire une formation discursive, mais renonciation reste en dehors du champ de AAD69. b) Les relations de dpendance entre domaines Les relations de dpendance entre domaines, reprsentes sous forme de graphes, sont interprtes comme imageant des chemins argumentatifs profonds (c'est--dire diffrents de l'ordre squentiel). Leur modalit de construction invite prciser davantage. L'analyse syntaxique (par le codage dans une relation binaire constitue de deux noncs huit places relis par un connecteur), puis la comparaison traitent de faon uniforme ( plat, pourrait-on 10. Voir J.-J. Courtine, 1981, p. 113 et suiv. 11. Nous appelons suite discursive un fragment de discours tel qu'il apparat, tel qu'il est lu dans une apprhension nave; squence discursive, le systme construit par la description faisant d'une suite un tout. La construction des squences ne se rsume pas une segmentation des suites; une mme suite est susceptible d'appartenir plusieurs squences. 12. Abrg en AD, infra.

118

PCHEUX, LON, BONNAFOUS, MARANDIN groupes nominaux complexes, des syntagmes verbaux, des

dire), et rapprochent des

propositions et des propositions enchanes (par coordination ou subordination). Ce qui est repr, c'est l'interpntration des diffrents niveaux discursifs (niveau phrastique, subphrastique, inter-phrastique) et en particulier, le rapport entre la construction des groupes nominaux complexes (dtermination et nominalisation) et l'enchanement de surface des propositions qui fait rcit ou argumentation. Que ce phnomne important (et qui aurait pu ouvrir tout un champ de description : par exemple : quel est le degr de dpendance entre la dfinition-description des actants d'un rcit et le droulement de ce rcit, la dfinition des objets et une argumentation) n'ait pas retenu les utilisateurs de AAD69, tient sans doute l'inexistence dans la procdure (et la problmatique) du fait squentiel. La lecture des rsultats d'AAD69 et leurs interprtations, la confrontation de ces rsultats et de ces interprtations aux corpus traits, ne peuvent que nous pousser redfinir une stratgie de description et d'analyse. CRITIQUE Je rappellerai ici les trois critiques majeures que nous adressons cette procdure. a) La place et la dfinition de la paraphrase Bien que la paraphrase tienne une place centrale, constitutive dans AD et dans AAD69, il demeure qu'elle a t trs peu tudie pour elle-mme et que les analystes du discours, tout comme bon nombre de linguistes 13 en ont une conception nave. En ce qui concerne AAD69, la paraphrase y est dfinie de manire compositionnelle : deux phrases sont en relation de paraphrase si la somme de leurs parties constitue un mme sens par identit ou quivalence lexicale (voir la phase de comparaison). Il s'agit, donc, pour nous: de relativiser la place de la paraphrase en reconnaissant qu'un discours ne se limite pas la production de significations par substitution lexicale ; de reprendre le problme de la paraphrase dans une perspective nouvelle, qui rpond assez bien la position gnrale de notre projet : l'tude de l'autre dans le mme : tudier les relations entre structures syntaxiques faisant qu'un contenu propositionnel stable (par

13. Voir pour une position diffrente, et exemplaire, l'article de Fuchs dans DRLAV, n 21 : rfrentiation et paraphrase: variation sur une valeur aspectuelle .

ANALYSE AUTOMATIQUE DU DISCOURS

119

construction discursive) puisse tre investi dans des sens diffrents (miroitements lexicaux, nonciatifs, aspectuels...). b) La place et la dfinition de l'analyse syntaxique Dans AAD69, l'autonomie de la syntaxe est comprise comme l'existence, antrieurement tout discours, d'une forme (propositionnelle) universelle. D'o la forme et la place de l'analyse syntaxique : codage (et forage) des suites discursives dans le format syntaxique et antriorit absolue de l'analyse syntaxique sur les algorithmes textuels. D'o galement l'impossibilit de traiter des discours qui, par rapport cette conception de la syntaxe, apparaissent comme dviant, non-standard, parl, etc.. Il faut donc reprendre le problme de l'analyse syntaxique et de la syntaxe elle-mme. Je ne ferai que mentionner nos deux points de dpart: l'impossibilit de principe, et dans la procdure, d'une phase d'analyse syntaxique antrieure et spare de la phase d'analyse discursive. Il suffit d'voquer les exemples d'ambigut bien connue de la syntaxe transformationnelle (Je photographie les enfants devant la banque, etc.) pour s'apercevoir que l'analyse syntaxique ne peut tre mene bien sans faire appel un savoir discursif (dfinition du procs, construction des actants, etc.). Plus profondment, ces cas d' ambigut ne sont pas accidentels, mais peuvent tre caractristi ques d'un fonctionnement discursif. Nous serons obligs de concevoir une analyse syntaxique interactive revenant sur une analyse initiale minimale pour l'affiner. Une rflexion sur la forme de la syntaxe. Tout en adoptant pour la confection des nouveaux algorithmes un analyseur dj existant: la Grammaire de surface (GDS) de P. Plante titre de syntaxe minimale, nous travaillons plus long terme dans la perspective d'une analyse articulant deux systmes: un systme de rgles hirarchises et un systme de rgles squentielles. c) La vise gnrale de la procdure AAD69 est une machine produire de l'identit, partir de la constitution du corpus gelant les conditions de production jusqu' l'interprtation des rsultats rifiant les discours dans une identit : rduisant des le discours socialiste, voire la formation discursive socialiste (ou communiste, etc.). L'AD a toujours t une typologie cartant les types rhtoriques (ou les schmas trop simples en termes de phrases de base). Il s'agissait fondamentalement de retrouver des discours-types o s'amalgament et se figent l'appareil

120

PCHEUX, LON, BONNAFOUS, MARANDIN

(politique), le contenu doctrinal et les diffrents types de mmoires mobiliss dans une prise de parole.

Perspectives AAD80 La confection d'algorithmes d'analyse du discours ne peut tre qu'une partie d'une problmatique plus vaste. A cela deux raisons: Ne peuvent tre susceptibles de calcul que les zones bien connues o des hypothses suffisamment gnrales peuvent tre testes sur des corpus assez vastes. Il est actuellement difficile d'aller au-del, tant donn l'insuffisance des recherches dans les domaines de renonciation et de la mise en squence. Les questions formules par l'analyste sur son corpus et les interprtations sont par dfinition non-calculables. Nous envisageons, pour dcrire des suites discursives, deux espaces et, dans chaque espace, plusieurs algorithmes rpondant des dfinitions d'objet diffrentes: Un espace, dit vertical, qui renvoie la dimension historique du discours et commande des algorithmes de regroupement d'units extraites des suites discursives: tout nonc est pris dans une srie d'noncs appartenant d'autres squences discursives mises antrieurement ou de faon contemporaine et qui constituent sa condition d'existence. Un espace, dit horizontal, qui renvoie au fil du discours, cette unit complexe o se squentialisent les suites discursives: tout nonc est pris dans un enchanement d'noncs organis par rapport un systme de places nonciatrices et plusieurs systmes rhtoriques de disposition 14. C'est, en dfinitive, la signification du syntagme analyse du discours que nous voulons modifier. Il dsigne la fois une dcomposition des suites discursives et une rgression rduisant la complexit de ces suites une loi ou un modle de reprsentation simplificateur.

14. Ces deux espaces ne sont pas spars, sans rapport l'un avec l'autre. Places nonciatrices et dispositions ne sont pas l'invention sans cesse renouvele d'un sujet d'nonciation, elles sont rgles par une formation discursive. Dans la procdure, les algorithmes verticaux, en contractant le fil du discours, permettent de confronter chaque point de ce fil son ensemble: ils fonctionnent comme une mmoire.

ANALYSE AUTOMATIQUE DU DISCOURS

121

Ce geste tant investi dans une vise hermneutique : rvler le systme de penses, d'attitudes ou de reprsentations de ceux qui ont produit ces suites. C'est cette pratique que nous voulons abandonner pour lui substituer une pratique contradictoire tenant de la morphologie et de la lecture: morphologie, quand l'analyste dcrit des formes regroupant ou distribuant les lments htrognes de toutes squences discursives; lecture, quand l'analyste rgle et crit cette description. Il y a, en effet, une analogie profonde entre le geste de lecture et le geste de description: toute lecture dcoupe le texte, en privilgie certains lments pour en occulter d'autres, rapproche ce qu'elle a dispers, disperse ce qui tait conjoint 15. Notre pari est de faire de ces interventions, opres en quelque sorte de faon sauvage ou inconsciente dans la lecture spontane, des interventions rgles triturant l'objet lire selon les axes mmes qui le structurent. L'analyse de discours ne serait plus une prothse de la lecture 16 mais une provocation la lecture.

septembre 1981 15. Voir la belle description du geste de la lecture dans La seconde main, A. Compagnon, Seuil, 1979. 16. Voir sur ce point M. Pcheux, Introduction au Colloque Matrialits discursives.

122

PECHEUX, LEON, BONNAFOUS, MARANDIN

BIBLIOGRAPHIE

ALTHUSSER (LOUIS). Lire Le Capital, Paris, Maspero, 1968. BONNAFOUS (SIMONE), Les motions du congrs de Metz (1979) du Parti socialiste: processus discursifs et structures lexicales, Thse de 3e cycle, Paris X, 1980. COURTINE (JEAN-JACQUES), Quelques problmes thoriques et mthodologiques en analyse du discours, propos du discours communiste adress aux chrtiens, Langages, 62, juin 1981, p. 9-128. DUBOIS (JEAN), Sumpf (J.), L'analyse du discours, Langages, 13, mars 1969. FUCHS (Catherine), Rfrentiation et paraphrase: variation sur une valeur aspectuelle, DRLAV, 21, novembre 1979, p. 32-41. GADET (FRANOISE), PCHEUX (MICHEL), La langue introuvable, Paris, Maspero, 1981. GUILHAUMOU (JACQUES), MALDIDIER (D.), Courte critique pour une longue histoire , Dialectiques, 26, 1979. haroche (Claudine), henry (PAUL), pcheux (Michel), La smantique et la coupure saussurienne : langue, langage, discours, Langages, 24, dcembre 1971, p. 93-106. haroche (Claudine), pcheux (MICHEL), Manuel pour l'utilisation de la mthode d'analyse automatique du discours (AAD), T. A. Informations, 1, 1972, p. 13-55. LEON (Jacqueline), TORRES-LIMA (maria emilia), Etude de certains aspects du fonctionnement de l'AAD; traitement des syntagmes nominaux complexes en expressions figes et segmentation d'un corpus en squences discursives autonomes, T. A. Informations, 1, 1979, p. 25-46. MARANDIN (JEAN-MARIE), Problmes d'analyse du discours. Essai de description du discours franais sur la Chine, Langages, 55, septembre 1979, p. 17-88. pcheux (MICHEL), Analyse automatique du discours, Paris, Dunod, 1969. pcheux (MICHEL), fuchs (Catherine), Mises au point et perspectives propos de l'analyse automatique du discours, Langages, 37, mars 1975, p. 7-80. PCHEUX (MICHEL), Les vrits de La Palice, Paris, Maspero, 1975. PCHEUX (MICHEL), HENRY (PAUL), POITOU (JEAN-PIERRE), HAROCHE (CLAUDINE), Un exemple d'ambigut idologique: le rapport Mansholt, Technologies, idologies et pratiques, 2 (2), avril-juin 1979, p. 3-83. pcheux (MICHEL) et al., Actes du Colloque Matrialits discursives, Paris X, avril 1980, paratre en octobre 1981. ROBIN (Rgine), Histoire et linguistique, Paris, Armand Colin, 1973.

ANALYSE AUTOMATIQUE DU DISCOURS Rsum de l'article / Abstract

123

PRSENTATION DE L'ANALYSE AUTOMATIQUE DU DISCOURS (AAD69)

Cet ensemble de quatre textes concernant l'Analyse Automatique du Discours constitue une mise au point critique de la mthode version 1969, en liaison avec l'laboration d'une version 1980. Michel Pcheux retrace l'historique de la mthode, conue dans le cadre du structuralisme (philosophique et linguistique) des annes 1960. La prsentation de la mthode AAD69 (J. Lon) et l'expos de certains rsultats rcents (S. Bonnafous) sur le discours socialiste ne peuvent se considrer l'heure actuelle que comme un point de repre pour la mise en place de perspectives nouvelles. Ainsi la critique de J.M. Marandin sur les rsultats et sur certaines carences de la mthode telles que l'absence de renonciation et du fait squentiel, dbouche sur une prsentation programmatique de nouveaux algorithmes envisags selon deux espaces: les algorithmes verticaux traiteront des noncs, accordant au lexique une place dterminante et la paraphrase une place relative; et les algorithmes horizontaux traiteront la squence discursive elle-mme. L'analyse de discours tait une prothse de la lecture; l'AAD80, en cours d'laboration, voudrait la transformer en provocation la lecture.

AUTOMATIC DISCOURSE ANALYSIS (AAD69) This set of four texts concerning Automatic Discourse Analysis is a critical restatement of the 1969 method, related to the development of a 1980 version. Michel Pcheux retraces the history of the method, conceived in the framework of the philosophical and linguistic structuralism of the sixties. The presentation of the AAD69 method (J. Lon), and the exposition of some recent results (S. Bonnafous) concerning socialist discourse can now only be considered as reference points in establishing a new viewpoint; thus, J. M. Marandin s criticism of the 1969 results and of certain failures of the method, such as the lack of enunciation and of sequential phenomena, leads on to a planned presentation of new algorithms conceived according to two dimensions: the "vertical" algorithms will handle statements, leaving a preponderant part to the lexicon and a relatively smaller part to paraphrase; and the "horizontal" algorithms will handle the discursive sequence itself. Discourse analysis was a "prosthesis for reading" ; AAD80, the method now under development, would like to make it a reading incentive.