Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
par
Michel PECHEUX
L./.S.H. - C.N.R.S. - PARIS
699
701
702
dfigllr ?) dans cette entreprise : si l'on pose, selon .Ia perspective structural iste, que le sens d'une
surface textuelle existe dans le .jeu des rapports (d'quivalence, cOmmutation, paraphrase ... ) qui
s'tablissent .ncessairemen.t entre elle et d'autres sur.facestextuelles spcifiques, il en rsulte que
l'tude des processus discursifs (inhrents. la structur.e sous-jacente tudier) suppose la rfrence
des ensembles de surfaces (ou "corpus discursifs") que le dispositif informatique aura pour effet de
mettre en tat {j'auto-paraphrase potentielle, pour l'interroger sur sa structure, en gnralisant des
corpus ainsi. reprs par leurs "conditions (socio-historiques) de production", les procdures que
Harris avait conues et appliqlles sur certaines squences .trs particulires, marques par des rptitions et des strotypies internes, dont le fameux "Millions can't be wrcing" reste l'exemple princeps.
L'ordre et la disposition de la procdure AAD 69 se trouvaient par l mme dtermins, dans une
forme qui a .t effectivement applique diffrents corpus socio-historiques, le plus souvent rfrs
des doctrines idologiques homognes (2).
Je n'exposerai pas icile.dtail de cette procdure (on peut se reporter sur ce point au document
annexe mis la disposition des participants), mais simplement son principe, savoir:
1) Une phase de constructionsocio,historique dll systme de corpus soumis l'analyse, chaque
corpus t;;lnt constitu d'un ensemble de "squences discursives ;;lutonomes" (SDA) de dimension
gnralement suprieure la phrase, et pouvant atteindre la taille d'un paragraphe.
2) Une phase de dlinarisation syntaxique (manuelle) des SDAde chaque corpus, dgageant des
noncs lmentaires (munis d'une forme fixe, nonciative et grammaticale, remplie d'lments
lexicaux) et des connecteurs (de dtermination, subordination et coordination) entre ces noncs;
chaque SDA est ainsi restructure sous la forme d'un graphe dont les noncs constituent les
noeuds, les connecteurs constituant des arcs valus entre les noeuds.
Les donnes du programme informatique sont donc constitues par une liste d'noncs, et une
liste de relations binaires entre les noncs.
3) Une phase de traitement informatique, justifiant la prtention automatique de AAD 69, et
comportant:
un algorithme de comparaison des relations binaires deux deux, sur la base de leurs contenus
lexicaux identiques ou diffrents, ~ des places morpho-syntaxiques donnes, et aboutissant
une liste ,des couples de relations binaires dtermines commelexicalement proches ( partir
d'un calcul galement indiqu dans le docllment annexe);
un algorithme construisant, partir de ces couples de relations (ou "quadruplets") des chanes
de proximit, elles-mmes regroupes par transitivit en "domaines smantiques", qui constituent ainsi des points de rassemblement des sous-squences (portions de SDA) lies entre
elles par des relations de synonymie, mtonymie ou paraphrase;
703
enfin, un algorithme calculant les rapports de dpendance entre les domaines smantiques, sur
la base des relations amont/aval entre les sous-squences l'intrieur du corpus, et ralisant
ainsi une reconstitution des trajets tnicro-argumentatifs propres ce corpus (le document
annexe fournit galement des exemples de rsultats concrets ces diffrents niveaux).
Je conclurai cette prsentation rtrospective de AAD 69 par quelques remarques lies l'tat actuel
des travaux du groupe de recherche ADELA ("Analyse de discours et lectUres d'archive") dont
plusieurs orateurs de cette session sont partie prenante, sous diverses formes qu'ils prciseront euxmmes.
Plus de quinze ans aprs l'pisode structuraliste que j'ai voqu avec ses a priori et ses ignorances
dlibres, il est temps pour nous de faire le point, sur les diffrents aspects philosophiques, sociohistoriques, linguistiques et informatiques engags dans cette entreprise interdisciplinaire.
Ma premire remarque concerne le rapport entre variation de forme (syntaxique et lexicale) et variation de sens. Nous avons dsormais les moyens de soutenir de manire argumente sur le terrain de
l'informatique la thse selon laquelle les ambiguts, mtaphores et glissements propres aux langues
naturelles sont des proprits incontournables du champ de l'analyse de discours, qui se diffrencie
par l mme de toute perspective strictement informationnelle, documentaire ou "intellectique" (3).
Un corpus d'archive textuelle n'est pas une "banque de donnes".
Simultanment, je soulignerai combien les procdures AAD 69 restent loin de compte quant l'apprhension de ce jeu entre le mme et l'autre, qui caractrise l'htrognit contradictoire de tout champ
d'archive: tant par les mthodes de calcul des proximits que par la rigidit pesante de l'analyse
syntaxique (manuelle de surcrdt) qu'elles supposent, et aussi l'obstination reconstruire des identits
paraphrastiques, les procdures AAD 69 demeuraient bien plus proches que je ne pouvais le supposer
l'poque des vidences empirico-Iogiques de la lecture. Encore une fois: l'quivoque du rapport
Harris !
Quant au refus historique de tout langage logique de reprsentation a priori, il apparat de plus en
plus justifi dans le domaine de l'informatique en sciences humaines, face l'largissement prvisible
de l'emprise des langues logiques rfrents univoques, importes du domaine des scien.ces de la
nature, des technologies industrielles ou des dispositifs de gestion-contrle administratifs. Mais tenir
cette position n'implique pas ncessairement que l'analyse de discours informatise doive tendre
raliser une auto-lecture de la structure des corpus par les corpus eux-mmes, comme AAD 69 le
sous-entendait: ce ne serait finalement qu'une nouvelle thologie, une thologie de la structure
taye sur une conception orthopdique de la connaissance; pour tout dire, l'informatique comme
prothse de la lecture, machine laver les textes, ou appareil rayons X !
L'ignorance des recherches de la "philosophie du langage ordinaire" semble avoir eu pour consquences de surestimer, en analyse de discours, le principe de l'homognit socio-historique des corpus
704
discursifs, en restant aveugles sur le rle thorique que doivent y jouer l'vnement, la question, la
rplique, l'interruption et l'irruption.
C'est une situation assez intressante, pour un francophone comme moi, de pouvoir reconnatre de
tels dfauts, sans tomber immdiatement dans l' "empirisme anglophone", tout en s'adressant lui.
De manire plus gnrale, c'est mme, mon avis, une condition pour que l'analysede discours puisse
aujourd'hui continuer suivre son propre chemin.
NOTES
1)
2)
Cf. en annexe la liste non -exhaustive des travaux raliss l'aide de AAD 69.
3).
De ce point de vue, la manire dont Maurice Gross et Marcel-Paul Schutzenberger prsentent les
recherches menes actuellement en ce domaine apparat partielle, partiale et quelque peu tendancieuse : "Les mthodes (maintenant traditionnelles) d'analyse du discours ou de documentation automatique reposent, sans exception, sur l'utilisation de mots-cls". Suivent des remarques sur les tentatives de raffinements mthodologiques pour remdier ce dplorable tat de
fait dans les sciences humaines, et les deux auteurs poursuivent: "Toutes ces mthodes mettent
en jeu un langage documentaire particulier, 'est--dire un systme formalis dans lequel il est
ncessaire de traduire textes et questions." ( Complments sur le traitement des langues naturelles, in Les enjeux culturels de l'informatisation, La Documentation Franaise, 1980, p. 136137).
705
propos du discours communiste adress aux Chrtiens", Langages, 62, juin 1981, pp. 9-128.
DUBOIS, Jean, SUMPF Joseph, "L'analyse du discours", Langages, 13, mars 1969.
FUCHS Catherine, "Rfrentiation et paraphrase; variation sur une valeur aspectuelle", DR LA V, 21,
Ma~pro,
1981.
GUI LHAUMOU Jacques, MALDI DI E R Denise, "Courte critique pour une longue histoire",
706
707