Vous êtes sur la page 1sur 40

Zellig S.

Harris Mme Franoise Dubois-Charlier

Analyse du discours
In: Langages, 4e anne, n13, 1969. pp. 8-45.

Citer ce document / Cite this document : Harris Zellig S., Dubois-Charlier Franoise. Analyse du discours. In: Langages, 4e anne, n13, 1969. pp. 8-45. doi : 10.3406/lgge.1969.2507 http://www.persee.fr/web/revues/home/prescript/article/lgge_0458-726X_1969_num_4_13_2507

Rsum L'analyse du discours effectue les oprations suivantes sur tout texte suivi, considr individuellement. Elle rassemble les lments (ou squences d'lments) dont les environnements l'intrieur d'une phrase sont identiques ou quivalents, et les considre comme quivalents entre eux (c'est--dire, membres de la mme classe d'quivalence). Le matriau qui n'appartient aucune classe d'quivalence est associ au membre (d'une classe) avec lequel son rapport grammatical est le plus troit. On divise les phrases du texte en segments, constitus chacun d'une succession de classes d'quivalence, de faon ce que chaque segment obtenu soit aussi semblable que possible, par des classes qui le composent, aux autres segments du texte. On examine alors la succession des segments pour reprer la distribution des classes qu'elle offre et, en particulier, pour reprer des schmas d'occurrence de classes. Ces oprations ne font appel aucune connaissance concernant le sens des morphmes, l'intention de l'auteur, ou sa situation. Elles n'exigent que la connaissance de la limite des morphmes, y compris les junctures de phrase et autres intonations morphologiques (ou ponctuation). L'application de ces oprations peut tre renforce par l'utilisation des quivalences grammaticales (ou rapports d'occurrence de morphmes individuels), tires de toute la langue ou du corps linguistique dont le texte en question fait partie. Dans ce cas, il est ncessaire de connatre les classes grammaticales des diffrents morphmes du texte. L'analyse du discours donne une foule de renseignements sur la structure d'un texte ou d'un type de texte, ou sur le rle de chaque lment dans cette structure. La linguistique descriptive, elle, ne dcrit que le rle de chaque lment dans la structure de la phrase qui le contient. L'analyse du discours nous apprend, de plus, comment un discours peut tre bti pour satisfaire diverses spcifications, exactement comme la linguistique descriptive construit des raisonnements raffins sur les faons dont les systmes linguistiques peuvent tre btis pour satisfaire diverses spcifications. L'analyse du discours donne aussi des renseignements sur des fragments de discours plus longs que la phrase; ainsi, il se rvle qu'il y a des rapports entre les phrases successives, mais que ces rapports ne sont pas visibles dans la structure de phrase (en termes de ce qui est sujet et ce qui est prdicat, etc.), mais le sont dans le scheme d'occurrence des classes d'quivalence dans les phrases successives.

ZELLIG S. HARRIS Universit de Pennsylvanie

ANALYSE DU DISCOURS *

Cet article prsente une mthode d'analyse de l'nonc suivi (crit ou oral) que nous appellerons discours 1. C'est une mthode formelle qui ne se fonde que sur l'occurrence des morphmes en tant qu'lments isolables; elle ne dpend pas de la connaissance que le linguiste qui analyse peut avoir du sens spcifique de chaque morphme, et elle ne nous apprend rien de nouveau sur le sens particulier de chacun des morphmes qui figurent dans le discours en question. Mais ceci ne signifie nullement que nous ne puissions pas dcouvrir autre chose que la manire dont la gram maire de la langue s'illustre dans ce discours. Car, bien que nous usions de procdures formelles, proches de celles de la linguistique descriptive, nous pouvons obtenir sur le texte tudi des renseignements que cette dernire ne fournissait pas. Cette information supplmentaire provient d'un fait fondamental : l'analyse de l'occurrence des lments dans le texte n'est faite qu'en fonction de ce texte particulier; c'est--dire en fonction des autres lments de ce mme texte et non en fonction de ce qui existe ailleurs dans la langue. En consquence, nous reprons les corrlations spcifiques des morphmes du texte tels qu'ils se prsentent dans ce texte et, ce faisant, nous dcou vrons quelque chose de sa structure, de ce qui s'y passe. Il se peut que nous ne sachions pas exactement ce que le texte dit, mais nous pouvons dterminer comment il le dit ce que sont les schemes de rcurrence des principaux morphmes qui le forment. * Cet article est paru en anglais dans Language, vol. 28, 1952, pp. 1-30. Nous remer cionsM. Z. Harris et la Socit de Linguistique d'Amrique qui nous ont autoriss le publier en franais. 1. J'ai le plaisir de remercier ici de leur collaboration trois hommes qui m'ont aid dans la mise au point de la mthode et dans l'analyse de divers textes : Fred Lukoff, Noam Chomsky et A. F. Brown. Les recherches antrieures dans la perspective de cette mthode avaient t prsentes par Lukoff dans Preliminary analysis of the linguistic structure of extented discourse (University of Pennsylvania Library [1948]). Une analyse dtaille d'un texte-chantillon a paru dans Discourse analysis : a sample text de Z. Harris, Language, vol. 28, n 4, 1952, p. 474.

9 On peut dterminer des schemes dfinis pour des textes donns, pour des individus, des styles ou des thmes donns. Dans certains cas on peut tirer des conclusions formelles du scheme spcifique de distribution des morphmes dans un texte. Et il est souvent possible de mettre en vidence des diffrences de structure rgulires entre les discours tenus par des personnes diffrentes, ou dans des styles ou sur des thmes diffrents.

Prliminaires 1. Le problme. On peut envisager l'analyse du discours partir de deux types de problmes qui, en fait, sont lis. Le premier concerne le prolongement de la linguistique descriptive au-del des limites d'une seule phrase la fois. Le second concerne les rapports entre la culture et la langue (c'est--dire entre le comportement non-verbal et le comportement verbal). Le premier problme se pose parce que la linguistique descriptive s'arrte gnralement aux limites de la phrase. Ceci ne rsulte pas d'une dcision a priori, car les techniques linguistiques ont t labores pour permettre d'tudier tout nonc, quelle qu'en soit la longueur; mais il se trouve que, dans toutes les langues, presque tous les rsultats obtenus concernent un type d'nonc relativement court qu'on peut appeler phrase. Autrement dit, quand on tablit une interdpendance dans l'occurrence de deux lments A et B, il se trouve presque toujours que ces deux l ments sont considrs comme se prsentant dans une mme phrase. On peut dire, par exemple, que les adjectifs anglais se trouvent avant le nom ou aprs certains verbes (dans la mme phrase) : the dark clouds, the future seems bright, mais il est rare que nous puissions tablir des interdpen dances qui dpassent les limites de la phrase, par exemple si le verbe principal d'une phrase a tel suffixe de temps, le verbe principal de la phrase suivante aura tel autre suffixe de temps. Nous ne pouvons pas dire que, si une phrase est; de la forme NV, la suivante sera de la forme N. Tout ce que nous pouvons dire, c'est que la plupart des phrases sont de la forme NV, que quelques-unes sont de la forme N, etc., et que ces structures figurent dans diverses squences. C'est ainsi que la linguistique descriptive, partie pour dcrire les occurrences d'lments dans tout nonc quelle qu'en soit la longueur, les dcrit finalement surtout en fonction des autres lments de la mme phrase. On ne s'est pas trop inquit de cette limitation, parce qu'elle n'a pas empch l'laboration de grammaires adquates : la grammaire expose la structure des phrases; le locuteur construit chaque phrase par ticulire conformment cette structure et produit sa propre squence de phrases. L'autre problme, celui des rapports entre le comportement (ou

10 situation sociale) et la langue, a toujours t considr comme extra linguistique. La linguistique descriptive ne se proccupe pas du sens des morphmes et, bien qu'on puisse essayer de tourner la difficult en parlant, non de sens, mais de la situation sociale et intersubjective dans laquelle l'nonc est produit, la linguistique descriptive n'est pas arme pour tenir compte de la situation sociale : elle peut seulement dfinir l'occurrence d'un lment linguistique en fonction de l'occurrence d'autres lments linguistiques. Les tudes menes sur les rapports entre la culture et la langue n'ont donc pas pu bnficier des travaux distributionnels rcents. Ainsi, elles font l'inventaire des sens exprims dans la langue en tudiant le stock lexical; ou elles tirent des conclusions du fait que, dans une cer taine langue, un certain groupe de sens s'exprime par le mme morphme; ou elles discutent des nuances de sens et d'emploi d'un mot en le rappro chantd'autres (par exemple en stylistique). Elles ont aussi soulign cer tains points comme le fait qu'il faut considrer le sens global des syntagmes et non la somme des sens des morphmes qui les constituent : ainsi How are you? est une formule de politesse plutt qu'une question sur la sant de l'interlocuteur. Cet exemple illustre bien la corrlation entre le discours et la situation sociale. De mme on a tudi des caract ristiques de la personnalit dans l'nonc en rapprochant les traits li nguistiques rcurrents d'un individu avec des traits rcurrents de son comportement et de sa sensibilit 2. 2. Distribution a l'intrieur du discours. L'analyse distributionnelle ou combinatoire l'intrieur d'un dis cours considr comme un tout spcifique se rvle pertinente pour l'tude de ces deux problmes. D'une part, elle nous permet de dpasser la limitation la phrase de la linguistique descriptive. Alors que nous ne pouvons pas dfinir la distribution des phrases (ou plus gnralement une quelconque relation entre les phrases) dans un ensemble arbitraire de phrases prises dans une. langue donne, nous pouvons obtenir des rsultats prcis sur certaines relations dpassant les limites de la phrase si nous ne considrons que les phrases d'un seul discours suivi, c'est--dire celles qui ont t prononces ou crites les unes la suite des autres par une ou plusieurs personnes dans une seule situation. Cette limitation de l'analyse au discours suivi n'en diminue pas l'utilit, puisque toutes les occurrences de la langue ont une cohrence interne. La langue ne se prsente pas en mots ou phrases 2. Nous considrons que les corrlations entre personnalit et langue ne sont pas simplement lies aux corrlations entre culture et langue, mais qu'elles en sont un cas particulier. La raison d'tre de ce point de vue est que la plupart des caractristiques individuelles d'un nonc ( distinguer des caractristiques phontiques) sont en cor rlation avec les particularits de personnalit qui proviennent de l'exprience de l'i ndividu dans des situations interpersonnelles conditionnes socialement.

11 indpendantes, mais en discours suivi, que ce soit un nonc rduit un mot ou un ouvrage de dix volumes, un monologue ou une discussion politique. Les ensembles arbitraires de phrases ne prsentent en fait aucun intrt, si ce n'est pour vrifier la description grammaticale; et il n'y a rien d'tonnant ce que nous ne puissions pas trouver d'interdpen dance entre des phrases ainsi assembles. La succession des phrases dans un discours suivi constitue, au contraire, un domaine privilgi pour les mthodes de la linguistique descriptive, puisque celles-ci ont pour objet la distribution relative des lments l'intrieur d'un nonc suivi quelle que soit sa longueur. D'autre part, l'analyse distributionnelle l'intrieur d'un seul dis cours, considr individuellement, fournit des renseignements sur certaines corrlations entre la langue et d'autres formes de comportement. La raison en est que chaque discours suivi est produit dans une situation prcise qu'il s'agisse d'une personne qui parle, ou d'une conversation, ou de quelqu'un qui se met de temps en temps son bureau pendant un certain nombre de mois pour crire un type dfini de livres dans une certaine tradition, littraire ou scientifique. Cette co-occurrence de la situation et du discours ne signifie pas, bien entendu, que les discours produits dans des situations semblables doivent ncessairement avoir certaines carac tristiques , formelles en commun, ni que les discours produits dans des situations diffrentes doivent prsenter certaines diffrences formelles; elle ne fait qu'expliquer ou permettre l'existence de ces corrlations for melles. Il reste prouver, partir de donnes de fait, que ces corrlations formelles existent bien en effet, que les discours d'un individu, d'un groupe social, ou relevant d'un style particulier, ou portant sur un certain thme, , prsentent non seulement des significations propres (dans leur choix des morphmes), mais aussi des traits formels caractristiques. Nous ne parlerons pas ici du choix particulier des morphmes, mais on peut tudier les caractristiques formelles de ces discours par des mthodes distributionnelles appliques l'intrieur de chaque texte; et le fait de leur corrlation avec un certain type de situation donne un statut de signification! l'occurrence de ces caractristiques formelles. 3. Combinaison, avec la grammaire. On voit donc que la mthode prsente ici vient d'une application des mthodes distributionnelles de la linguistique un discours la fois, considr comme un tout' spcifique. On peut s'en servir directement sur un texte, sans faire appel pour son tude aucune connaissance linguis tiqueautre que les limites des morphmes; ceci est possible parce que l'analyse distributionnelle est une mthode lmentaire, qui consiste sim plement tablir l'occurrence relative des lments qui, dans le cas parti-

12 culier, sont des morphmes. Pour montrer la validit de la mthode, ou pour pouvoir ventuellement l'appliquer un matriau non-linguistique, il convient de n'utiliser aucune autre connaissance pralable que les limites des lments. Si cependant nous nous intressons non seulement la mthode, mais encore ses rsultats, si nous voulons l'utiliser pour dcouvrir tout ce qu'il est possible de trouver sur un texte particulier, il est utile de la combiner avec la linguistique descriptive. Dans ce but, il ne faut utiliser que les rgles de la grammaire de la langue en question qui sont vraies pour toute phrase ayant une forme donne. Par exemple, partir de toute phrase franaise de la forme Nj V N2 (Ainsi le chasseur tue le lion), on peut obtenir une phrase o l'ordre des syntagmes nominaux est inverse N2 Nx (le lion le chasseur) en changeant la forme verbale 3, le lion est tu par le chasseur. Le recours ce genre d'informations grammaticales, dans l'analyse d'un texte, se justifie par le fait que, puisque cette rgle s'applique toute phrase franaise de la forme N2 V N2, elle doit donc aussi tre applicable toute phrase de la forme N-|_ V N2 du texte qui nous intresse, la seule condition, naturellement, que ce soit du franais. Et ce recours la grammaire permet dans bien des cas de pousser plus loin l'application de la mthode d'analyse du discours. Nous verrons ceci plus en dtail la section 7.3.; mais il faut signaler ici que cet usage de l'information grammaticale ne remplace pas le travail qui pourrait tre effectu par la mthode d'analyse du discours et n'affecte en rien l'autonomie de cette mthode, il ne sert qu' transformer certaines phrases du texte en phrases grammaticalement quivalentes (cf. ci-dessus la transformation de Nj V N2 en N2 V* Nx), pour rendre plus aise l'appli cation de la mthode d'analyse du discours, ou pour la rendre possible dans certains passages du texte o elle ne l'tait pas auparavant. Et nous verrons qu'il ne s'agit pas de dcider arbitrairement quand et comment appliquer ces transformations grammaticales, mais que c'est la structure mme du texte qui les dtermine. On peut pousser plus avant encore l'application de la mthode d'ana lyse du discours dans des textes particuliers si on utilise, non seulement les rsultats ordinaires de la grammaire, mais si on introduit galement dans la linguistique descriptive l'tude des distributions spcifiques des mor phmes individuels; dans certains cas, en effet, comme on le verra la section 7.3., on aimerait pouvoir avoir des renseignements non plus sur toute une classe de morphmes (comme la transformation de tout V en V*), mais sur un certain membre de cette classe, sur une restriction d'oc currence qui est vraie pour ce morphme-l, mais non pour les autres; on n'a pas toujours l'heure actuelle de tels renseignements, mais il est pos3. Dans ce cas de transformation du verbe correspondant une inversion du sujet (N1 ci-dessus) et de l'objet (N2), on appellera la nouvelle forme verbale forme conjointe de la premire et on l'crira V*. La forme conjointe d'un verbe actif est donc le passif et vice versa.

13 sible de les obtenir par des mthodes qui, fondamentalement, sont celles de la linguistique descriptive. Enfin, on peut quelquefois pousser plus avant l'application de l'ana lysedu discours dans des textes particuliers en tirant des renseignements non seulement de la grammaire de la langue mais aussi d'une analyse des criptive de l'ensemble, crit ou parl, dont le texte fait partie : on peut considrer cette masse plus vaste de matriau comme le dialecte dans lequel a t crit ou dit le texte en question, et on peut dire, comme prc demment, que toute conclusion distributionnelle vraie pour toutes les phrases d'une forme donne dans ce dialecte est vraie aussi de toute phrase de cette forme dans le texte en question.

La mthode

4. Nature de la mthode. Nous avons soulev deux questions : celle des rapports distributionnels entre les phrases, et celle de la corrlation entre la langue et la situa tion sociale. Nous avons suggr qu'on peut obtenir des renseignements concernant ces deux problmes grce l'analyse formelle d'un discours pris comme un tout spcifique. Quel genre d'analyse faudrait-il utiliser? Pour en dcider, considrons ce que permet le matriau. Puisque le matriau consiste simplement en une squence de formes linguistiques disposes en phrases successives, toute analyse formelle se limite localiser des lments linguistiques l'intrieur de ces phrases, c'est--dire tablir les occurrences d'lments; moins d'introduire de l'extrieur des informations nouvelles, nous ne pouvons pas tudier la nature ou la composition de ces lments, o leur corrlation avec des caractristiques non-linguistiques. Qui plus est, il n'y a pas d'lments spciaux qui soient a priori plus importants que les autres, comme mais, ou je, ou communisme, qui nous conduiraient nous intresser au simple fait de leur absence ou de leur prsence dans notre texte. Toute analyse qui tendrait dcouvrir la pr sence ou l'absence dans un texte de certains mots particuliers choisis par le linguiste, serait une recherche sur le contenu du texte, qui reposerait finalement sur le sens des mots choisis. Si nous ne nous appuyons pas sur le sens dans notre analyse, les seuls morphmes ou les seules classes que nous puissions traiter sparment sont ceux qui prsentent des parti cularits de distribution tablies grammaticalement. Puisque nous ne nous intressons donc pas, en gnral, tel ou tel lment choisi l'avance, mais bien aux lments qui figurent dans le texte, il est vident que nous ne voulons pas simplement affirmer tauto-

14 logiquement qu'ils figurent; nous chercherons tablir empiriquement comment ils figurent, lesquels se trouvent toujours ct de quels autres, ou dans le mme environnement que quels autres, etc., c'est-dire l'occurrence relative de ces lments les uns par rapport aux autres En ce sens notre. mthode se rapproche plus de celle queJ!on< utilise pour laborer la grammaire d'une langue (qui tablit; les. rapports distributionnels entre les .lments), que de celle que l'on (utilise pour en j laborer le dictionnaire (qui dresse la liste de tous les lments de cette langue, sans se proccuper de, leurs .positions). Enfin, puisque, le matriau est une suite -finie de. phrases, ce que nous aurons tabli sur la distribution.de chaque lment ne peut tre valable que dans les limites de cette squence de phrases que ce soit un paragraphe ou un livre. Nous verrons plus loin (7.3.) qu'on peut parfois utiliser des renseignements concernant la distribution d'un lment hors du texte consi dr; mais ceci ne peut tre qu'un auxiliaire extrieur, n'utiliser que lorsque la distribution de cet lment dans le texte a t compltement tablie.

5. Aperu gnral de la mthode. Il rsulte de tout ce qui prcde que notre mthode devra tablir les occurrences d'lments et en particulier les occurrences relatives de tous les lments d'un discours dans les limites de ce seul discours. 5.1. lments dans des environnements identiques. Pour satisfaire cette ncessit, nous pourrions. formuler de faon dtaille la distribution de chacun des lments dans le discours de mme qu'en linguistique descriptive nous pourrions tablir des formules individuelles rendant compte de tous les environnements (c'est--dire de la distribution) de chaque lment dans les diffrentes phrases d'une langue. Mais ces formules individuelles sont de dimension impossible pour toute une langue et, mme pour un seul texte, elles sont difficiles manier. De plus, dans les deux cas, elles ne constituent pas une base satisfaisante pour procder une analyse compare et pour en dduire des conclusions gnrales. C'est pourquoi, dans l'analyse du discours, comme en linguistique descriptive, on regroupe les lments qui ont des distribu tions semblables en une classe et, partir de l, on parle de la distribution de la classe considre comme un tout plutt que de celle de chacun des lments pris sparment. Quand deux lments ont des distributions identiques, cette opration de regroupement ne prsente aucune difficult. En linguistique descriptive, cependant, c'est rarement le cas, car peu de mots ont des distributions

15 identiques dans l'ensemble d'une langue 4. Cela peut se trouver plus fr quemment dans un texte rptitif, o deux mots peuvent tre toujours employs dans des phrases parallles identiques comme par exemple dans les lgendes style en cho, dans les proverbes, dans les slogans, ou dans les rapports scientifiques secs , mais prcis. 5.2. lments environnements quivalents. Il est plus frquent que deux lments se prsentent dans des env ironnements qui sont presque identiques, sans l'tre tout fait; nous pour rons peut-tre alors les regrouper en une seule classe distributionnelle en dressant une chane d'quivalences qui lie les deux environnements presque identiques 5. C'est ce qu'on fait en linguistique descriptive quand on dit, par exemple, qu'en. franais la classe des adjectifs A se rencontre aprs la classe des noms N, en dpit du fait qu'un certain A (courageuse par exemple) peut ne jamais figurer aprs un certain N (table par exemple). C'est ce qu'on fait en analyse du discours quand on dit que deux parties de l'nonc, qui ont le mme environnement un endroit, sont quivalentes mme en un autre endroit o elles n'ont pas le mme environnement. Supposons par exemple que le texte contienne les quatre phrases suivantes : Ici les feuilles tombent vers le milieu de l'automne Ici les feuilles tombent vers la fin du mois d'octobre Les premiers froids arrivent aprs le milieu de l'automne Nous commenons chauffer aprs la fin du mois d'octobre. Nous pouvons dire que le milieu de l'automne et la fin du mois d'octobre sont quivalents parce qu'ils se prsentent dans le mme environnement (Ici les feuilles tombent vers) et que cette quivalence passe dans les phrases 3 et 4. Ceci pos, on peut aller plus loin et dire que Les premiers froids arrivent et Nous commenons chauffer se prsentent dans des env ironnements quivalents (le mot en supplment aprs est identique dans les deux environnements). L'laboration de ces chanes, qui font passer l'quivalence de deux parties de l'nonc d'une paire de phrases o leur environnement est vraiment identique, une autre paire de phrases o il ne l'est pas, doit naturellement prsenter de srieuses garanties, sinon tout devient quivalent tout et l'analyse s'effondre. On a le mme pro blme quand on tablit les classes en linguistique descriptive. Nous verrons plus loin (6.1.) le genre de garanties qui sont requises dans l'analyse du discours. De faon plus gnrale, si nous avons dans notre texte les squences 4. Deux noms de personnes peuvent avoir des distributions identiques. Ainsi pour toute phrase qui contient Bill, on peut trouver une phrase identique pour tout le reste, mais qui contient Jim la place de Bill. 5. Des travaux indits de N. Chomsky m'ont aid mieux comprendre l'usage de ces chanes.

16 AM et AN, nous dirons que M est quivalent N, ou que M et N se pr sentent dans un mme environnement A, ou que M et N se prsentent tous deux comme l'environnement d'un mme lment (ou squence d'lments) A; et nous crirons M = N. Si nous trouvons alors dans notre texte BM et CN (ou MB et NC), nous dirons que B est quivalent C (au second degr), puisque B et C se trouvent dans des environnements M et N, dont nous avons tabli l'quivalence, et nous crirons B = C. Puis, si nous trouvons BK et CL, nous crirons K = L, puisqu'ils se trouvent dans les environ nements B et C quivalents au second degr, et ainsi de suite. A titre d'exemple, continuons notre fragment de texte par la phrase suivante : Nous avons toujours des tas d'ennuis quand nous commenons chauffer, mais il faut bien tre prt quand les premiers froids arrivent. Nous dirons que Nous avons toujours des tas d'ennuis est quivalent (dans ce texte) mais il faut bien tre prt. Dire que B = C ne veut pas dire qu'ils sont gaux en gnral, ni qu'ils signifient la mme chose; on utilise le signe = pour l'unique raison que le rapport entre B et C satisfait aux exigences techniques du rapport communment symbolis par ce signe; quand nous posons B = C, cela signifie seulement que ce rapport est une tape dans une chane d'quiva lences : d'une part B et C se rencontrent dans des environnements qui valents (M et N); d'autre part deux environnements (K et L), quels qu'ils soient, dans lesquels se trouvent B et G seront considrs quivalents. Il ne sert rien de soulever des questions comme Est-il vrai que B = C? ou A-t-on le droit de dire que K = L, simplement parce qu'on a B = G et qu'on trouve BK et CL? . Tout ce que nous proposons ici est une mthode d'analyse, les seules questions pertinentes sont de savoir si la mthode est utilisable et si elle conduit des rsultats intressants et valables. On jugera si la mthode est utilisable en se fondant sur ses oprations, sans se proccuper de ses rsultats, que nous n'avons pas encore vus. Quant aux rsultats, nous en tudierons l'intrt aux para graphes 8, 9 et 10, o nous verrons que les chanes d'quivalences rvlent une structure pour chaque texte. Il ne s'agit pas de savoir si nous avons le droit de poser K = L, puisque tout ce que nous signifions par K = L est qu'on trouve BK et CL et que B = C; la justification viendra du fait qu'en regroupant toutes les quivalences, on trouve quelque chose sur la structure du texte. 5.3. Classes d'quivalences. Aprs avoir tabli quelles sont les squences qui se rencontrent dans des environnements quivalents, nous pouvons les regrouper en une seule classe d'quivalence. Nous avons les formules A = B (tous deux se ren contrent devant N) et B = C, nous considrerons donc A, B et C comme membres d'une mme classe d'quivalence. De mme, M, N, K, L sont tous membres d'une autre mme classe d'quivalence. Reprenons notre exemple : Les feuilles tombent vers (Tx), Les premiers froids arrivent aprs

17 (To) et Nous commenons chauffer aprs (T3) sont tous trois membres d'une classe d'quivalence T, tandis que le milieu de V automne (Ex) et la fin du mois d'octobre (E2) sont membres d'une autre classe d'quivalence E. Il y a encore une troisime classe d'quivalence E' compose de nous avons toujours des tas d'ennuis quand et mais il faut bien tre prt quand. Il y a visiblement un rapport entre E' et E puisque tous deux se rencontrent avec les deux derniers membres de T. Mais E se trouve aprs T, tandis que E' se trouve avant T. En fonction de ces classes, on peut crire les cinq phrases du fragment de texte en six formules (la dernire phrase est double) : TE, TE, TE, TE, E'T, E'T; on ne peut visiblement pas faire de E et E' une seule classe, mais on peut dire que, quand l'ordre de E et T est invers (quand E se rflchit dans T), on a E' la place de E. Si on modifie les membres de E' pour leur donner la forme qu'ils auraient s'ils suivaient T au lieu de le prcder, ils deviennent des membres rguliers de E. Par exemple, on pourrait dire Nous commenons chauffer avec toujours des tas d'ennuis mais les premiers froids arrivent si brusquement qu'il faut bien tre prt. Cette phrase est de la forme TETE. Le nouveau syntagme avec toujours beaucoup d'ennuis est un membre deE en vertu de son occurrence aprs T; appelons le E3; il faut naturellement montrer qu'il est quivalent Nous avons toujours des tas d'ennuis, sauf en ce qui concerne sa position inverse par rapport T; nous verrons au paragraphe 7.3. quelles techniques on fait appel pour tablir cette quivalence. De mme il faut montrer que le nouveau syntagme E mais... si brusquement qu'il faut bien tre prt (E4) est le rflchi dans T du syntagme E' mais il faut bien tre prt quand. Si on peut tablir ces deux quivalences, on peut remplacer les deux syntagmes E' par les syntagmes modifis qu'on obtient quand on les met en position E. Nous obtenons par consquent deux membres de plus dans E, et la classe E' n'existe plus. On peut ainsi dresser des classes d'quivalence (comme E) de toutes les squences qui ont des environnements quivalents, l'intrieur du texte, c'est--dire les mmes classes d'quivalence d'un mme ct (avant ou aprs). Les lments (ou squences d'lments) qui appartiennent la mme classe d'quivalence sont dits quivalents les uns aux autres, ou substituts les uns des autres : nous verrons plus loin (paragraphe 10) que, par certains cts (en particulier dans les extensions du texte), on peut les considrer comme interchangeables ou substituables; dans ce cas la classe d'quivalence peut aussi s'appeler une classe de substitution. 11 est remarquer que l'opration consistant grouper dans une mme classe d'quivalence des formes non identiques, ne repose pas sur le fait que leurs petites diffrences de sens sont considres comme ngligeables, mais sur le fait qu'on les trouve dans des environnements quivalents, ce qui signifie qu'on les trouve soit dans des environnements identiques (le milieu de l'automne et la fin du mois d'octobre se rencontrent tous deux dans l'environnement les feuilles tombent vers), soit dans des environne-

18 ments qui sont aux extrmits d'une chane d'quivalences garantie (Les premiers froids arrivent et Nous commenons chauffer se trouvent dans les environnments quivalents aprs le milieu de l'automne et aprs la fin du mois d'octobre). Notre mthode est donc essentiellement celle de la linguistique descriptive et non celle de la smantique. 5.4. Ordres de phrase. Nous en arrivons maintenant une opration que n'emploie pas la linguistique descriptive, savoir la reprsentation de l'ordre des occur rences successives des membres d'une classe. En linguistique descriptive, le seul ordre considr est la position relative des diffrentes parties d'une squence : on dcrit, par exemple, l'ordre de l'article et du nom en disant que le premier prcde le second dans la chane du syntagme nominal. Dans l'analyse du discours aussi nous avons ce type d'ordre dans les parties de la phrase, par exemple les ordres diffrents de E et E' par rapport T. L'ordre des phrases successives ou d'une certaine classe de mots dans diffrentes phrases (par exemple la relation entre des sujets successifs) n'intresse gnralement pas la linguistique descriptive, car les formules distributionnelles qu'elle dfinit ne s'appliquent normalement qu' l'int rieur d'une seule phrase la fois. Dans notre cas cependant, o il s'agit de tout un discours, le problme existe. Si nous considrions chaque phrase sparment, en ne la rapprochant des autres que pour comparer des struc tures, nous pourrions dire (comme en linguistique descriptive) que chacune des phrases de notre fragment de texte consiste en TE. Mais, puisque nous considrons le texte comme un tout, nous ne pouvons dire qu'il consiste simplement en 6 fois TE : les membres de E et de T sont diffrents dans les diverses phrases; et leurs diffrences preuvent tre particulires ce texte, ou un groupe de texte semblables. Nous pouvons reprsenter structurellement notre fragment de texte par un tableau double entre, l'axe horizontal reprsentant la matire qui se prsente l'intrieur d'une seule phrase ou sous-phrase, l'axe ver tical (ici divis en 2 parties) reprsentant les phrases successives. Ti Ex T3 E2

Dans ce tableau double entre, les diffrents symboles dans la range horizontale reprsentent les diffrentes parties d'une seule phrase ou sous-phrase du texte, dans l'ordre dans lequel elles se prsentent dans la phrase (sauf dans la mesure o l'ordre a t modifi par des transfor mations explicites comme pour le passage de E' E). Les colonnes verti cales indiquent les diffrents membres d'une classe d'quivalence, dans l'ordre d'apparition des phrases o ils figurent. Le fait que l'ordre des symboles d'une range puisse tre diffrent de l'ordre des lments dans la phrase correspondante tient ce que nos

19 connaissances linguistiques de la structure de phrase nous permettent de traiter les lments indpendamment de leur ordre. C'est ce que nous faisons quand nous ne tenons pas compte dans nos symboles d'un ordre automatique et qui rapparatrait ds la retraduction de nos symboles en langue, par exemple nous incluons mais... dans E4 mme s'il en est ncessairement spar dans la phrase relle (puisque mais se trouve gn ralement au dbut d'une structure de phrase, quelle que soit la partie de la phrase laquelle il se rapporte). C'est ce que nous faisons galement quand nous remplaons un certain ordre non automatique valeur mor phologique par les morphmes qui sont grammaticalement quivalents cet ordre : ainsi quand, par exemple, nous remplaons NXV N2 par N2 V* Nj_ (remplacement de le chasseur tue le lion par le lion est tu par le chasseur) ou quand, dans notre fragment de texte, nous remplaons E' avant T par E aprs T. Contrairement au traitement cavalier de l'ordre horizontal, nous ne pouvons rien changer l'ordre dans une colonne verticale : nous n'avons l aucune connaissance linguistique a priori qui nous dise quels agence ments de phrase sont automatiques (s'il y en a) et par consquent ne pas reprsenter, ni quels agencements peuvent tre remplacs par des agen cements diffrents, mais quivalents. Une tude plus approfondie des squences de phrases dans la langue nous donnera peut-tre un jour des indications ce sujet; elle tablira peut-tre, par exemple et pour prendre un cas trs simple, que des squences de phrases de la forme P parce que Q sont quivalentes des squences de la forme Q donc P, ou que P et Q est interchangeable avec Q et P (tandis que P mais Q peut n'tre pas pareillement interchangeable avec Q mais P) 6. Qui plus est, une tude approfondie d'un certain texte ou de plusieurs textes d'un certain type montrera peut-tre que certaines squences de phrases tout entires sont interchangeables ou quivalentes; et, grce ces donnes, nous pourrons peut-tre simplifier l'axe vertical du tableau double entre, en trouvant par exemple des schemes verticaux qui reviennent priod iquement. En attendant, l'axe vertical reste une reproduction exacte de l'ordre des phrases ou sous-phrases du texte. 5.5. Rsum. Nous pouvons maintenant avoir un aperu gnral de la mthode. On dira que des lments (parties de texte morphmes ou squences de morphmes) sont quivalents entre eux s'ils se prsentent dans l'env ironnement d'autres lments identiques ou quivalents. Tout ensemble d'lments quivalents entre eux s'appelle une classe d'quivalence. 6. Les mathmatiques, et plus encore la logique, ont dj tabli des ordres de phrase spcifiques qui sont quivalents. On peut redcouvrir linguistiquement cette quivalence en trouvant que la distribution de chaque phrase est quivalente celle des autres. Mais nous cherchons plutt ici dcouvrir d'autres quivalences que celles que nous savons dj faire partie du systme.

20 Chaque phrase successive du texte est alors reprsente par une squence de classes d'quivalence, celles auxquelles ses diffrentes parties appar tiennent. Nous obtenons ainsi pour tout le texte un tableau double entre, l'axe horizontal reprsentant les classes d'quivalence contenues par une seule phrase, l'axe vertical reprsentant les phrases successives. Ce n'est pas un tableau des structures de phrase (sujets, verbes, etc.), mais des schemes d'occurrence des classes d'quivalences dans tout le texte. Si les diffrentes phrases contiennent des classes entirement diff rentes, ce tableau n'a pas d'intrt; mais ce n'est gnralement pas le cas. Il y a, dans presque tous les textes, des passages o certaines classes d'quivalence se rptent, dans les phrases successives, en un scheme caractristique. Le tableau permet d'tudier ce scheme et on peut en tirer divers types d'information sur le texte, certaines analyses structur elles du texte et certaines exgses sur le texte. Pour les classes d'qui valence, qui ont t tablies distributionnellement, le tableau en montre la distribution. Pour le texte dans sa totalit, le tableau montre certaines caractristiques de structure. 6. Mode opratoire. Nous allons maintenant montrer la procdure en dtail, en appli quant la mthode un texte spcifique, d'un type trs courant aujour d'hui 7. Millions Can't Be Wrong Millions of consumer bottles of X- have been sold since its introduction a few years ago. And four out of five people in a nation wide survey say they prefer X- to any hair tonic they've used. Four out of five people in a nation wide survey can't be wrong. You too and your whole family will prefer Xto any hair tonic you've used! Every year we sell more bottles of X- to satis fiedcustomers. You too will be satisfied! 6.1. Dtermination des classes d'quivalence. La premire tape dans l'analyse du discours consiste dcider quels lments doivent tre considrs comme quivalents, donc placs dans la mme colonne du tableau. Ce n'est pas toujours automatique, il ne s'agit pas simplement de trouver ceux des lments qui ont des environne7. Ceci est le texte authentique d'un slogan, que nous avons trouv sur une carte, qui selon toute vraisemblance, tait accroche une bouteille de lotion capillaire. Un trs grand nombre de slogans ont t analyss, car ils offrent un matriau clair et rpt itif qui est relativement facile manier, au stade o nous en sommes arrivs dans l'analyse du discours. On a aussi analys de nombreux autres types de textes des fragments de livres scolaires, de conversations, d'essais littraires, etc., qui feront l'objet d'une prochaine publication.

21 ments identiques, car 1 il peut y avoir plusieurs faons de couper une phrase en parties quivalentes; et 2 il nous faut dterminer dans quelle direction chercher les chanes d'quivalence qui sont moins videntes. Le point de dpart le plus simple est d'examiner les mots du texte qui sont le plus souvent rpts : presque tous les textes contiennent des mots trs souvent rpts 8, qui sont souvent les mots-cls du texte. On peut en toute certitude mettre dans une seule colonne, c'est--dire dans une seule classe d'quivalence, les diverses occurrences de chacun de ces mots. Et on peut mettre dans une seule autre classe d'quivalence les mots voisins du mot-cl puisqu'ils se prsentent dans des environnements identiques. Dans notre texte, il n'y a pas apparemment de mots-cls; mais nous pouvons partir de la squence rpte can't be wrong, identique et donc naturellement quivalente : Millions est alors quivalent (pour ce texte) Four out of five people in a nation wide survey, puisque tous deux se trouvent devant can't be wrong. Cette premire tape pourrait aussi, bien entendu, tre effectue pour des mots rpts tels que of. Mais si nous devions regrouper tous les environnements du mot of, nous ne pourrions pas utiliser la classe d'qui valence qui en rsulterait pour construire une chane d'autres quivalences, car on ne trouverait rien d'autre dans leur environnement. Tandis que la classe contenant millions et four out of five, que nous obtenons partir des rptitions de can't be wrong, se rvlera, dans les paragraphes sui vants, lie d'autres parties de ce texte. En utilisant ainsi les rptitions, nous en venons construire des chanes d'quivalence : nous nous demandons quels autres environnements se prsentent pour millions et four out of five... Pour millions nous avons un autre environnement, savoir of consumer bottles, etc., mais nous verrons plus tard (paragraphe 9) que cet environnement s'oppose aux environnements de four out of five; nous laisserons donc provisoirement de ct la squence of consumer bottles, etc. Quant Four out of five in a nation wide survey, nous le trouvons dans un autre environnement say they prefer X- to any hair tonic they 've used. Nous suivons cette chane d'quivalence en cherchant un autre env ironnement dans lequel say they prefer X- se trouve; il y a bien une autre occurrence de cette squence, mais elle se diffrencie de la premire par you la place de they. A premire vue, il parat donc impossible de consi drer ces deux squences comme quivalentes, puisque notre mthode ne donne aucune technique d'approximation, aucun moyen d'estimer une diffrence plus ou moins grande, qui puisse nous permettre de 8. Ceci est mme vrai, bien qu' un moindre degr, dans des textes crits par ceux qui respectent les consignes scolaires concernant l'emploi des synonymes pour viter les rptitions. Dans ce cas, on trouvera souvent les synonymes dans les mmes env ironnements que le mot originel ne pas rpter. Au contraire, quand un auteur a inten tionnellement utilis un mot diffrent pour exposer une nuance particulire de sens que ce mot exprime, il y aura souvent une diffrence correspondante entre les environ nements du synonyme et du mot originel.

22 dire que ces deux squences sont assez semblables pour tre considres comme quivalentes. En fait, puisque nous n'oprons pas sur le sens des morphmes, le remplacement de they par you pourrait constituer une diffrence importante (comme ce serait le cas si tout le texte traitait de la distinction entre you et they). Telles quelles, ces deux squences ne seraient donc pas rapproches par notre mthode; tout ce que cette mthode pourrait faire, serait de trier les parties identiques et les parties diff rentes. En fait il se trouve cependant qu'un examen un peu plus appro fondi montre que ces deux squences sont contextuellement identiques c'est--dire identiques quant leur environnement pertinent ou contexte. On verra cela au paragraphe 7.1. Dans l'laboration des chanes d'quivalence, il importe de se confor mer rigoureusement aux exigences formelles de la mthode, ceci constitue la premire garantie; si nous ne faisons jamais d'approximations, si nous ne ngligeons jamais une petite diffrence dans l'environnement, nous serons assurs que deux membres quelconques d'une mme classe d'qui valence ont au moins un environnement en commun. Si nous voulons mettre dans une mme classe deux lments alors qu'aucun environne ment de l'un n'est identique un environnement de l'autre, il nous faudra ajouter la mthode un postulat explicite, qui rendra gaux deux env ironnements ou neutralisera leur diffrence. Il faut enfin examiner, quand on se demande s'il faut inclure ou non deux lments dans une mme classe d'quivalence, comment fonctionner ait, dans l'analyse du texte, la classe qui rsulterait de cette inclusion, c'est--dire le genre de tableau double entre que l'on obtiendrait en utilisant cette classe : ce facteur doit jouer un rle, car il y a souvent plusieurs chanes d'quivalence possibles qui satisfont la mthode. Il ne s'agit pas de considrer des critres externes, comme la longueur de la chane par exemple; il s'agit plutt de chercher une distribution syst matique des classes, c'est--dire d'essayer d'tablir en termes de ces classes un certain fait structurel sur le texte. Autrement dit, nous essayons de dresser des classes telles qu'elles aient une distribution intressante pour notre texte. On pourrait penser que c'est une garantie plutt cir culaire pour la construction des chanes d'quivalence; mais cela signifie simplement que toutes les fois que nous devons dcider s'il faut pousser plus loin une chane d'quivalence, nous tudions comment le nouveau jalon s'inscrira dans notre texte analys, tel qu'il se prsentera une fois reprsent en fonction de cette nouvelle classe. On utilise aussi ce genre de considration en linguistique descriptive quand on doit dcider, par exemple, jusqu'o aller dans la subdivision d'une squence phonologique en morphmes 9. 9. Cf. Methods in structural Linguistics, p. 160, de Harris (Chicago, 1951). Il va sans dire que cet emploi vague de la prvision est une formulation prliminaire. Des analyses pousses montreront ce que l'on peut attendre des diffrents types de chanes d'qui valence, et permettront ainsi une formulation plus prcise des garanties.

23 On pourrait demander de quel droit nous mettons deux mots dans une mme classe d'quivalence pour l'unique raison qu'ils se prsentent tous deux dans le mme environnement. Ce quoi nous rpondrons que la classe d'quivalence indique seulement ce que font distributionnellement ses membres dans le texte : si, dans ce texte, deux mots ne se pr sentent que dans des environnements identiques ou quivalents, alors, dans ce texte, il n'y a pas de diffrence dans leur distribution ( part leur ordre dans la colonne, qui est prserv). Nous ne nions pas qu'il puisse y avoir des diffrences de sens ou de distribution en dehors de ce texte. Nous avons jusqu'ici reconnu deux classes d'quivalence. L'une, que nous appellerons P, contient pour l'instant : Millions Four out of five people in a nation wide survey l'autre, que nous appellerons W, contient pour l'instant : Can't be wrong sag they prefer X- to any hair tonic they've used. 6.2. Segmentation. Ds que nous voyons peu prs quelles classes d'quivalence nou& voudrions exprimenter dans notre texte, nous le divisons en segments successifs de manire avoir, dans chaque segment, des occurrences semblables des mmes classes d'quivalences. Si nous avons jusqu'ici les classes P et W et si nous avons quelques successions de la forme PW, nous essayons de les diviser en segments contenant chacun exactement un P et un W. Par exemple, le titre du slogan est reprsent par PW. La pre mire phrase aprs le titre parat contenir un P (le mot Millions), mais le reste de la phrase n'est pas gal W et ne le contient pas; on laisse donc la phrase non analyse, et mme son P est-il douteux. L'appartenance d'un lment une classe particulire dpend tou jours de l'appartenance de son environnement. Les lments ne se dfi nissent qu'en fonction de leur environnement. Ainsi donc, il se pourrait que le Millions de cette phrase ne soit pas le mme mot que le Millions du titre. En linguistique descriptive, deux segments identiques du point de vue phonologique ne constituent un mme morphme que s'ils figurent dans la mme classe de morphmes : il faudrait probablement considrer sun (soleil) et son (fils) comme le mme morphme, au mme titre que table (de bois) et table (de logarithmes); s'ils figurent dans des classes de morphmes diffrentes, comme par exemple sea (mer) et see (voir), ils ne sont certainement pas le mme morphme; et si nous voulons ne pas faire disparatre le rapport entre (a) table (une table) et (to) table (tabul er) nous devons distinguer des morphmes classs et des morphmes non classs, et dire que le morphme non class table figure la fois dans la classe N et dans la classe V. De la mme faon, si nous rencontrons Mill ions deux fois, nous essayons de le considrer comme un mme mor-

24 phme rpt (donc de la mme classe), et de considrer ainsi ses deux environnements comme quivalents. Mais il se peut que nous dcouvrions ensuite qu'on obtient une meilleure analyse du texte en ne considrant pas ces deux environnements comme quivalents (parce que le premier environnement est quivalent une certaine squence A dans le texte, tandis que le second est quivalent une autre squence B, qui n'est pas quivalente A). Ainsi donc il se peut que nous ayons considrer les deux occurrences de millions comme appartenant deux classes diff rentes. Nous verrons la section 9 que c'est bien le cas ici. ReVenons-en notre segmentation. La deuxime phrase du texte est PW, et la troisime PW. Nous essayons donc de segmenter notre texte en tranches successives contenant chacune exactement PW et pas plus. Ces tranches seront alors les ranges successives de notre tableau double entre. Il s'agira souvent d'une phrase entire, mais pas ncessairement : les diffrentes sections d'une phrase compose, chacune ayant sa propre structure de phrase (comme les deux E'T du paragraphe 5.3.), peuvent aussi constituer des tranches. Mais toute autre portion de la phrase peut aussi constituer une de ces tranches. Par exemple, si nous avions dans notre slogan la phrase : Millions of people four out of five can't be wrong when they say they prefer X, qui, telle qu'elle est l, parat consis ter en PPWW, nous essaierions de la rduire deux segments PW. Ces segmentations, moins videntes, demandent la plus grande attention, car nous voulons non seulement que les occurrences de P et W soient les mmes dans chaque segment, mais aussi que le rapport entre P et W soit le mme. Quand, dans une suite de phrases, chaque phrase tout entire se rduit PW,le rapport entre P et W dans chaque segment est le mme; la linguistique descriptive nous apprend que c'est le rapport entre sujet et prdicat. Nous n'avons pas besoin d'utiliser ce renseignement spci fique pour analyser notre texte en PW successifs, mais nous tenons pour acquis que, quel que soit le rapport entre P et W dans un segment, il est le mme dans tous les autres segments. Sans quoi il serait faux de dire, en face d'un tableau double entre, comme les TE successifs du para graphe 5.4., que les segments successifs sont identiques pour ce qui est de T et E. Nous verrons aux paragraphes 7.2. et 7.3. les techniques permettant de vrifier que le rapport entre les classes d'quivalence de chaque range est le mme. 6.3. Sries de segments semblables. On ne russira gnralement pas diviser tout un texte en segments contenant les mmes classes d'quivalence (dans le mme rapport les unes par rapport aux autres). Il peut y avoir ici et l des phrases qui tout simplement ne contiennent pas ces classes : elles peuvent se rvler tre des phrases d'introduction ou des ramifications d'une autre srie de classes d'quivalence. Et le texte peut tre constitu de morceaux suc cessifs, sortes de sous-textes l'intrieur du texte principal, comme des

25 paragraphes ou des chapitres contenant chacun ses propres classes d'qui valence diffrentes de celles des autres morceaux. En cherchant les segments qui contiennent les mmes classes, on dcouvrira les limites de cette appartenance une mme classe, c'est-dire les endroits o l'on obtient des fragments du texte contenant des classes diffrentes. En rgle gnrale un texte ne se rduira donc pas une seule srie de ranges identiques (chaque range, comme TE, repr sentant un fragment contenant les mmes classes d'quivalence), mais une succession de sries de ranges identiques l'intrieur de chaque srie avec, ici et l, des ranges individuelles et diffrentes. Ayant obtenu ce rsultat, nous comparons alors les diffrentes sries et ranges individuelles, pour voir leurs ressemblances et leurs diffrences en ce qui concerne l'agencement de leurs classes, que les classes spci fiques soient diffrentes ou non. Nous essayons de dcouvrir des schemes dans l'occurrence de ces ressemblances au cours de la succession des sries et des ranges individuelles. Par exemple, supposons un texte de la forme AB TE TE TE A'B' EP EP AB KD LM LM K'D' MS MS MS FBV MS. Si nous utilisons des crochets pour reprsenter une srie de fragments de la mme forme en laissant momentanment BV de ct, nous pouvons alors reprsenter le texte par AB [TE] A'B' [EP] AB KD [LM] K'D' [MS]. Nous remarquons alors que AB [TE] A'B' [EP] et KD [LM] K'D' [MS] sont structurellement identiques : tous deux sont de la forme w [xy] w' [yz]; c'est un rapport particulier entre w, x, y et z; notre texte consiste en deux occurrences de cette structure, plus une deuxime apparition du w de la premire occurrence (c'est--dire le AB) entre les deux structures (ou avant la seconde structure), et plus un FBV unique avant la fin de la dernire structure. 7. Techniques auxiliaires. Il faut affiner et complter la procdure centrale, que nous venons de voir, l'aide de plusieurs techniques auxiliaires. 7.1. Occurrence indpendante. La distribution des classes d'quivalences (leur scheme d'occur rence)et la segmentation en fragments qui les contiennent, dpendent de ce que nous reconnaissons tre une occurrence d'un lment. A premire vue, cela peut paratre tout simple : dans la suite Say they prefer X- to any hair tonic they've used before, nous trouvons videmment say une fois, they deux fois, etc., En y regardant de plus prs cependant nous voyons que toutes les occurrences des lments ne sont pas indpendantes : cer tains lments ne se trouvent, dans un environnement donn, qu'en pr sence d'un autre lment. Cette situation est connue en linguistique des criptive; par exemple le 5- de he walks n'est pas pris comme lment indpendant, mais comme une co-occurrence automatique de he, par

26 comparaison avec / walk, you walk 10; et dans des formes comme both he and I, la prsence de both entrane toujours celle de and, si bien qu'on peut considrer both ... and comme un seul lment et non comme deux lments. De la mme faon, si dans un texte nous trouvons des lments identiques (rpts) ou diffrents, dont l'un n'apparat que si l'autre est prsent, nous concluons que ces occurrences ne sont pas ind pendantes l'une de l'autre et nous indiquons leur occurrence combine comme un seul lment dans notre reprsentation du texte. Pour they prefer X- to any hair tonic they've used nous ne pouvons le comparer qu' you too and your whole family will prefer X- to any hair tonic you've used. Dans les deux cas, ce qui vient avant prefer contient le mot qui prcde 've; nous pouvons donc dire que le mot qui prcde 've n'est pas indpendant ou, plutt, que le choix de l'un des deux membres du groupe they /you dpend de celui des deux mots de ce groupe qui se trouve devant prefer. Si le signe Q reprsente la rptition du membre du groupe U X they \J I/you \J qui X se trouve dans ce qui XX prcde prefer, on a : they prefer X- to any hair tonic Q've used You... will prefer X- to any hair tonic Q've used. Maintenant que nous avons rduit ces noncs leurs lments indpendants, nous constatons que leurs dernires parties sont devenues identiques; par consquent les premires parties des deux phrases se trouvent dans des environnements identiques, elles sont donc quival entes; puisque la premire appartenait la classe P, la seconde you too... appartient aussi P u. Ceci tait un type d'occurrence lie; il y en a bien d'autres sortes qu'il faut tudier; et les enseignements tirs de cette tude sont utiles la fois pour l'analyse du discours et pour une linguistique descriptive plus dtaille. Les pronoms en offrent un exemple important. Si le slogan avait dit you... will prefer it, au lieu de you... will prefer X-, nous commencerions par considrer it comme un nouvel lment, placer dans une nouvelle classe d'quivalence. Mais, en fait, l'occurrence de it dpend de l'occur rencede X- : si le X prcdent avait contenu le morphme de pluriel (X-s), le pronom dans cette phrase aurait t them. D'autres mots du groupe de it, comme he ou you, ne peuvent figurer tant que X- apparat dans la phrase prcdente. Il en est de mme pour des mots comme 10. Le s fait aussi partie de tous les noms singuliers (The child walk-s, etc.). Ou on peut galement considrer que walks, goes, etc., sont des variantes de walk, go, etc. aprs he et les noms singuliers. 11. Avant d'en venir l, il faut effectuer un certain nombre d'autres oprations pour rduire Four out of fives... say they prefer... deux squences PW : Four... say... et they prefer..., la phrase You... will prefer... tant une troisime squence PW. Sinon, les mots say they resteraient, puisque la squence P (quivalente millions) est seulement Four out of five people in a nation wide survey, et puisque la squence W corrige (identique au W de You... will prefer) est seulement prefer X- to any hair tonic Q've used (cf. para graphe 9).

27 this /these, who /which, qui dpendent eux aussi de mots particuliers appa raissant un autre endroit du texte. Sans faire appel aucune connais sance sur la signification de ces pronoms ou sur leur rfrence aux noms qui les prcdent, nous pouvons conclure, d'aprs leur distribution dans le texte, que ce ne sont pas des lments indpendants : ils contiennent une partie (discontinue) de l'occurrence du morphme auquel ils sont correlis. On rencontre un autre type d'occurrence lie dans des expressions rciproques comme each other et together qui introduisent dans la langue certaines des fonctions remplies par les variables dans les expressions mathmatiques mais avec ce manque de nettet et cette complexit qui sont caractristiques de la langue. La phrase Foster and Lorch saw each other at the same moment est normale; mais enlevez and Lorch, et tous les anglophones remplaceront immdiatement each other par autre chose. Autrement dit, nous ne trouvons pas de phrase qui contienne each other sans contenir soit l'expression and Z, soit un morphme de pluriel dans le nom correspondant. Et aussi bien nous trouverons la phrase Electrons and positrons attract each other, mais nous ne trouverons pas dans un livre de physique tout au moins la mme phrase avec omission de and positrons, sauf s'il y a aussi d'autres modifications telles que le remplacement de attract par repel. On peut remarquer que les lments dpendants ont particulirement tendance appartenir, dans leurs diffrentes occurrences, des classes d'quivalence diffrentes, puisque chaque occurrence appartient la classe de l'lment, quel qu'il soit, qui lui est correli. Si le texte disait : You will prefer X-, You will prefer it, The survey showed, It showed, la premire occurrence de it appartiendrait la classe de X-, la seconde la classe de survey. Dans tous ces cas, on peut liminer les rapports spciaux d'occur rence lie entre des lments particuliers, en faisant simplement de l'l ment dpendant une partie de l'lment auquel il est correli (dont son occurrence dpend). Il est bien entendu que, quand nous parlons de dpendance, l'application que nous en faisons est restreinte au texte particulier considr. Il se peut que l'interdpendance entre les pronoms, ou les mots rciproques, et un quelconque nom voisin se maintienne dans tous les textes o ces mots apparaissent; mais l'interdpendance entre les deux occurrences de they ou de you dans notre texte est spcifique ce texte; on pourrait trouver ailleurs la phrase they prefer X- to any hair tonic you've used; mais dans ce texte particulier, nous n'avons pas cette phrase. C'est pourquoi dans ce texte nous pouvons dire ce que le second pronom doit tre, en considrant le premier. 7.2. Subdivisions des phrases. La prsence d'lments dpendants nous conduit considrer diff remment la subdivision des phrases.

28 Quand les parties dpendantes d'un lment sont disperses sur toute une zone, nous devons gnralement considrer toute cette zone comme constituant un seul fragment comportant cet lment. Dans they prefer X- to any hair tonic they've used par exemple, nous avons mont r que les deux occurrences de they sont interdpendantes dans ce texte; nous pouvons donc dcomposer cet nonc en they (se prsentant dans les deux positions) plus... prefer X- to any hair tonic... 've used; de mme pour la phrase avec you (galement dans les deux positions). Il s'agit l d'un traitement plus gnral que celui du paragraphe 7.1., qui donnait un statut privilgi la premire occurrence de they et de you en en fai sant dpendre la seconde occurrence, et qui fondait l'identit des deux phrases dans leur dernire partie sur le fait que toutes deux renfermaient le mme type de dpendance (Q). Ce nouveau traitement limine la dpendance en considrant que l'unique they ou you figure dans les deux positions, et tablit sans conditions l'identit des secondes parties des phrases. Le rsultat de ce nouveau traitement est que, puisque le they double position s'tend sur presque toute la longueur de la seconde partie, toute cette seconde partie doit tre enferme dans le mme frag ment que they. L'unification des deux occurrences de they nous empche donc de faire l deux segments; sinon nous aurions pu avoir deux seg ments : they prefer... et soit they've used soit Q've used. D'un autre ct, il y a des cas o la dpendance nous conduit dis tinguer plus de segments que nous ne le ferions autrement. Prenons par exemple la phrase Casals, who is self-exiled from Spain, stopped performing after the fascist victory. Si nous tudions le texte dans lequel est enchss cet nonc, nous trouvons que le who est dpendant de Casais, tout comme le second they est dpendant du premier : le texte contient And the same Casals who... mais plus loin The records which... Nous pouvons donc dire que le who contient Casals, c'est--dire qu'il en est soit la continuation, soit la rptition. Mais laquelle des deux est-il? S'il en est la continuation, nous n'avons qu'un segment, la premire partie (C) tant Casals who, la seconde (S) tant is self exiled... stopped... S'il en est la rptition, nous avons deux segments, l'un enchss dans l'autre : le premier est constitu de Casais (C de nouveau), plus stopped performing (Sx), le second de who (considr comme quivalent de Casals) plus is self-exiled (S2). Nous n'opterions pour la seconde solution que si nous pouvions montrer, en fonction du texte, que is self-exited... et stopped performing... sont deux lments distincts (et non simplement deux parties d'un mme long l ment) si, par exemple, nous trouvions dans le texte deux autres phrases : The press failed to say why he stopped performing, etc. But he has stated publicly why he is self-exiled, etc. Dans tous les cas, who contient Casals. Mais si la phrase originelle est Casals who S, notre analyse donne CS, tandis que si ( la lumire des deux dernires phrases) nous consid rons la phrase originelle comme tant Casals who S2SV notre analyse donne CC S2 Sv et divise la phrase en deux segments CS2 et CSj, le rsultat

29 tant que S2 et Sx sont quivalents puisqu'ils apparaissent tous deux aprs C. La seule diffrence qu'il y a entre le fait dconsidrer un lment dpendant comme une continuation et le fait de le considrer comme une rptition rside dans le nombre de segments un ou deux en lequel nous pouvons alors dcomposer le tout. Nous venons de voir que, quand une phrase contient un lment A, qui est dpendant de B, nous pouvons soit considrer toute la phrase comme un seul segment dans lequel A est simplement une continuation de B, soit la considrer comme deux segments, l'un contenant B et l'autre contenant A dans la mme classe que B. En rgle gnrale, on optera plutt pour cette seconde solution si le reste de la phrase peut se diviser en deux parties comparables, l'une allant avec A et l'autre avec B. Des choix de ce type peuvent se prsenter mme l o il n'y a pas de formes dpendantes. Par exemple, dans notre second texte, nous avons ensuite la phrase The self-exiled Casals is waiting across the Pyrenees for the fall of Franco; nous souhaitons mettre self-exiled dans la mme classe que is self-exiled..., puisqu'ils comportent les mmes morphmes ( condition de pouvoir montrer d'aprs le texte lui-mme que self-exiled est quivalent self-exiled from Spain); ceci nous donne la structure de phrase particulire S2 C S3, par comparaison avec les phrases CS prc dentes. Si maintenant par un heureux hasard le texte contenait galement la phrase Casals is waiting across the Pyrenees for the fall of Franco (ce qui est trop demander en fait de rptition), nous serions mme de faire l'analyse suivante : nous avons comme phrases du texte : CS1} C is S2, S2CS3, CS3; les squences S1} S2 et S3 sont toutes membres d'une mme classe d'quivalence S, puisqu'elles apparaissent toutes aprs C. La diff icult vient de cet trange objet qu'est S2CS3. Disons maintenant que toute phrase XjAX2 peut tre transforme en A is Xj : AX2 12; ceci signifie que, si XjAXg se trouve dans le texte, alors A is Xx : AX3 s'y trouve aussi; dans ce cas, nous considrons XXAX2 comme quivalent A is Xx : AX2. Notre trange objet S2CS3 disparat alors : nous le rempla ons par C is S2 et CS3, qui tous deux se retrouvent ailleurs dans le mme texte. On peut continuer dans cette voie jusqu' des transformations qui ne sont pas dj justifies par le texte, pourvu qu'elles ne soient pas en contra diction avec lui. Par exemple, nous trouvons dans le texte les phrases The memorable concerts were recorded in Pardes... The concerts were recor dedfirst on tape. Nous pouvons crire ceci MNRX : NR2 (l'quivalence de Rx et R2 est suppose dmontre un autre endroit du texte), et nous transformerions la premire phrase en N is M : NRr Nous ne prtendons pas par l que notre transformation N is M (The concerts were memorable) figure vraiment dans le texte, ou qu'il n'y ait pas de diffrence stylistique ou autre entre The memorable concerts were recorded in Prades et The 12. Dans les formules comme A is Xt : AX2, le : indique la fin d'une phrase ou d'un segment. (On l'utilise de prfrence au point qui risquerait d'tre confondu avec le point marquant les fins de phrase dans le texte de l'auteur.)

30 concerts were memorable : The concerts (ou They) were recorded in Prades. Tout ce que cette transformation signifie, c'est qu'on considre MNRj^ comme quivalent de N is M : NRj, parce qu'on trouve bien S2GS3 comme quivalent de C is S2 : CS3, en ce sens que tous deux figurent dans le texte modifi. D'une part nous avons limin de notre agencement en tableau la structure de segment spciale MNRX ou S2CS3 spciale parce que les autres segments sont tous de la forme NR ou CS. D'autre part, nous avons dcouvert que M (ou plutt is M) est membre de la classe R. Mais surtout nous avons tabli qu'une phrase peut tre reprsente par deux segments mme si elle ne contient pas deux ensembles des classes d'qui valence voulues. C'est ce qui arrive quand nous pouvons dmontrer qu'une seule classe dans la phrase a ailleurs un rapport indpendant avec deux autres classes ou lments. Cette classe est donc rpte une fois dans chaque segment; et chaque segment marque individuellement le rapport de cette classe avec l'une des deux autres 13. Ces difficults dans la division en segments viennent des rapports que les classes d'quivalence entretiennent les unes avec les autres. Une phrase n'est pas simplement l'occurrence simultane de diffrents mor phmes ou squences; ceux-ci sont gnralement lis, les uns aux autres, par un rapport spcifique, qui peut s'exprimer par un ou plusieurs mor phmes d'ordre : You wrote Paul et Paul wrote you ne diffrent que par l'ordre des morphmes. Si nous trouvons dans notre texte plusieurs seg ments de la forme CS, cela signifie que C est dans un rapport particulier avec S celui de se prsenter avec S, et devant lui. Puisque nous n'op ronspas sur le sens, nous ne savons pas ce que c'est que ce rapport, mais nous prenons soin de reprsenter le mme ordre de morphmes dans la phrase par le mme ordre de classes dans le segment. Quand maintenant nous trouvons S2CS3, nous ne savons pas quel est le rapport entre cet ordre et l'ordre CS, et nous ne pouvons faire aucune comparaison entre les deux phrases. Il faut donc rorganiser ce S2CS3 inconnu, pour qu'il contienne les mmes classes dans le mme ordre que d'autres segments et, bien entendu, nous devons montrer que la forme remanie est qui valente, pour ce texte, la forme originale. Dans la plupart des cas, la seule faon d'y arriver est de diviser la phrase inconnue, au moyen de transformations comme celles que nous avons vues plus haut, en deux ou plusieurs segments, de faon ce que les segments obtenus aient une forme qui se rencontre dans le texte. De cette manire, nous obtenons un grand nombre de segments de structure semblable, mme dans un texte dont les phrases sont trs diffrentes les unes des autres. 13. Nous avons considr ici le cas important de la squence adjectif + nom + verbe, dans laquelle le nom a des rapports indpendants avec l'adjectif et avec le verbe. On peut reprsenter l'adjectif, aussi bien que le verbe, comme prdicat du nom. Nous reviendrons sur cette question au paragraphe 7.3.

31 7.3. Transformations grammaticales. Nous avons vu jusqu'ici comment on peut tudier la structure d'un texte sans faire appel aucune information qui ne soit pas fournie par le texte lui-mme : la procdure directe consiste dresser des classes d'qui valence et dcouvrir des schemes de combinaison de ces classes dans les segments successifs du texte (c'est--dire trouver des combinaisons semblables ou partiellement semblables). On obtient souvent cependant beaucoup de petites classes et de segments qui ne sont pas semblables, parce que les phrases sont si diffrentes les unes des autres; quand c'est le cas, on s'aperoit qu'en comparant les phrases du texte on peut parfois montrer qu'une partie d'une phrase est quivalente (pour ce texte) une partie diffrente d'une autre phrase et, par consquent, qu'elle contient les mmes classes. Ceci dpend du nombre de rptitions que contient le texte. Passons maintenant la possibilit de pousser plus loin dans la mme direction en faisant appel une information extrieure au texte; celle-ci sera de la mme nature que celle que nous avons cherch tablir l'intrieur du texte, c'est--dire qu'elle conservera l'quivalence de parties de phrases (au sens o MNR est quivalent N is M : NR); elle reviendra la mme opration fondamentale, c'est--dire la comparaison de phrases diffrentes. Et elle tendra au mme but : montrer que deux phrases, diffrentes par ailleurs, contiennent la mme combinaison de classes d'quivalence, mme si elles contiennent des combinaisons diff rentes de morphmes. La seule nouveaut, c'est qu'au lieu de comparer deux phrases du texte, nous comparerons une phrase du texte des phrases qui ne sont pas dans le texte. On pourrait penser qu'il s'agit l d'une diffrence capitale et s'inter rogersur la validit de l'application notre texte d'une quivalence ainsi tablie. Nous avons dj rpondu cette objection au paragraphe 3 : si nous pouvons montrer que deux squences sont quivalentes dans toutes les phrases anglaises o elles figurent, alors elles sont quivalentes dans tout texte crit en anglais. Si dans toute phrase anglaise contenant XAY, le XAY est quivalent A is X : AY, alors si nous trouvons S2CS3 dans notre texte anglais nous pouvons dire que S2CS3 quivalent C is S2 : CS3. Mais qu'est-ce que Y quivalence? Deux lments sont quivalents s'ils se trouvent dans le mme environnement l'intrieur de la phrase. Deux phrases d'un texte sont quivalentes simplement si elles se trouvent toutes deux dans ce texte (sauf si on dcouvre des dtails de structure assez fins pour montrer que deux phrases ne sont quivalentes que si elles figurent dans des positions structurelles semblables dans ce texte). De mme, deux phrases d'une langue sont quivalentes si elles se rencontrent toutes deux dans cette langue. En particulier, on dira que des phrases de la forme A sont quivalentes des phrases de la forme B si, pour chaque phrase A, on peut trouver une phrase B contenant les mmes morphmes,

32 mises part les diffrences dues la diffrence de forme entre A et B : par exemple, I^VNa est quivalent N2 is V-en by Nx parce que pour toute phrase comme Casals pldys the cello, on peut trouver une phrase The cello is played by Casals. Nous ne soutenons nullement que deux phrases quivalentes signi fient ncessairement la mme chose, ni qu'elles soient pareilles du point de vue stylistique. Mais par contre nous soutenons que toutes les phrases ne sont pas ainsi quivalentes : la relation d'quivalence n'est pas sans intrt, comme elle le serait si elle existait pour toutes les phrases. Par exemple, NjVN,} n'est pas quivalent Nx is V-en by N2, parce que cette dernire forme se trouve pour certains N et certains N2 (I saw you et / was seen by you), mais pas pour tout Nj^ et tout N2 (on ne trouve pas Casals is played by the cello) u. Nous affirmons de plus que l'application de cette quivalence grammaticale provenant de l'extrieur nous per mettra de dcouvrir dans notre texte des segments semblables supplment aires que nous ne pourrions pas trouver par la simple comparaison des phrases du texte. Ainsi, on peut dmontrer que dans divers environne ments who, he, etc., sont grammaticalement quivalents aux noms qui les prcdent, et que Nx who Vx V2 est quivalent NjVg : N^; dans Casais, who is self-exiled... stopped performing..., il y a deux segments CSX : G is S2; nous aboutirions ce rsultat (sans avoir nous proccuper de savoir si Casals who constitue une occurrence prolonge de C, ou deux occurrences rptes), mme s'il n'y avait pas d'autre occurrence de who dans le texte, c'est--dire mme si l'analyse tait impossible partir du seul texte. L'quivalence grammaticale nous est particulirement utile si nous avons par exemple un grand nombre de segments contenant tous Casais, entremls avec beaucoup d'autres contenant he, et si nous ne pouvons trouver aucun environnement contextuel commun pour dmont rer que Casais et he sont quivalents. Ds que nous acceptons cette quivalence grammaticale, nous pouvons montrer que tous les environne ments de Casais sont quivalents ceux de he; et ceci peut son tour nous permettre de dcouvrir d'autres quivalences partir du texte. On peut explorer plus systmatiquement l'quivalence grammaticale en introduisant une technique de variation exprimentale. Supposons que nous ayons une phrase d'une forme donne A et que nous voulions une forme B; nous essayons de modifier A, le changement consistant un iquement en la diffrence formelle qui existe entre A et B, pour voir ce qui se passe alors en A. Supposons par exemple que nous ayons The memorable concerts were recorded... qui est de la forme MNR, et que nous voulions rendre la forme de cette phrase comparable celle de segments prcdents commenant par N; cette fin, nous cherchons une variante 14. Il est vrai qu'on pourrait soutenir que cette dernire phrase est encore gramm aticale. Mais la grammaire actuelle ne fait pas de distinctions entre les divers membres d'une classe morphologique. Par consquent, l'exigence que la phrase B contienne les mmes morphmes que la phrase A sort de la grammaire, au sens courant de ce terme.

33 de cette phrase qui commence par The concerts; on peut essayer de l'obtenir en plaant un informateur dans une situation sociale authen tique productrice de parole (et non un expos linguistique sur la parole), dans laquelle il noncerait une phrase commenant par The concerts et contenant les mots memorable et recorded 15. Ou bien on peut y arriver par le travail fastidieux de l'observation, en cherchant une phrase qui commence par The concerts et contienne memorable et recorded. Par l'une ou l'autre de ces deux mthodes, nous pourrions obtenir The concerts were memorable and were recorded, ou quelque chose d'approchant 16, qui montrerait que quand M (ou tout autre adjectif) passe de l'autre ct de N (le nom qui le suit), on insre is; MN est quivalent N is M. Nous dcouvrons ainsi que, quand MNR passe une forme qui commence par N, un is apparat entre N et le M qui le suit. Cette technique consistant faire varier la forme grammaticale d'une phrase, tout en gardant constants ses morphmes ne peut pas s'ap pliquer l'intrieur d'un texte; car l, tout ce que nous pouvons faire, c'est tudier le matriau qui nous est donn. Mais on peut l'utiliser pour la langue, hors du texte, car nous avons le droit, en tant que locuteurs, de crer une situation sociale qui pourrait amener un autre locuteur prononcer telle phrase plutt que telle autre parmi toutes les phrases dont il dispose. Cette technique est particulirement utile avec une langue comme l'anglais, o tant de morphmes figurent dans diverses classes grammaticales. Le paragraphe prcdent montre la prcaution essentielle que nous devons prendre quand nous appliquons l'quivalence grammaticale pour toffer les classes d'quivalence contextuelle : nous ne nous posons pas simplement la question : Quelles formes de phrase sont quivalentes MNR? Il peut y en avoir beaucoup. La question que nous nous posons est : Puisque N... est une forme commune dans ce texte, et puisque nous y trouvons aussi MNR, peut-on remplacer cette dernire forme par une phrase quivalente de la forme N...? Le sens du changement oprer n'est pas arbitraire mais vient entirement du texte. Comme prcdem ment, cela revient diviser les phrases en des segments aussi semblables que possible. Tout ce que nous nous demandons, c'est s'il existe une qui valence grammaticale qui relie MNR la forme N...; la rponse est oui, pourvu qu'un is figure dans la forme N...; ce qui son tour fait de is M 15. Pour donner un exemple trs simple, on peut lire en compagnie de l'informateur la phrase du texte The memorable concerts were recorded, puis s'arrter et lui dire de faon hsitante et interrogative That is to say, the concerts (c'est--dire, les concerts...) et attendre qu'il donne la suite. 16. Nous pouvons trouver beaucoup de phrases qui commencent par The concerts et qui contiennent les deux autres mots, par exemple The concerts were not memorable, but were neverthless recorded. Ces phrases contiendront divers mots en plus de ceux de la phrase originelle; mais le seul mot nouveau qui se trouvera dans toutes les phrases de la forme voulue NMR (ou plutt dans une sous-classe des phrases NMR) sera une forme du verbe to be. C'est donc le seul mot nouveau qui soit indispensable quand on opre le changement pour obtenir cette forme.

34 un quivalent de R. Comme ailleurs en linguistique, il ne s'agit pas de donner toutes les phrases n'importe quelle forme choisie arbitrair ement; la mthode permet simplement de dcrire les formes moins frquentes du texte (MNR) en fonction des formes frquentes (N...). Pour l'analyse purement contextuelle, nous n'avons besoin de connatre que les limites des morphmes. Pour utiliser les quivalences grammatic ales, nous devons galement connatre la classe morphophonologique laquelle chaque morphme de notre texte appartient, puisque les rgles grammaticales concernent des classes plutt que des morphmes indivi duels. Dans le cas considr, la rgle grammaticale est : adjectif + noin est quivalent nom + is + adjectif; pour pouvoir l'appliquer notre squence MN, nous devons savoir que le M est un adjectif et que le N est un nom. On a constat empiriquement que le nombre d'quivalences grammat icales auxquelles on fait appel chaque fois pour rduire des phrases d'un texte en des segments semblables, est relativement peu lev. C'est pourquoi, mme si on n'est pas linguiste, on peut apprendre beaucoup sur le texte en utilisant (en plus de la mthode d'analyse interne du texte) une liste prtablie des principales quivalences grammaticales pour la langue en question. Voici quelques-unes des quivalences qui sont frquem ment utilises (nous ne donnons aucune preuve de leur validit, et seul ement quelques indications trs approximatives des environnements de phrase o elles s'appliquent) 17. 1) Si nous trouvons XCY, alors X = Y (X est quivalent Y). Le C est une conjonction comme and, but, or, ou bien, dans certaines circons tances spciales, un syntagme comme as well as, rather than, A-er than. X et Y doivent tre dans la mme classe grammaticale. Par exemple, dans I phoned him but he was out, X et Y sont tous deux de la forme NV; dans I saw it but went on, Y est seulement constitu par le syntagme verbal went on, X ne peut donc inclure que le syntagme verbal saw it (et non toute la squence I saw if). Il s'ensuit que N^CN^ est quivalent deux segments N^ : N2V2 et NV^V-j = NVX : NV2. 2) La squence Nx is N2 indique que Nj_ = N2. La classe de is comprend remains et d'autres verbes. 3) Nj N2, avec un accent primaire sur chaque N, indique que Nx = N2; exemple : The pressure P increases est quivalent The pressure increases et P increases. 4) NV (that) NV = NV : NV; exemple / telegraphed that we'll arrive to-morrow est quivalent I telegraphed : we'll arrive to-morrow. 17. A = adjectif. N = nom, V = verbe, P = prposition. Les indices indiquent des morphmes particuliers, sans tenir compte de leurs classes.

35 5) NjVK^ = NgV*^, V et V* tant respectivement actif et passif ou vice versa. 6) NjPNa = NaP*^; exemple : (they seek) the goal of certainty est quivalent une certaine forme comme (they seek) certainty as a goat. Quand on inverse deux noms la modification des prpositions est bien plus grande que la modification correspondante des verbes : dans le cas des verbes, elle s'effectue simplement par l'addition ou le retrait du morphme de passif et du mot by; dans le cas des prpositions, il faut remplacer une forme par une forme entirement diffrente. Les paires de prpositions quivalentes ne sont pas fixes : entre certains noms, le substitut de of peut tre as; entre d'autres noms, il peut tre with. Nanmoins il est pos sible de trouver des structures dans lesquelles les noms de la squence N2 P N2 sont inverss. 7) Nj P N2 = Ag N1$ autrement dit, le morphme du second nom appar atsous une forme adjectivale avant le premier nom; exemple : training in mdecine et medical training. 8) Des pronoms comme he, et certains mots commenant par whet th-, rptent un nom dj nonc. Quand ils sont prcds de plusieurs noms, quel nom rptent-ils? Cela dpend des dtails de l'environnement grammatical; c'est gnralement le nom qui les prcde immdiatement, ou le dernier nom figurant dans un environnement grammatical comparable. Par exemple, who = the man dans The man who phoned left no name (N who Vx V2 = NV2 : NVj); who = my roommate dans The man spoke to my roommate, who told him to call again (N^Ng who V2 = N^Ng : N2 V2). Il y a de nombreux procds pour dterminer quel est le nom qu'un pronom rpte, et quel verbe va avec chaque nom. Dans the man who phoned, on ne peut pas insrer un sujet avant phoned, il faut donc prendre who comme sujet. Dans The man I phoned was out, nous rduisons d'abord en / phoned : The man was out; ensuite, puisqu'on ne peut pas insrer un complment d'objet aprs phoned dans la phrase originelle, nous faisons de the man le complment d'objet 18 de phoned et nous obtenons l'quiva lent : / phoned the man : The man was out ( 9) NV15 V2-ing = NVj_ : NV2; exemple : They escaped, saving nothing est quivalent They escaped : They saved nothing. 10) NiClNLj VX = IS^VM, : NgVNj. Ici X reprsente une classe d'expressions rciproques comme each other; par exemple : The Giants and the Dodgers each beat the other twice est quivalent The Giants beat the Dodgers twice : The D. beat the G. twice. L'quivalence est quelque peu diffrente pour les diffrents groupes de formes X. 18. La seule faon d'exprimer l'exclusion d'un complment d'objet uniquement en fonction de l'occurrence des lments est de dire que l'objet figure dj. Ce ne peut tre I puisque / est le sujet de phoned, ce doit donc tre l'autre N, the man.

36 11) ANV = N is A : NV, cf. l'exemple the self-exiled Casals... du para graphe 7.2. De mme NVANj = NVNj who is A = NVNX : Nt is A; exemple : They read the interdicted books = They read the books which were interdicted They read the books : The bocks were interdicted. 12) NjVKjPNg = NjVNa : N^VPNg; c'est--dire qu'on peut remplac er un double complment d'objet par deux complments d'objet dis tincts dans deux segments qui rptent le sujet et le verbe; exemple : / bought it for you = I bought it : I bought for you. Ces quivalences grammaticales conservent les morphmes et leurs rapports grammaticaux, mais sous une autre forme grammaticale. On ne peut avoir NjVNa = NgVNj, parce que cela modifierait le rapport sujet-objet avec le verbe; mais on peut avoir N2V*NX comme quivalent de NjVNa parce que l le verbe aussi est modifi de faon ce que soit prserv son rapport grammatical avec les noms inverss. II est absolu mentessentiel de prserver les rapports grammaticaux, car ces rapports existent toujours entre les morphmes d'une phrase. Autrement dit, il y a des restrictions de commutabilit d'ordre et d'intonation entre les diff rents morphmes (ou classes de morphmes) d'une phrase et, quand nous passons d'une phrase une phrase quivalente, nous voulons pouvoir retrouver les mmes restrictions quand nous reviendrons la phrase de base puisque cette phrase de base, comme toute phrase, se dfinit par les restrictions qui lient ses diffrentes parties. Par consquent, quand nous divisons une phrase en diffrents segments pour dresser un tableau, nous ne voulons pas que deux combinaisons des mmes classes d'quivalence (par exemple les deux premires combinaisons TE ci-dessus) reprsentent des rapports grammaticaux diffrents. C'est pourquoi, quand nous trans formons une phrase qui contient certaines classes d'quivalence, nous prenons soin de conserver leurs rapports grammaticaux originels. Cependant, nous trouvons quelquefois des morceaux de phrase qui ne contiennent aucune de nos classes d'quivalence; autrement dit (dans le cas le plus simple), ils ne contiennent aucun matriau qui se retrouve ailleurs dans le texte. Le rapport grammatical entre les morceaux uniques et le reste de la phrase doit tre conserv dans notre disposition en tableau, au mme titre que celui des morceaux rcurrents. Mais nous n'avons pas nous proccuper de conserver leur rapport quand leur position relative change, puisque nous n'avons pas de raison de changer leur position relative : c'est seulement les classes d'quivalences que nous voulons redisposer. Pour ce matriau non rcurrent, nous voulons seulement connatre son rapport aux classes d'quivalence et indiquer ce rap port dans l'analyse. L'tude du texte seul ne suffira peut-tre pas, mais nous pouvons y arriver en faisant appel aux donnes grammaticales ou la variation exprimentale. Revenons par exemple aux squences Casais, who is self-exiled from Spain et the self -exiled Casals... Si cette dernire orme est S2 C, la premire est C, C is S2 from Spain; puisque from Spain

37 est unique, tout ce que nous voulons savoir, c'est o le mettre quand nous disposons nos classes d'quivalence, autrement dit, quel est son rapport ces classes. La grammaire nous apprend que dans des phrases de la forme NV APN l'unit minimale, dont PN est un constituant immdiat, est APN et que ce APN peut tre remplac par A tout seul 19. Par consquent, si le A se trouve tre membre d'une de nos classes d'quivalence alors que le PN ne l'est pas, nous associons le PN A dans sa colonne d'quivalence en crivant APN au lieu de A tout seul comme membre de la classe. De faon plus gnrale, le matriau qui n'appartient aucune classe d'quivalence, mais qui est li grammaticalement un membre d'une classe, est joint ce membre pour former un membre largi de la classe en ques tion; ainsi self-exiled from Spain est maintenant dans la mme classe que sef-exiled. Ceci se justifie par le fait que, puisque ce matriau ne se retrouve nulle part ailleurs dans le texte (ou ne s'y retrouve que dans le mme rap port grammatical la mme classe d'quivalence), son seul effet, quand on reprsente le texte par ses classes d'quivalence spcifiques, est prcis ment son rapport au membre spcifique auquel il est grammaticalement li. On rencontre un cas particulier assez intressant quand deux membres de la mme classe d'quivalence constituent conjointement l'unit imm diatement suprieure de leur phrase (c'est--dire quand ils sont les consti tuants immdiats de cette unit), quand, par exemple, ces deux membres sont un adjectif suivi d'un nom, avec AN = N. Dans ce cas, nous pouvons considrer que ces membres constituent eux deux un seul membre de leur classe commune et entrent tous deux dans un seul segment. Si nous les considrions comme deux occurrences de leur classe commune, il nous faudrait mettre chaque occurrence dans un segment distinct. Les donnes grammaticales sont particulirement utiles quand il s'agit de reconnatre les particules conjonctives. Il est facile d'identifier ces morphmes partir de la grammaire formelle, tout fait indpendam ment de leur sens, mais il peut tre difficile de les identifier dans l'ana lysepurement contextuelle. Leur importance rside dans le fait que beau coup de phrases d'un texte peuvent contenir les mmes classes, part quelques mots non classs, souvent situs au dbut, dont la fonction gram maticale est de lier ou d'introduire les phrases, et qui n'entrent pas dans les classes spcifiques qui couvrent la phrase ou le segment. Dans notre disposition en tableau, nous mettrons ces lments, en raison de leur posi tion grammaticale, dans une colonne spciale au dbut. Nous pouvons mme aller plus loin et mettre dans cette premire colonne tout matriau qu'on ne peut faire entrer dans aucune des colonnes d'quivalence. Ce matriau conjonctif n'est pas toujours immdiatement vident; remar quons qu'on peut analyser beaucoup de phrases de la forme JVV that N1V1 comme constitues des classes d'quivalence N^, le NV that tant relgu dans la premire colonne; par exemple dans la phrase We are proud 19. Smantiquement, on dira que PN modifie le A.

38 that these concerts were recorded by our engineers, les membres connus des classes d'quivalence sont concerts et recorded; les mots qui les prcdent ne se retrouvent pas dans le texte et ne sont lis grammaticalement aucun membre d'une classe; bien au contraire, du point de vue grammatical on peut les remplacer par des adverbes introductifs comme indeed, mme si au sens purement grammatical ils sont en fait le sujet et le verbe princ ipaux de la phrase. En plus des rapports grammaticaux des classes grammaticales tout entires, on peut utiliser des informations concernant le rapport entre des morphmes spcifiques ou des sous-classes grammaticales et les classes grammaticales; on peut par exemple tablir que (dans certaines langues) les verbes intransitifs forment une sous-classe qui ne se trouve jamais accompagne d'un objet et qui est quivalente un verbe transitif accom pagn d'un objet. Dans un texte donn, cela peut nous permettre de mettre un verbe transitif et son objet dans la mme classe qu'un verbe intransitif ayant une position comparable. Enfin un grand nombre d'quivalences dtailles s'appliquent des morphmes spcifiques. Les renseignements concernant ces quivalences ne nous sont pas fournis par la linguistique descriptive, qui traite gn ralement de classes entires, mais on peut les obtenir par des mthodes linguistiques puisqu'ils concernent des occurrences couples et des restric tions spciales bien que dans la plupart des cas il soit ncessaire d'tu dier ces restrictions en considrant plus d'une phrase la fois. Supposons, par exemple, que nous trouvions les mots buy et sell dans un texte. Leurs environnsments dans ce texte peuvent ne pas se ressembler assez pour nous permettre de les ranger dans la mme classe d'quivalence, en dpit des avantages que cela pourrait avoir pour l'analyse. Mais si nous examinons un certain nombre d'autres textes assez courts o ces deux mots figurent, nous constaterons qu'ils apparaissent souvent dans des environnements qui se correspondent et que, certains gards, ce sont des inverses distributionnels; autrement dit, nous trouvons de nombreuses phrases comme N-t buys from N2 : N2 sells to Nt (I bought it from him at the best price I could get, but he still sold it to me with a profit). Si les environnements de buy et sell dans notre texte sont semblables aux environnements coupls des autres textes, nous pourrons quand mme, en considration de ces rsul tatsplus gnraux, mettre les deux mots dans la mme classe d'quival ence, ou mme les analyser comme tant inverses l'un de l'autre. De cette faon on peut mettre dans une mme classe contextuelle plus de mots qu'il ne serait possible autrement, et on peut faire usage de ce qui parat tre des liaisons smantiques spciales entre des mots (comme entre buy et sell ou mme entre un verbe transitif et la prsence d'un complment d'objet), sans sortir du cadre d'une tude purement formelle des occurrences. La raison en est qu'il y a un haut degr de corrlation entre les diffrences de sens et les diffrences de distribution linguistique; et si, dans les limites d'un texte, on ne peut pas montrer les similitudes

39 de distribution entre deux mots lis, on peut souvent y arriver dans un plus grand choix de textes, mme trs courts. Nous n'avons fait qu'esquisser ici, avec quelques rares exemples, le genre d'information extrieure qu'on peut utiliser, la fois parce que le domaine est vaste et parce qu'il y a encore beaucoup faire. Des travaux plus approfondis dans ce sens, non seulement seront utiles l'analyse de discours, mais constitueront galement une extension intressante de la linguistique descriptive. Rsultats 8. Le tableau a double entre. L'analyse du discours nous donne une succession de segments conte nant chacun certaines classes d'quivalence. Pour les disposer en tableau20, nous crivons les segments les uns au-dessous des autres dans l'ordre du texte, les membres successifs de chaque classe formant une colonne comme au paragraphe 5.4., ce qui donne pour le texte trs court du para graphe 7.2. : CS2 (S2 aprs C est is S2) CS2 (= S2 G sans le is) CS (= MN; R^, = is N) NR2 Les ranges indiquent les classes d'quivalence prsentes dans chaque segment, selon leur ordre (ou un autre rapport) l'intrieur du segment; les colonnes indiquent les membres spcifiques de chaque classe prsents dans les segments successifs. Le matriau qui ne rentre dans aucune classe d'quivalence, mais qui est li grammaticalement un membre spci fique d'une classe entre avec ce membre dans sa colonne, ainsi in Spain est compris dans le premier S2. Le matriau qui ne rentre dans aucune classe d'quivalence et qui n'est pas li grammaticalement un membre spcifique d'une classe entre dans une colonne spciale au dbut (ici non reprsente), qui se rvlera contenir des morphmes qui lient les phrases 20. Le tableau donn ici reprsente les phrases suivantes, extraites d'une chro nique concernant des disques rcemment sortis : Casals, who is self-exiled from Spain, stopped performing after the fascist victory... The self-exiled Casals is waiting across the Pyrenees for the fall of Franco... The memorable concerts were recorded in trades... The concerts were recorded first on tape. (Les autres phrases analyses en 7.2. ont t inventes par moi des fins de comparaison.) Ces phrases ne constituent pas un fragment continu du texte, ce qui limite trs srieusement la pertinence du tableau double entre; mais cela n'a pas d'importance ici, puisque ce tableau sert seulement illustrer l'orga nisation de ces dispositions.

40 ou les segments entre eux, ou indiquent un changement dans plusieurs classes d'un unique segment. Cette disposition en tableau donne donc du texte originel une dimension une reprsentation deux dimensions, dans laquelle chaque lment a deux coordonnes : l'une horizontale, par rapport aux autres lments du segment auquel il appartient; l'autre Verticale, par rapport aux autres membres de sa classe. On peut considrer que ce tableau double entre reprsente le texte tout entier, puisque tous les morphmes du texte appartiennent une classe ou une autre du tableau et puisque celui-ci conserve les rapports entre les morphmes. Mme quand on a effectu de nombreuses transformations contextuelles et grammaticales, les classes et leurs membres sont dfinis chaque tape de manire ce qu'on puisse toujours reproduire le texte en partant du tableau et de la dfinition complte des classes qu'il contient. Il se peut que les segments du tableau, considrs sparment, ne soient pas idiomatiques , c'est--dire qu'ils ne figure raient pas de faon naturelle dans la parole; mais la mthode n'exige pas qu'on prserve la langue idiomatique : tout ce que nous Voulons, c'est que la succession des segments soit quivalente contextuellement et grammaticalement au texte original. Mme si le tableau suggre une cr itique littraire ou une amlioration possible du texte, il n'est pas destin remplacer l'original. On peut aussi considrer que ce tableau double entre indique les rapports purement distributionnels qu'entretiennent les classes d'qui valence qui s'y trouvent. En se plaant ce point de Vue, on peut tra vailler sur l'agencement en tableau, et examiner ses proprits. On peut trouver des moyens de simplifier le tableau, en retirant par exemple les lments communs, ou en rassemblant des groupes de squences quival entes plus importants que ceux utiliss dans la confection du tableau. On peut apprendre traiter diffrents cas particuliers, comme par exemple une classe mobile qui entre dans un rapport troit tantt avec une classe, tantt avec une autre, ou qui figure un nombre diffrent de fois dans divers segments. On peut essayer de rgulariser ou de normaliser le tableau en harmonisant tous les segments, pour tablir un unique se gment normal auquel on pourra comparer tous les segments rels : par exemple, tant donn un segment o une des classes ne figure pas, on peut essayer de le transformer en un segment contenant toutes les classes (en prservant l'quivalence au cours de la transformation). On peut essayer de formuler une rgle gnrale couvrant les modifications subies par les membres successifs d'une classe en descendant une colonne, pour tenter d' expliquer ou de prdire la forme spcifique prise par les classes de chaque segment c'est--dire pour driver les segments suc cessifs partir de la forme normale. Toutes ces oprations sur le tableau ont pour effet d'isoler les lments indpendants les plus gnraux partir desquels on peut dcrire le texte (en dernire analyse les axes horizontal et Vertical), et de faire ressortir

41 les rapports qu'ils entretiennent dans le texte. En ce sens, toutes ces op rations ne sont que des raffinements de nos procdures initiales. 9. Rsultats. On peut tirer diverses conclusions sur un texte particulier (ou un certain type de texte) en tudiant les proprits de son tableau double entre, directement ou sous forme simplifie. On aurait sans doute pu arriver beaucoup de ces conclusions intuitivement et sans cette analyse formelle, mais l'intuition donne des rsultats qui ne sont ni explicites ni rigoureux. De plus, certains gards, la complexit et la masse du matr iau nous mettent dans l'impossibilit de tirer toutes les conclusions pertinentes sans une analyse formelle et minutieuse. Les textes que nous avons t amens choisir ici titre d'chantillon sont trop courts et trop simples pour montrer quel genre de conclusions l'analyse donne sur un texte ou un style particulier nous rserverons ceci pour une prsen tation ultrieure d'un chantillon plus long, bien que seule l'analyse de trs nombreux discours puisse montrer les dtails de la mthode et la gamme de conclusions auxquelles elle permet d'aboutir. Pour donner une petite ide de ces conclusions, nous allons achever l'analyse de notre pre mier texte (paragraphe 6). L'analyse en tait reste ceci : P a comme membres Millions, Four out of five people in a nation wide survey, You too wilt, (and) your whole family will. W a comme membres Can't be wrong, Prefer X- to any hair tonic... 've used. Quatre des phrases, y compris le titre, sont reprsentes par cinq segments PW. Arriv l, on peut difficilement continuer sans avoir recours l'qu ivalence grammaticale (cf. 10 n). Dans four out of fwe... say they prefer... nous avons P et W mais aVec say they entre les deux. Si notre texte se trouvait contenir they et four out of five dans des environnements quival ents, nous pourrions analyser directement cette phrase. Comme ce n'est pas le cas, nous faisons appel l'quivalence grammaticale de they au nom qui le prcde et qui est situ de faon comparable : four out of five..., sujet de say, parallle they, sujet de prefer. Nous mettons donc they dans la mme classe P que four out of five... La phrase devient alors P say PW, qui se dcompose en deux segments P say : PW, par applica tion de la formule NV (that) NV = NV : NV; par consquent, say est membre de W, puisque, la suite deP, il forme avec Pun segment complet. Venons-en maintenant la, dernire phrase : You too will be satisfied. Nous savons que la premire partie est membre de P; donc be satisfied est inclus dans W. Ceci nous donne un point de dpart pour l'analyse de la phrase prc dente Every year, we sell more bottles of X- to satisfied consumers. Grammat icalement, X- to satisfied consumers est X- to AN, qui est quivalent X- to N : N is A. Nous obtenons ainsi un segment consumers are satisfied;

42 et puisque la seconde partie de ce segment est W, nous mettons consumers dans P. Le reste de la phrase contient de nouvelles classes : puisque bottles se retrouve ailleurs dans le texte, nous le considrons comme reprsen tant une classe possible d'quivalence, et nous le notons B; cette occur rence de B nous associons le mot more, qui ne se retrouve pas ailleurs et qui est li grammaticalement bottles. Puisque sell se retrouve dans sold (== sell + morphme de passif), nous le notons S et nous lui associons every year, qui lui est li grammaticalement. (Every year n'est semblable que par un morphme since... years ago de la premire phrase; plutt que d'essayer de faire entrer ces syntagmes dans de nouvelles classes d'quivalence, nous remarquons que chacun d'eux est li au membre de S qui lui est proche, et nous associons chaque syntagme son membre de S). Il reste we, qui, grammaticalement, ne fait partie ni du syntagme B ni du syntagme S; en dpit du fait qu'il ne parat pas se retrouver ailleurs, nous le mettons, titre d'essai, dans une nouvelle classe /. (Nous Verrons plus loin qu'on peut considrer qu'il y a une forme zro de / dans la pre mire phrase.) Nous obtenons ainsi ISB to P; ce qu'on peut encore simp lifier, puisque c'est grammaticalement quivalent ISB : IS to P. Enfin, il y a la premire phrase : Millions of consumer bottles of Xhave been sold since its introduction a few years ago. Si nous prenons comme point de dpart Millions, membre reconnu de P, nous nous trouvons en face d'un reste, commenant par of, que nous ne pouvons pas analyser. Rapprochons plutt bottles of X- have been sold de we sell bottles of X-. La premire squence est de la forme NXV, la seconde de la forme N^V^. Grammaticalement, have been sold est sell + pass + pass if; donc, si nous prenons sell comme V, been sold est V*. Grammatica lement aussi, V + passif + by N est quivalent V + passif (is sold by us = is sold). L'absence de tout by us aprs sold ne nous empche donc pas de rapprocher les deux propositions; de we sell bottles (N2VNX) nous rapprochons bottles have been sold (NjV* = N V*IV2); nous pouvons mme dire que le morphme de passif, suivi ou non de 1' agent (by + N), est quivalent au sujet du verbe actif (c'est--dire le verbe sans le mor phme de passif). Si we sell bottles of X- est ISB, alors bottles of X- have been sold est l'quivalent BS*I avec / zro. Nous associons au S* qui le prcde le morceau since... years ago, comme faisant aussi partie du mor phme de pass, puisque ni l'un ni l'autre ne se retrouve ailleurs dans nos classes d'quivalence. Millions et consumer sont tous deux membres de P 21, mais il n'y a pas moyen de tirer parti de ce fait. Grammaticale ment, consumer bottles est N^N^ = 2N, et millions of N2 est N3PN2= AT2; ainsi toute la squence est lie grammaticalement bottles (de la mme faon que more tait li bottles, cf. plus haut), ce qui laisse la phrase 21. Nous avons consumer dans P; et puisque la distinction singulier-pluriel ne figure pas dans nos classes, nous pouvons lier la chute du -s l'occurrence de consumers dans la premire phrase. En enlevant le s de l'lment P consumers, nous obtenons une forme P consumer pour la phrase.

43 sous la forme BS*I. Ceci signifie qu'il y a deux occurrences de mots P qui se perdent par l'inclusion dans une occurrence de B. Ce millions et ce consumer n'ont pas d'autre rapport distributionnel avec une autre occurrence de classe dans le texte (sauf leur analogie more); il n'y a donc pas moyen de les faire entrer dans le tableau double entre. Les mmes morphmes se retrouvent bien ailleurs comme membres de P, mais dans des rapports diffrents avec d'autres classes. Ceci met en vidence le rapport trompeur entre le titre et la premire phrase. Si nous prenons le titre comme point de dpart, nous trouvons Millions dans la premire phrase et, en nous fondant sur notre analyse du titre, nous le mettons dans la classe P, pour nous apercevoir alors qu'il n'y a pas de classe P dans l'analyse finale de la phrase. (Les millions qui ne peuvent se tromper se rvlent tre des bouteilles 22.) Si nous commenons par le slogan lui-mme, nous avons une classe P (four out of five; you) qui est lie W, et une classe B (bottles, millions of. ..bottles) qui est lie S; et si nous en venons alors au titre, nous trouvons que le W est prcd non par un membre connu de P, ni par un mot nouveau que nous pourrions ranger dans P, mais par un mot qui ailleurs a t associ un membre de B. (Les bouteilles se rvlent tre des gens.) Voil le rsultat formel obtenu, qui est parallle ce qu'on aurait pu dire comme critique smantique savoir que le texte du slogan (des millions de bouteilles vendues tant de gens ne peuvent pas avoir tort de pr frer X-) ne rpond pas au titre (des millions ne peuvent pas avoir tort). Le tableau double entre du slogan ne prsente pas grand intrt en lui-mme : PW BS*I Millions of people can't be wrong! (le B contenant le pseudo P) Millions of consumer bottles... have been sold... CPW And four out of five people... say PW they prefer X-... P Four out of five people... can't be wrong. PW you too will prefer X~... PW your whole family wilt prefer X-... BS*I (= ISB) Every year we sell more bottles of XS*I to P we sell to consumers PW You too will be satisfied! 10. Interprtations. Les rsultats formels obtenus par ce genre d'analyse font plus que dfinir la distribution des classes, la structure des segments ou mme la 22. Puisque millions of consumers serait un syntagme anglais courant (Pt of P2 = P2), l'emploi de la squence presque identique millions of consumer devant bottles a pour effet de donner une premire impression que la phrase parle de P; mais quand on atteint le mot bottles on voit que le sujet de la phrase est B, les mots P n'tant qu'adj ectifs de B.

u distribution des types de segments. Ils peuvent aussi rvler des parti cularits l'intrieur de la structure, par rapport au reste de la structure. Ils peuvent montrer en quoi certaines structures ressemblent d'autres, ou en quoi elles en diffrent. Ils peuvent conduire de nombreuses conclu sionsconcernant le texte. Tout ceci cependant est encore distinct de Y interprtation des rsul tats, qui doit tenir compte du sens des morphmes et poser la question de savoir ce que l'auteur Voulait faire quand il a crit ce texte. Cette inter prtation est bien entendu tout fait distincte des rsultats formels, bien qu'elle puissse les suivre troitement dans les voies qu'ils ouvrent. Mme les rsultats formels peuvent conduire des conclusions d'un intrt plus gnral et qui dpassent le texte. L'examen de divers types de structure d'nonc peut mettre en vidence des corrlations avec la personne ou la situation qui est l'origine du texte, sans la moindre rf rence aux significations des morphmes. Il peut aussi montrer quelles sont les faiblesses d'un point de vue donn inhrentes un certain type de structure et quelles sont celles que l'on peut supprimer. Il peut rvler la prsence des mmes types de structure dans des textes diffrents, et il peut peut-tre montrer les avantages de types particuliers de structure pour des textes futurs ou pour du matriau non linguistique. Enfin cet examen remplit la fonction importante d'indiquer quels segments supplmentaires peuvent tre ajouts au texte sans en changer la structure. Il est souvent possible de montrer que si nous ajoutons aux diffrentes combinaisons de classes que nous trouvons dans les segments du texte, des segments contenant certaines combinaisons nouvelles de classes, la description de la structure d'nonc devient plus simple et les exceptions disparaissent (pourvu que nous gardions intactes les excep tions intrinsques, comme par exemple les conditions de dlimitation). L'addition de ces segments peut rendre le texte plus rgulier du point de vue de l'analyse du discours. Si, par exemple, le texte contient AB : AG : ZB, on peut dire que Z est quivalent au second degr A, puisque tous deux se rencontrent devant B, mais A seulement se rencontre devant C. S'il n'y a pas d'exceptions intrinsques au texte qui affectent cette restriction concernant Z, on peut ajouter le segment ZC au texte. Dans ce texte aug ment, l'quivalence A = Z est maintenant une question de parfaite commutabilit dans une gamme identique d'environnements, et non plus seulement le rsultat secondaire d'une chane d'quivalences. L'addition de ces segments ne ressemble en rien l'addition au texte de segments arbitraires. Cette recherche des segments que l'on peut ajouter devient particulirement intressante si l'on Veut savoir ce qui est impliqu mais n'est pas explicitement formul dans un texte donn, ou si l'on veut voir ce que l'on peut tirer d'un texte donn en plus de ce que l'auteur y a dj mis.

45 RSUM. L'analyse du discours effectue les oprations suivantes sur tout texte suivi, considr individuellement. Elle rassemble les lments (ou squences d'lments) dont les environnements l'intrieur d'une phrase sont iden tiques ou quivalents, et les considre comme quivalents entre eux (c'est--dire, membres de la mme classe d'quivalence). Le matriau qui n'appartient aucune classe d'quivalence est associ au membre (d'une classe) avec lequel son rapport grammatical est le plus troit. On divise les phrases du texte en segments, constitus chacun d'une succession de classes d'quivalence, de faon ce que chaque segment obtenu soit aussi semblable que possible, par des classes qui le composent, aux autres se gments du texte. On examine alors la succession des segments pour reprer la distribution des classes qu'elle offre et, en particulier, pour reprer des schmas d'occurrence de classes. Ces oprations ne font appel aucune connaissance concernant le sens des morphmes, l'intention de l'auteur, ou sa situation. Elles n'exigent que la connaissance de la limite des morphmes, y compris les junctures de phrase et autres intonations morphologiques (ou ponctuation). L'applica tion de ces oprations peut tre renforce par l'utilisation des quivalences grammaticales (ou rapports d'occurrence de morphmes individuels), tires de toute la langue ou du corps linguistique dont le texte en question fait partie. Dans ce cas, il est ncessaire de connatre les classes grammat icales des diffrents morphmes du texte. L'analyse du discours donne une foule de renseignements sur la struc ture d'un texte ou d'un type de texte, ou sur le rle de chaque lment dans cette structure. La linguistique descriptive, elle, ne dcrit que le rle de chaque lment dans la structure de la phrase qui le contient. L'analyse du discours nous apprend, de plus, comment un discours peut tre bti pour satisfaire diverses spcifications, exactement comme la linguistique descriptive construit des raisonnements raffins sur les faons dont les systmes linguistiques peuvent tre btis pour satisfaire diverses spcifications. L'analyse du discours donne aussi des renseignements sur des fragments de discours plus longs que la phrase; ainsi, il se rvle qu'il y a des rapports entre les phrases successives, mais que ces rapports ne sont pas visibles dans la structure de phrase (en termes de ce qui est sujet et ce qui est prdicat, etc.), mais le sont dans le scheme d'occurrence des classes d'quivalence dans les phrases successives. Traduit par Franoise Dubois-Charlier Paris.

Vous aimerez peut-être aussi