Vous êtes sur la page 1sur 40

Langages

Analyse du discours
Zellig Sabbettai Harris, Mme Françoise Dubois-Charlier

Citer ce document / Cite this document :

Harris Zellig Sabbettai, Dubois-Charlier Françoise. Analyse du discours. In: Langages, 4ᵉ année, n°13, 1969. L'analyse du
discours. pp. 8-45;

doi : https://doi.org/10.3406/lgge.1969.2507

https://www.persee.fr/doc/lgge_0458-726x_1969_num_4_13_2507

Fichier pdf généré le 02/05/2018


Résumé
L'analyse du discours effectue les opérations suivantes sur tout texte suivi, considéré individuellement.
Elle rassemble les éléments (ou séquences d'éléments) dont les environnements à l'intérieur d'une
phrase sont identiques ou équivalents, et les considère comme équivalents entre eux (c'est-à-dire,
membres de la même classe d'équivalence). Le matériau qui n'appartient à aucune classe
d'équivalence est associé au membre (d'une classe) avec lequel son rapport grammatical est le plus
étroit. On divise les phrases du texte en segments, constitués chacun d'une succession de classes
d'équivalence, de façon à ce que chaque segment obtenu soit aussi semblable que possible, par des
classes qui le composent, aux autres segments du texte. On examine alors la succession des
segments pour repérer la distribution des classes qu'elle offre et, en particulier, pour repérer des
schémas d'occurrence de classes.
Ces opérations ne font appel à aucune connaissance concernant le sens des morphèmes, l'intention
de l'auteur, ou sa situation. Elles n'exigent que la connaissance de la limite des morphèmes, y compris
les junctures de phrase et autres intonations morphologiques (ou ponctuation). L'application de ces
opérations peut être renforcée par l'utilisation des équivalences grammaticales (ou rapports
d'occurrence de morphèmes individuels), tirées de toute la langue ou du corps linguistique dont le texte
en question fait partie. Dans ce cas, il est nécessaire de connaître les classes grammaticales des
différents morphèmes du texte.
L'analyse du discours donne une foule de renseignements sur la structure d'un texte ou d'un type de
texte, ou sur le rôle de chaque élément dans cette structure. La linguistique descriptive, elle, ne décrit
que le rôle de chaque élément dans la structure de la phrase qui le contient. L'analyse du discours
nous apprend, de plus, comment un discours peut être bâti pour satisfaire à diverses spécifications,
exactement comme la linguistique descriptive construit des raisonnements raffinés sur les façons dont
les systèmes linguistiques peuvent être bâtis pour satisfaire à diverses spécifications. L'analyse du
discours donne aussi des renseignements sur des fragments de discours plus longs que la phrase;
ainsi, il se révèle qu'il y a des rapports entre les phrases successives, mais que ces rapports ne sont
pas visibles dans la structure de phrase (en termes de ce qui est sujet et ce qui est prédicat, etc.), mais
le sont dans le scheme d'occurrence des classes d'équivalence dans les phrases successives.
ZELLIG S. HARRIS
Université de Pennsylvanie

ANALYSE DU DISCOURS *

Cet article présente une méthode d'analyse de l'énoncé suivi (écrit


ou oral) que nous appellerons discours 1. C'est une méthode formelle qui
ne se fonde que sur l'occurrence des morphèmes en tant qu'éléments iso-
lables; elle ne dépend pas de la connaissance que le linguiste qui analyse
peut avoir du sens spécifique de chaque morphème, et elle ne nous apprend
rien de nouveau sur le sens particulier de chacun des morphèmes qui
figurent dans le discours en question. Mais ceci ne signifie nullement que
nous ne puissions pas découvrir autre chose que la manière dont la
grammaire de la langue s'illustre dans ce discours. Car, bien que nous usions de
procédures formelles, proches de celles de la linguistique descriptive,
nous pouvons obtenir sur le texte étudié des renseignements que cette
dernière ne fournissait pas.
Cette information supplémentaire provient d'un fait fondamental :
l'analyse de l'occurrence des éléments dans le texte n'est faite qu'en
fonction de ce texte particulier; c'est-à-dire en fonction des autres éléments
de ce même texte et non en fonction de ce qui existe ailleurs dans la langue.
En conséquence, nous repérons les corrélations spécifiques des morphèmes
du texte tels qu'ils se présentent dans ce texte et, ce faisant, nous
découvrons quelque chose de sa structure, de ce qui s'y passe. Il se peut que
nous ne sachions pas exactement ce que le texte dit, mais nous pouvons
déterminer comment il le dit — ce que sont les schemes de récurrence des
principaux morphèmes qui le forment.
* Cet article est paru en anglais dans Language, vol. 28, 1952, pp. 1-30. Nous
remercions M. Z. Harris et la Société de Linguistique d'Amérique qui nous ont autorisés à le
publier en français.
1. J'ai le plaisir de remercier ici de leur collaboration trois hommes qui m'ont aidé
dans la mise au point de la méthode et dans l'analyse de divers textes : Fred Lukoff,
Noam Chomsky et A. F. Brown. Les recherches antérieures dans la perspective de cette
méthode avaient été présentées par Lukoff dans Preliminary analysis of the linguistic
structure of extented discourse (University of Pennsylvania Library [1948]). Une analyse
détaillée d'un texte-échantillon a paru dans « Discourse analysis : a sample text » de
Z. Harris, Language, vol. 28, n° 4, 1952, p. 474.
9

On peut déterminer des schemes définis pour des textes donnés, pour
des individus, des styles ou des thèmes donnés. Dans certains cas on peut
tirer des conclusions formelles du scheme spécifique de distribution des
morphèmes dans un texte. Et il est souvent possible de mettre en évidence
des différences de structure régulières entre les discours tenus par des
personnes différentes, ou dans des styles ou sur des thèmes différents.

Préliminaires

1. — Le problème.

On peut envisager l'analyse du discours à partir de deux types de


problèmes qui, en fait, sont liés. Le premier concerne le prolongement de
la linguistique descriptive au-delà des limites d'une seule phrase à la fois.
Le second concerne les rapports entre la « culture » et la langue (c'est-à-dire
entre le comportement non-verbal et le comportement verbal).
Le premier problème se pose parce que la linguistique descriptive
s'arrête généralement aux limites de la phrase. Ceci ne résulte pas d'une
décision a priori, car les techniques linguistiques ont été élaborées pour
permettre d'étudier tout énoncé, quelle qu'en soit la longueur; mais il se
trouve que, dans toutes les langues, presque tous les résultats obtenus
concernent un type d'énoncé relativement court qu'on peut appeler phrase.
Autrement dit, quand on établit une interdépendance dans l'occurrence
de deux éléments A et B, il se trouve presque toujours que ces deux
éléments sont considérés comme se présentant dans une même phrase. On
peut dire, par exemple, que les adjectifs anglais se trouvent avant le nom
ou après certains verbes (dans la même phrase) : the dark clouds, the future
seems bright, mais il est rare que nous puissions établir des
interdépendances qui dépassent les limites de la phrase, par exemple si le verbe
principal d'une phrase a tel suffixe de temps, le verbe principal de la
phrase suivante aura tel autre suffixe de temps. Nous ne pouvons pas dire
que, si une phrase est; de la forme NV, la suivante sera de la forme N.
Tout ce que nous pouvons dire, c'est que la plupart des phrases sont de
la forme NV, que quelques-unes sont de la forme N, etc., et que ces
structures figurent dans diverses séquences.
C'est ainsi que la linguistique descriptive, partie pour décrire les
occurrences d'éléments dans tout énoncé quelle qu'en soit la longueur,
les décrit finalement surtout en fonction des autres éléments de la même
phrase. On ne s'est pas trop inquiété de cette limitation, parce qu'elle
n'a pas empêché l'élaboration de grammaires adéquates : la grammaire
expose la structure des phrases; le locuteur construit chaque phrase
particulière conformément à cette structure et produit sa propre séquence
de phrases.
L'autre problème, celui des rapports entre le comportement (ou
10

situation sociale) et la langue, a toujours été considéré comme


extralinguistique. La linguistique descriptive ne se préoccupe pas du sens des
morphèmes et, bien qu'on puisse essayer de tourner la difficulté en parlant,
non de sens, mais de la situation sociale et intersubjective dans laquelle
l'énoncé est produit, la linguistique descriptive n'est pas armée pour tenir
compte de la situation sociale : elle peut seulement définir l'occurrence
d'un élément linguistique en fonction de l'occurrence d'autres éléments
linguistiques. Les études menées sur les rapports entre la « culture » et la
langue n'ont donc pas pu bénéficier des travaux distributionnels récents.
Il ne faut
pas traiter
Ainsi, elles font l'inventaire des sens exprimés dans la langue en étudiant
les mots le stock lexical; ou elles tirent des conclusions du fait que, dans une
« épopée » certaine langue, un certain groupe de sens s'exprime par le même morphème;
et « roman » ou elles discutent des nuances de sens et d'emploi d'un mot en le
comme le
soccurrence rapprochant d'autres (par exemple en stylistique). Elles ont aussi souligné
s d’un stock certains points comme le fait qu'il faut considérer le sens global des syn-
lexical. tagmes et non la somme des sens des morphèmes qui les constituent :
ainsi « How are you? » est une formule de politesse plutôt qu'une question
sur la santé de l'interlocuteur. Cet exemple illustre bien la corrélation
entre le discours et la situation sociale. De même on a étudié des
caractéristiques de la personnalité dans l'énoncé en rapprochant les traits
linguistiques récurrents d'un individu avec des traits récurrents de son
comportement et de sa sensibilité 2.

2. — Distribution a l'intérieur du discours.

L'analyse distributionnelle ou combinatoire à l'intérieur d'un


discours considéré comme un tout spécifique se révèle pertinente pour l'étude
de ces deux problèmes.
D'une part, elle nous permet de dépasser la limitation à la phrase
de la linguistique descriptive. Alors que nous ne pouvons pas définir la
distribution des phrases (ou plus généralement une quelconque relation
entre les phrases) dans un ensemble arbitraire de phrases prises dans une.
langue donnée, nous pouvons obtenir des résultats précis sur certaines
relations dépassant les limites de la phrase si nous ne considérons que les
phrases d'un seul discours suivi, c'est-à-dire celles qui ont été prononcées
ou écrites les unes à la suite des autres par une ou plusieurs personnes
dans une seule situation. Cette limitation de l'analyse au discours suivi
n'en diminue pas l'utilité, puisque toutes les occurrences de la langue ont
une cohérence interne. La langue ne se présente pas en mots ou phrases

2. Nous considérons que les corrélations entre personnalité et langue ne sont pas
simplement liées aux corrélations entre culture et langue, mais qu'elles en sont un cas
particulier. La raison d'être de ce point de vue est que la plupart des caractéristiques
individuelles d'un énoncé (à distinguer des caractéristiques phonétiques) sont en
corrélation avec les particularités de personnalité qui proviennent de l'expérience de
l'individu dans des situations interpersonnelles conditionnées socialement.
Le paradoxe, ou ce qui semble contre intutif est que la doxa générique est faite d’un ensemble de phrases en principe décousue,
qui ne se cantonne pa sà l’échelle d’un texte, alors que l’analyse du discours vise en principe à étudier des suites de phrases (on
imagine des textes alors). Ces phrases font partie d’une suite mais cette suite n’est pas nécessairement celle prévue par
l’agencement d’un texte particulier ou d’une oeuvre. 11

indépendantes, mais en discours suivi, que ce soit un énoncé réduit à un


mot ou un ouvrage de dix volumes, un monologue ou une discussion
politique. Les ensembles arbitraires de phrases ne présentent en fait
aucun intérêt, si ce n'est pour vérifier la description grammaticale; et il
n'y a rien d'étonnant à ce que nous ne puissions pas trouver a nuancer
d'interdépendance entre des phrases ainsi assemblées. La succession des phrases dans un justement. C’est
discours suivi constitue, au contraire, un domaine privilégié pour les l’apport de la
perspective
méthodes de la linguistique descriptive, puisque celles-ci ont pour objet foucaldienne, pour
la distribution relative des éléments à l'intérieur d'un énoncé suivi quelle qui le discours est
que soit sa longueur. une coupe opérée
D'autre part, l'analyse distributionnelle à l'intérieur d'un seul dans le réel
historique et social
discours, considéré individuellement, fournit des renseignements sur certaines que des catégories
corrélations entre la langue et d'autres formes de comportement. La raison préconçue ne peut
en est que chaque discours suivi est produit dans une situation précise pas intégralement
— qu'il s'agisse d'une personne qui parle, ou d'une conversation, ou de enfermer.
quelqu'un qui se met de temps en temps à son bureau pendant un certain
nombre de mois pour écrire un type défini de livres dans une certaine
tradition, littéraire ou scientifique. Cette co-occurrence de la situation et
du discours ne signifie pas, bien entendu, que les discours produits dans
des situations semblables doivent nécessairement avoir certaines
caractéristiques , formelles en commun, ni que les discours produits dans des
situations différentes doivent présenter certaines différences formelles;
elle ne fait qu'expliquer ou permettre l'existence de ces corrélations
formelles.
Il reste à prouver, à partir de données de fait, que ces corrélations
formelles existent bien en effet, que les discours d'un individu, d'un
groupe social, ou relevant d'un style particulier, ou portant sur un certain
thème, , présentent non seulement des significations propres (dans leur
choix des morphèmes), mais aussi des traits formels caractéristiques. Nous
ne parlerons pas ici du choix particulier des morphèmes, mais on peut
étudier les caractéristiques formelles de ces discours par des méthodes
distributionnelles appliquées à l'intérieur de chaque texte; et le fait de
leur corrélation avec un certain type de situation donne un statut de
signification! à l'occurrence de ces caractéristiques formelles.

3. — Combinaison, avec la grammaire.

On voit donc que la méthode présentée ici vient d'une application


des méthodes distributionnelles de la linguistique à un discours à la fois,
considéré comme un tout' spécifique. On peut s'en servir directement sur
un texte, sans faire appel pour son étude à aucune connaissance
linguistique autre que les limites des morphèmes; ceci est possible parce que
l'analyse distributionnelle est une méthode élémentaire, qui consiste
simplement à établir l'occurrence relative des éléments qui, dans le cas parti-
12

culier, sont des morphèmes. Pour montrer la validité de la méthode, ou


pour pouvoir éventuellement l'appliquer à un matériau non-linguistique,
il convient de n'utiliser aucune autre connaissance préalable que les
limites des éléments.
Si cependant nous nous intéressons non seulement à la méthode,
mais encore à ses résultats, si nous voulons l'utiliser pour découvrir tout
ce qu'il est possible de trouver sur un texte particulier, il est utile de la
combiner avec la linguistique descriptive. Dans ce but, il ne faut utiliser
que les règles de la grammaire de la langue en question qui sont vraies
pour toute phrase ayant une forme donnée. Par exemple, à partir de toute
phrase française de la forme Nj V N2 (Ainsi le chasseur tue le lion), on
peut obtenir une phrase où l'ordre des syntagmes nominaux est inverse
N2 — Nx (le lion — le chasseur) en changeant la forme verbale 3, le lion
est tué par le chasseur. Le recours à ce genre d'informations grammaticales,
dans l'analyse d'un texte, se justifie par le fait que, puisque cette règle
s'applique à toute phrase française de la forme N2 V N2, elle doit donc
aussi être applicable à toute phrase de la forme N-|_ V N2 du texte qui nous
intéresse, à la seule condition, naturellement, que ce soit du français. Et
ce recours à la grammaire permet dans bien des cas de pousser plus loin
l'application de la méthode d'analyse du discours.
Nous verrons ceci plus en détail à la section 7.3.; mais il faut signaler
ici que cet usage de l'information grammaticale ne remplace pas le travail
qui pourrait être effectué par la méthode d'analyse du discours et n'affecte
en rien l'autonomie de cette méthode, il ne sert qu'à transformer certaines
phrases du texte en phrases grammaticalement équivalentes (cf. ci-dessus
la transformation de Nj V N2 en N2 V* Nx), pour rendre plus aisée
l'application de la méthode d'analyse du discours, ou pour la rendre possible
dans certains passages du texte où elle ne l'était pas auparavant. Et nous
verrons qu'il ne s'agit pas de décider arbitrairement quand et comment
appliquer ces transformations grammaticales, mais que c'est la structure
même du texte qui les détermine.
On peut pousser plus avant encore l'application de la méthode
d'analyse du discours dans des textes particuliers si on utilise, non seulement les
résultats ordinaires de la grammaire, mais si on introduit également dans
la linguistique descriptive l'étude des distributions spécifiques des
morphèmes individuels; dans certains cas, en effet, comme on le verra à la
section 7.3., on aimerait pouvoir avoir des renseignements non plus sur
toute une classe de morphèmes (comme la transformation de tout V en
V*), mais sur un certain membre de cette classe, sur une restriction
d'occurrence qui est vraie pour ce morphème-là, mais non pour les autres; on
n'a pas toujours à l'heure actuelle de tels renseignements, mais il est pos-

3. Dans ce cas de transformation du verbe correspondant à une inversion du sujet


(N1 ci-dessus) et de l'objet (N2), on appellera la nouvelle forme verbale « forme conjointe
de la première » et on l'écrira V*. La forme conjointe d'un verbe actif est donc le passif
et vice versa.
13

sible de les obtenir par des méthodes qui, fondamentalement, sont celles
de la linguistique descriptive.
Enfin, on peut quelquefois pousser plus avant l'application de
l'analyse du discours dans des textes particuliers en tirant des renseignements
non seulement de la grammaire de la langue mais aussi d'une analyse
descriptive de l'ensemble, écrit ou parlé, dont le texte fait partie : on peut
considérer cette masse plus vaste de matériau comme le dialecte dans
lequel a été écrit ou dit le texte en question, et on peut dire, comme
précédemment, que toute conclusion distributionnelle vraie pour toutes les
phrases d'une forme donnée dans ce dialecte est vraie aussi de toute phrase
de cette forme dans le texte en question.

La méthode

4. — Nature de la méthode.

Nous avons soulevé deux questions : celle des rapports distribution-


nels entre les phrases, et celle de la corrélation entre la langue et la
situation sociale. Nous avons suggéré qu'on peut obtenir des renseignements
concernant ces deux problèmes grâce à l'analyse formelle d'un discours
pris comme un tout spécifique. Quel genre d'analyse faudrait-il utiliser?
Pour en décider, considérons ce que permet le matériau.
Puisque le matériau consiste simplement en une séquence de formes
linguistiques disposées en phrases successives, toute analyse formelle se
limite à localiser des éléments linguistiques à l'intérieur de ces phrases,
c'est-à-dire à établir les occurrences d'éléments; à moins d'introduire de
l'extérieur des informations nouvelles, nous ne pouvons pas étudier la
nature ou la composition de ces éléments, où leur corrélation avec des
caractéristiques non-linguistiques.
Qui plus est, il n'y a pas d'éléments spéciaux qui soient a priori plus
importants que les autres, comme mais, ou je, ou communisme, qui nous
conduiraient à nous intéresser au simple fait de leur absence ou de leur
présence dans notre texte. Toute analyse qui tendrait à découvrir la
présence ou l'absence dans un texte de certains mots particuliers choisis par
le linguiste, serait une recherche sur le contenu du texte, qui reposerait
finalement sur le sens des mots choisis. Si nous ne nous appuyons pas sur
le sens dans notre analyse, les seuls morphèmes — ou les seules classes —
que nous puissions traiter séparément sont ceux qui présentent des
particularités de distribution établies grammaticalement.
Puisque nous ne nous intéressons donc pas, en général, à tel ou tel
élément choisi à l'avance, mais bien aux éléments qui figurent dans le
texte, il est évident que nous ne voulons pas simplement affirmer tauto-
14

logiquement qu'ils figurent; nous chercherons à établir empiriquement


comment ils figurent, — lesquels se trouvent toujours à côté de quels
autres, ou dans le même environnement que quels autres, etc., — c'est-
à-dire l'occurrence relative de ces éléments les uns par rapport aux autres»
En ce sens notre. méthode se rapproche» plus de celle queJ!on< utilise pour
élaborer la grammaire d'une langue (qui établit; les. rapports distribution-
nels entre les .éléments), que de celle que l'on (utilise pour en j élaborer le
• dictionnaire (qui dresse la liste de tous les éléments de cette langue, sans se
préoccuper de, leurs .positions).
Enfin, puisque, le matériau est une suite -finie de. phrases, ce que nous
aurons établi sur la distribution.de chaque élément ne peut être valable que
dans les limites de cette séquence de phrases — que ce soit un paragraphe
ou un livre. Nous verrons plus loin (7.3.) qu'on peut parfois utiliser des
renseignements concernant la distribution d'un élément hors du texte
considéré ; mais ceci ne peut être qu'un auxiliaire extérieur, à n'utiliser que
lorsque la distribution de cet élément dans le texte a été complètement
établie.

5. — Aperçu général de la méthode.

Il résulte de tout ce qui précède que notre méthode devra établir


les occurrences d'éléments et en particulier les occurrences relatives de tous
les éléments d'un discours dans les limites de ce seul discours.

5.1. Éléments dans des environnements identiques.

Pour satisfaire à cette nécessité, nous pourrions. formuler de façon


détaillée la distribution de chacun des éléments dans le discours — de
même qu'en linguistique descriptive nous pourrions établir des formules
individuelles rendant compte de tous les environnements (c'est-à-dire de
la distribution) de chaque élément dans les différentes phrases d'une
langue. Mais ces formules individuelles sont de dimension impossible
pour toute une langue et, même pour un seul texte, elles sont difficiles
à manier. De plus, dans les deux cas, elles ne constituent pas une base
satisfaisante pour procéder à une analyse comparée et pour en déduire des
conclusions générales. C'est pourquoi, dans l'analyse du discours, comme
en linguistique descriptive, on regroupe les éléments qui ont des
distributions semblables en une classe et, à partir de là, on parle de la distribution
de la classe considérée comme un tout plutôt que de celle de chacun des
éléments pris séparément.
Quand deux éléments ont des distributions identiques, cette opération
de regroupement ne présente aucune difficulté. En linguistique descriptive,
cependant, c'est rarement le cas, car peu de mots ont des distributions
15

identiques dans l'ensemble d'une langue 4. Cela peut se trouver plus


fréquemment dans un texte répétitif, où deux mots peuvent être toujours
employés dans des phrases parallèles identiques — comme par exemple
dans les légendes à style en écho, dans les proverbes, dans les slogans, ou
dans les rapports scientifiques « secs », mais précis.

5.2. Éléments à environnements équivalents.


Il est plus fréquent que deux éléments se présentent dans des
environnements qui sont presque identiques, sans l'être tout à fait; nous
pourrons peut-être alors les regrouper en une seule classe distributionnelle
en dressant une chaîne d'équivalences qui lie les deux environnements
presque identiques 5. C'est ce qu'on fait en linguistique descriptive quand
on dit, par exemple, qu'en. français la classe des adjectifs A se rencontre
après la classe des noms N, en dépit du fait qu'un certain A (courageuse
par exemple) peut ne jamais figurer après un certain N (table par exemple).
C'est ce qu'on fait en analyse du discours quand on dit que deux parties
de l'énoncé, qui ont le même environnement à un endroit, sont équivalentes
même en un autre endroit où elles n'ont pas le même environnement.
Supposons par exemple que le texte contienne les quatre phrases
suivantes :
Ici les feuilles tombent vers le milieu de l'automne
Ici les feuilles tombent vers la fin du mois d'octobre
Les premiers froids arrivent après le milieu de l'automne
Nous commençons à chauffer après la fin du mois d'octobre.
Nous pouvons dire que le milieu de l'automne et la fin du mois d'octobre
sont équivalents parce qu'ils se présentent dans le même environnement
(Ici les feuilles tombent vers) et que cette équivalence passe dans les
phrases 3 et 4. Ceci posé, on peut aller plus loin et dire que Les premiers
froids arrivent et Nous commençons à chauffer se présentent dans des
environnements équivalents (le mot en supplément après est identique dans
les deux environnements). L'élaboration de ces chaînes, qui font passer
l'équivalence de deux parties de l'énoncé d'une paire de phrases où leur
environnement est vraiment identique, à une autre paire de phrases où
il ne l'est pas, doit naturellement présenter de sérieuses garanties, sinon
tout devient équivalent à tout et l'analyse s'effondre. On a le même
problème quand on établit les classes en linguistique descriptive. Nous verrons
plus loin (6.1.) le genre de garanties qui sont requises dans l'analyse
du discours.
De façon plus générale, si nous avons dans notre texte les séquences

4. Deux noms de personnes peuvent avoir des distributions identiques. Ainsi


pour toute phrase qui contient Bill, on peut trouver une phrase identique pour tout le
reste, mais qui contient Jim à la place de Bill.
5. Des travaux inédits de N. Chomsky m'ont aidé à mieux comprendre l'usage de
ces chaînes.
16

AM et AN, nous dirons que M est équivalent à N, ou que M et N se


présentent dans un même environnement A, ou que M et N se présentent tous
deux comme l'environnement d'un même élément (ou séquence d'éléments)
A; et nous écrirons M = N. Si nous trouvons alors dans notre texte BM et
CN (ou MB et NC), nous dirons que B est équivalent à C (au second degré),
puisque B et C se trouvent dans des environnements M et N, dont nous
avons établi l'équivalence, et nous écrirons B = C. Puis, si nous trouvons
BK et CL, nous écrirons K = L, puisqu'ils se trouvent dans les
environnements B et C équivalents au second degré, et ainsi de suite. A titre
d'exemple, continuons notre fragment de texte par la phrase suivante :
Nous avons toujours des tas d'ennuis quand nous commençons à chauffer,
mais il faut bien être prêt quand les premiers froids arrivent. Nous dirons
que Nous avons toujours des tas d'ennuis est équivalent (dans ce texte)
à mais il faut bien être prêt.
Dire que B = C ne veut pas dire qu'ils sont égaux en général, ni qu'ils
signifient la même chose; on utilise le signe = pour l'unique raison que
le rapport entre B et C satisfait aux exigences techniques du rapport
communément symbolisé par ce signe; quand nous posons B = C, cela
signifie seulement que ce rapport est une étape dans une chaîne
d'équivalences : d'une part B et C se rencontrent dans des environnements
équivalents (M et N); d'autre part deux environnements (K et L), quels qu'ils
soient, dans lesquels se trouvent B et G seront considérés équivalents.
Il ne sert à rien de soulever des questions comme « Est-il vrai que
B = C? » ou « A-t-on le droit de dire que K = L, simplement parce qu'on
a B = G et qu'on trouve BK et CL? ». Tout ce que nous proposons ici est
une méthode d'analyse, les seules questions pertinentes sont de savoir
si la méthode est utilisable et si elle conduit à des résultats intéressants
et valables. On jugera si la méthode est utilisable en se fondant sur ses
opérations, sans se préoccuper de ses résultats, que nous n'avons pas
encore vus. Quant aux résultats, nous en étudierons l'intérêt aux
paragraphes 8, 9 et 10, où nous verrons que les chaînes d'équivalences révèlent
une structure pour chaque texte. Il ne s'agit pas de savoir si nous avons le
« droit » de poser K = L, puisque tout ce que nous signifions par K = L
est qu'on trouve BK et CL et que B = C; la justification viendra du fait
qu'en regroupant toutes les équivalences, on trouve quelque chose sur la
structure du texte.

5.3. Classes d'équivalences.


Après avoir établi quelles sont les séquences qui se rencontrent dans
des environnements équivalents, nous pouvons les regrouper en une seule
classe d'équivalence. Nous avons les formules A = B (tous deux se
rencontrent devant N) et B = C, nous considérerons donc A, B et C comme
membres d'une même classe d'équivalence. De même, M, N, K, L sont tous
membres d'une autre même classe d'équivalence. Reprenons notre
exemple : Les feuilles tombent vers (Tx), Les premiers froids arrivent après
17

(To) et Nous commençons à chauffer après (T3) sont tous trois membres d'une
classe d'équivalence T, tandis que le milieu de V automne (Ex) et la fin du
mois d'octobre (E2) sont membres d'une autre classe d'équivalence E. Il
y a encore une troisième classe d'équivalence E' composée de nous avons
toujours des tas d'ennuis quand et mais il faut bien être prêt quand. Il y a
visiblement un rapport entre E' et E puisque tous deux se rencontrent avec
les deux derniers membres de T. Mais E se trouve après T, tandis que
E' se trouve avant T.
En fonction de ces classes, on peut écrire les cinq phrases du fragment
de texte en six formules (la dernière phrase est double) : TE, TE, TE, TE,
E'T, E'T; on ne peut visiblement pas faire de E et E' une seule classe,
mais on peut dire que, quand l'ordre de E et T est inversé (quand E se
réfléchit dans T), on a E' à la place de E. Si on modifie les membres de E'
pour leur donner la forme qu'ils auraient s'ils suivaient T au lieu de le
précéder, ils deviennent des membres réguliers de E. Par exemple, on
pourrait dire Nous commençons à chauffer avec toujours des tas d'ennuis
mais les premiers froids arrivent si brusquement qu'il faut bien être prêt.
Cette phrase est de la forme TETE. Le nouveau syntagme avec toujours
beaucoup d'ennuis est un membre deE en vertu de son occurrence après T;
appelons le E3; il faut naturellement montrer qu'il est équivalent à Nous
avons toujours des tas d'ennuis, sauf en ce qui concerne sa position inverse
par rapport à T; nous verrons au paragraphe 7.3. à quelles techniques
on fait appel pour établir cette équivalence. De même il faut montrer que
le nouveau syntagme E « mais... si brusquement qu'il faut bien être prêt
(E4) est le réfléchi dans T du syntagme E' mais il faut bien être prêt quand.
Si on peut établir ces deux équivalences, on peut remplacer les deux
syntagmes E' par les syntagmes modifiés qu'on obtient quand on les
met en position E. Nous obtenons par conséquent deux membres de
plus dans E, et la classe E' n'existe plus.
On peut ainsi dresser des classes d'équivalence (comme E) de toutes
les séquences qui ont des environnements équivalents, à l'intérieur du
texte, c'est-à-dire les mêmes classes d'équivalence d'un même côté (avant
ou après). Les éléments (ou séquences d'éléments) qui appartiennent à
la même classe d'équivalence sont dits équivalents les uns aux autres, ou
substituts les uns des autres : nous verrons plus loin (paragraphe 10) que,
par certains côtés (en particulier dans les extensions du texte), on peut les
considérer comme interchangeables ou substituables; dans ce cas la classe
d'équivalence peut aussi s'appeler une classe de substitution.
11 est à remarquer que l'opération consistant à grouper dans une même
classe d'équivalence des formes non identiques, ne repose pas sur le fait
que leurs petites différences de sens sont considérées comme négligeables,
mais sur le fait qu'on les trouve dans des environnements équivalents,
ce qui signifie qu'on les trouve soit dans des environnements identiques
(le milieu de l'automne et la fin du mois d'octobre se rencontrent tous deux
dans l'environnement les feuilles tombent vers), soit dans des environne-
18

ments qui sont aux extrémités d'une chaîne d'équivalences garantie


(Les premiers froids arrivent et Nous commençons à chauffer se trouvent
dans les environnments équivalents après le milieu de l'automne et après
la fin du mois d'octobre). Notre méthode est donc essentiellement celle de
la linguistique descriptive et non celle de la sémantique.

5.4. Ordres de phrase.


Nous en arrivons maintenant à une opération que n'emploie pas la
linguistique descriptive, à savoir la représentation de l'ordre des
occurrences successives des membres d'une classe. En linguistique descriptive,
le seul ordre considéré est la position relative des différentes parties d'une
séquence : on décrit, par exemple, l'ordre de l'article et du nom en disant
que le premier précède le second dans la chaîne du syntagme nominal.
Dans l'analyse du discours aussi nous avons ce type d'ordre dans les parties
de la phrase, par exemple les ordres différents de E et E' par rapport à T.
L'ordre des phrases successives ou d'une certaine classe de mots dans
différentes phrases (par exemple la relation entre des sujets successifs)
n'intéresse généralement pas la linguistique descriptive, car les formules
distributionnelles qu'elle définit ne s'appliquent normalement qu'à
l'intérieur d'une seule phrase à la fois. Dans notre cas cependant, où il s'agit de
tout un discours, le problème existe. Si nous considérions chaque phrase
séparément, en ne la rapprochant des autres que pour comparer des
structures, nous pourrions dire (comme en linguistique descriptive) que chacune
des phrases de notre fragment de texte consiste en TE. Mais, puisque nous
considérons le texte comme un tout, nous ne pouvons dire qu'il consiste
simplement en 6 fois TE : les membres de E et de T sont différents dans les
diverses phrases; et leurs différences preuvent être particulières à ce texte,
ou à un groupe de texte semblables.
Nous pouvons représenter structurellement notre fragment de texte
par un tableau à double entrée, l'axe horizontal représentant la matière
qui se présente à l'intérieur d'une seule phrase ou sous-phrase, l'axe
vertical (ici divisé en 2 parties) représentant les phrases successives.

Ti Ex T3 E2

Dans ce tableau à double entrée, les différents symboles dans la rangée


horizontale représentent les différentes parties d'une seule phrase ou
sous-phrase du texte, dans l'ordre dans lequel elles se présentent dans
la phrase (sauf dans la mesure où l'ordre a été modifié par des
transformations explicites comme pour le passage de E' à E). Les colonnes
verticales indiquent les différents membres d'une classe d'équivalence, dans
l'ordre d'apparition des phrases où ils figurent.
Le fait que l'ordre des symboles d'une rangée puisse être différent de
l'ordre des éléments dans la phrase correspondante tient à ce que nos
19

connaissances linguistiques de la structure de phrase nous permettent


de traiter les éléments indépendamment de leur ordre. C'est ce que nous
faisons quand nous ne tenons pas compte dans nos symboles d'un ordre
automatique et qui réapparaîtrait dès la retraduction de nos symboles en
langue, — par exemple nous incluons mais... dans E4 même s'il en est
nécessairement séparé dans la phrase réelle (puisque mais se trouve
généralement au début d'une structure de phrase, quelle que soit la partie
de la phrase à laquelle il se rapporte). C'est ce que nous faisons également
quand nous remplaçons un certain ordre non automatique à valeur
morphologique par les morphèmes qui sont grammaticalement équivalents
à cet ordre : ainsi quand, par exemple, nous remplaçons NXV N2 par
N2 V* Nj_ (remplacement de le chasseur tue le lion par le lion est tué par
le chasseur) ou quand, dans notre fragment de texte, nous remplaçons
E' avant T par E après T.
Contrairement au traitement cavalier de l'ordre horizontal, nous ne
pouvons rien changer à l'ordre dans une colonne verticale : nous n'avons
là aucune connaissance linguistique a priori qui nous dise quels
agencements de phrase sont automatiques (s'il y en a) et par conséquent à ne pas
représenter, ni quels agencements peuvent être remplacés par des
agencements différents, mais équivalents. Une étude plus approfondie des
séquences de phrases dans la langue nous donnera peut-être un jour des
indications à ce sujet; elle établira peut-être, par exemple et pour prendre
un cas très simple, que des séquences de phrases de la forme P parce
que Q sont équivalentes à des séquences de la forme Q donc P, ou que
P et Q est interchangeable avec Q et P (tandis que P mais Q peut n'être
pas pareillement interchangeable avec Q mais P) 6. Qui plus est, une étude
approfondie d'un certain texte ou de plusieurs textes d'un certain type
montrera peut-être que certaines séquences de phrases tout entières
sont interchangeables ou équivalentes; et, grâce à ces données, nous
pourrons peut-être simplifier l'axe vertical du tableau à double entrée,
en trouvant par exemple des schemes verticaux qui reviennent
périodiquement. En attendant, l'axe vertical reste une reproduction exacte
de l'ordre des phrases ou sous-phrases du texte.

5.5. Résumé.
Nous pouvons maintenant avoir un aperçu général de la méthode.
On dira que des éléments (parties de texte — morphèmes ou séquences de
morphèmes) sont équivalents entre eux s'ils se présentent dans
l'environnement d'autres éléments identiques ou équivalents. Tout ensemble
d'éléments équivalents entre eux s'appelle une classe d'équivalence.

6. Les mathématiques, et plus encore la logique, ont déjà établi des ordres de
phrase spécifiques qui sont équivalents. On peut redécouvrir linguistiquement cette
équivalence en trouvant que la distribution de chaque phrase est équivalente à celle
des autres. Mais nous cherchons plutôt ici à découvrir d'autres équivalences que celles
que nous savons déjà faire partie du système.
20

Chaque phrase successive du texte est alors représentée par une séquence
de classes d'équivalence, celles auxquelles ses différentes parties
appartiennent. Nous obtenons ainsi pour tout le texte un tableau à double
entrée, l'axe horizontal représentant les classes d'équivalence contenues
par une seule phrase, l'axe vertical représentant les phrases successives.
Ce n'est pas un tableau des structures de phrase (sujets, verbes, etc.),
mais des schemes d'occurrence des classes d'équivalences dans tout le
texte.
Si les différentes phrases contiennent des classes entièrement
différentes, ce tableau n'a pas d'intérêt; mais ce n'est généralement pas le
cas. Il y a, dans presque tous les textes, des passages où certaines classes
d'équivalence se répètent, dans les phrases successives, en un scheme
caractéristique. Le tableau permet d'étudier ce scheme et on peut en
tirer divers types d'information sur le texte, certaines analyses
structurelles du texte et certaines exégèses sur le texte. Pour les classes
d'équivalence, qui ont été établies distributionnellement, le tableau en montre
la distribution. Pour le texte dans sa totalité, le tableau montre certaines
caractéristiques de structure.

6. — Mode opératoire.

Nous allons maintenant montrer la procédure en détail, en


appliquant la méthode à un texte spécifique, d'un type très courant
aujourd'hui 7.
Millions Can't Be Wrong
Millions of consumer bottles of X- have been sold since its introduction
a few years ago. And four out of five people in a nation wide survey say they
prefer X- to any hair tonic they've used. Four out of five people in a nation
wide survey can't be wrong. You too and your whole family will prefer X-
to any hair tonic you've used! Every year we sell more bottles of X- to
satisfied customers. You too will be satisfied!

6.1. Détermination des classes d'équivalence.


La première étape dans l'analyse du discours consiste à décider quels
éléments doivent être considérés comme équivalents, donc placés dans la
même colonne du tableau. Ce n'est pas toujours automatique, il ne s'agit
pas simplement de trouver ceux des éléments qui ont des environne-

7. Ceci est le texte authentique d'un slogan, que nous avons trouvé sur une carte,
qui selon toute vraisemblance, était accrochée à une bouteille de lotion capillaire. Un
très grand nombre de slogans ont été analysés, car ils offrent un matériau clair et
répétitif qui est relativement facile à manier, au stade où nous en sommes arrivés dans
l'analyse du discours. On a aussi analysé de nombreux autres types de textes — des
fragments de livres scolaires, de conversations, d'essais littéraires, etc., qui feront l'objet
d'une prochaine publication.
21

ments identiques, car 1° il peut y avoir plusieurs façons de couper une


phrase en parties équivalentes; et 2° il nous faut déterminer dans quelle
direction chercher les chaînes d'équivalence qui sont moins évidentes.
Le point de départ le plus simple est d'examiner les mots du texte
qui sont le plus souvent répétés : presque tous les textes contiennent des
mots très souvent répétés 8, qui sont souvent les mots-clés du texte. On
peut en toute certitude mettre dans une seule colonne, c'est-à-dire dans
une seule classe d'équivalence, les diverses occurrences de chacun de ces
mots. Et on peut mettre dans une seule autre classe d'équivalence les
mots voisins du mot-clé puisqu'ils se présentent dans des environnements
identiques. Dans notre texte, il n'y a pas apparemment de mots-clés;
mais nous pouvons partir de la séquence répétée can't be wrong, identique
et donc naturellement équivalente : Millions est alors équivalent (pour
ce texte) à Four out of five people in a nation wide survey, puisque tous
deux se trouvent devant can't be wrong.
Cette première étape pourrait aussi, bien entendu, être effectuée
pour des mots répétés tels que of. Mais si nous devions regrouper tous les
environnements du mot of, nous ne pourrions pas utiliser la classe
d'équivalence qui en résulterait pour construire une chaîne d'autres équivalences,
car on ne trouverait rien d'autre dans leur environnement. Tandis que
la classe contenant millions et four out of five, que nous obtenons à partir
des répétitions de can't be wrong, se révélera, dans les paragraphes
suivants, liée à d'autres parties de ce texte.
En utilisant ainsi les répétitions, nous en venons à construire des
chaînes d'équivalence : nous nous demandons quels autres environnements
se présentent pour millions et four out of five... Pour millions nous avons
un autre environnement, à savoir of consumer bottles, etc., mais nous
verrons plus tard (paragraphe 9) que cet environnement s'oppose aux
environnements de four out of five; nous laisserons donc provisoirement
de côté la séquence of consumer bottles, etc. Quant à Four out of five in
a nation wide survey, nous le trouvons dans un autre environnement
say they prefer X- to any hair tonic they 've used.
Nous suivons cette chaîne d'équivalence en cherchant un autre
environnement dans lequel say they prefer X- se trouve; il y a bien une autre
occurrence de cette séquence, mais elle se différencie de la première par
you à la place de they. A première vue, il paraît donc impossible de
considérer ces deux séquences comme équivalentes, puisque notre méthode
ne donne aucune technique d'approximation, aucun moyen d'estimer
une différence plus ou moins grande, qui puisse nous permettre de

8. Ceci est même vrai, bien qu'à un moindre degré, dans des textes écrits par ceux
qui respectent les consignes scolaires concernant l'emploi des synonymes pour éviter
les répétitions. Dans ce cas, on trouvera souvent les synonymes dans les mêmes
environnements que le mot originel à ne pas répéter. Au contraire, quand un auteur a
intentionnellement utilisé un mot différent pour exposer une nuance particulière de sens que
ce mot exprime, il y aura souvent une différence correspondante entre les
environnements du synonyme et du mot originel.
22

dire que ces deux séquences sont assez semblables pour être considérées
comme équivalentes. En fait, puisque nous n'opérons pas sur le sens des
morphèmes, le remplacement de they par you pourrait constituer une
différence importante (comme ce serait le cas si tout le texte traitait de la
distinction entre you et they). Telles quelles, ces deux séquences ne seraient
donc pas rapprochées par notre méthode; tout ce que cette méthode
pourrait faire, serait de trier les parties identiques et les parties
différentes. En fait il se trouve cependant qu'un examen un peu plus
approfondi montre que ces deux séquences sont contextuellement identiques
— c'est-à-dire identiques quant à leur environnement pertinent ou
contexte. On verra cela au paragraphe 7.1.
Dans l'élaboration des chaînes d'équivalence, il importe de se
conformer rigoureusement aux exigences formelles de la méthode, ceci constitue
la première garantie; si nous ne faisons jamais d'approximations, si nous
ne négligeons jamais une « petite » différence dans l'environnement, nous
serons assurés que deux membres quelconques d'une même classe
d'équivalence ont au moins un environnement en commun. Si nous voulons
mettre dans une même classe deux éléments alors qu'aucun
environnement de l'un n'est identique à un environnement de l'autre, il nous faudra
ajouter à la méthode un postulat explicite, qui rendra égaux deux
environnements ou neutralisera leur différence.
Il faut enfin examiner, quand on se demande s'il faut inclure ou non
deux éléments dans une même classe d'équivalence, comment
fonctionnerait, dans l'analyse du texte, la classe qui résulterait de cette inclusion,
c'est-à-dire le genre de tableau à double entrée que l'on obtiendrait en
utilisant cette classe : ce facteur doit jouer un rôle, car il y a souvent
plusieurs chaînes d'équivalence possibles qui satisfont à la méthode. Il
ne s'agit pas de considérer des critères externes, comme la longueur de
la chaîne par exemple; il s'agit plutôt de chercher une distribution
systématique des classes, c'est-à-dire d'essayer d'établir en termes de ces
classes un certain fait structurel sur le texte. Autrement dit, nous essayons
de dresser des classes telles qu'elles aient une distribution intéressante
pour notre texte. On pourrait penser que c'est une garantie plutôt
circulaire pour la construction des chaînes d'équivalence; mais cela signifie
simplement que toutes les fois que nous devons décider s'il faut pousser
plus loin une chaîne d'équivalence, nous étudions comment le nouveau
jalon s'inscrira dans notre texte analysé, tel qu'il se présentera une fois
représenté en fonction de cette nouvelle classe. On utilise aussi ce genre
de considération en linguistique descriptive quand on doit décider, par
exemple, jusqu'où aller dans la subdivision d'une séquence phonologique
en morphèmes 9.

9. Cf. Methods in structural Linguistics, p. 160, de Harris (Chicago, 1951). Il va sans


dire que cet emploi vague de la prévision est une formulation préliminaire. Des analyses
poussées montreront ce que l'on peut attendre des différents types de chaînes
d'équivalence, et permettront ainsi une formulation plus précise des garanties.
23

On pourrait demander de quel droit nous mettons deux mots dans


une même classe d'équivalence pour l'unique raison qu'ils se présentent
tous deux dans le même environnement. Ce à quoi nous répondrons que
la classe d'équivalence indique seulement ce que font distributionnelle-
ment ses membres dans le texte : si, dans ce texte, deux mots ne se
présentent que dans des environnements identiques ou équivalents, alors,
dans ce texte, il n'y a pas de différence dans leur distribution (à part leur
ordre dans la colonne, qui est préservé). Nous ne nions pas qu'il puisse y
avoir des différences de sens ou de distribution en dehors de ce texte.
Nous avons jusqu'ici reconnu deux classes d'équivalence. L'une,
que nous appellerons P, contient pour l'instant :
Millions
Four out of five people in a nation wide survey
l'autre, que nous appellerons W, contient pour l'instant :
Can't be wrong
sag they prefer X- to any hair tonic they've used.

6.2. Segmentation.
Dès que nous voyons à peu près quelles classes d'équivalence nou&
voudrions expérimenter dans notre texte, nous le divisons en segments
successifs de manière à avoir, dans chaque segment, des occurrences
semblables des mêmes classes d'équivalences. Si nous avons jusqu'ici les
classes P et W et si nous avons quelques successions de la forme PW,
nous essayons de les diviser en segments contenant chacun exactement un P
et un W. Par exemple, le titre du slogan est représenté par PW. La
première phrase après le titre paraît contenir un P (le mot Millions), mais le
reste de la phrase n'est pas égal à W et ne le contient pas; on laisse
donc la phrase non analysée, et même son P est-il douteux.
L'appartenance d'un élément à une classe particulière dépend
toujours de l'appartenance de son environnement. Les éléments ne se
définissent qu'en fonction de leur environnement. Ainsi donc, il se pourrait
que le Millions de cette phrase ne soit pas le même mot que le Millions
du titre. En linguistique descriptive, deux segments identiques du point
de vue phonologique ne constituent un même morphème que s'ils figurent
dans la même classe de morphèmes : il faudrait probablement considérer
sun (soleil) et son (fils) comme le « même » morphème, au même titre
que table (de bois) et table (de logarithmes); s'ils figurent dans des classes
de morphèmes différentes, comme par exemple sea (mer) et see (voir),
ils ne sont certainement pas le même morphème; et si nous voulons ne pas
faire disparaître le rapport entre (a) table (une table) et (to) table
(tabuler) nous devons distinguer des morphèmes classés et des morphèmes non
classés, et dire que le morphème non classé table figure à la fois dans la
classe N et dans la classe V. De la même façon, si nous rencontrons
Millions deux fois, nous essayons de le considérer comme un « même » mor-
24

phème répété (donc de la même classe), et de considérer ainsi ses deux


environnements comme équivalents. Mais il se peut que nous découvrions
ensuite qu'on obtient une meilleure analyse du texte en ne considérant
pas ces deux environnements comme équivalents (parce que le premier
environnement est équivalent à une certaine séquence A dans le texte,
tandis que le second est équivalent à une autre séquence B, qui n'est pas
équivalente à A). Ainsi donc il se peut que nous ayons à considérer les
deux occurrences de millions comme appartenant à deux classes
différentes. Nous verrons à la section 9 que c'est bien le cas ici.
ReVenons-en à notre segmentation. La deuxième phrase du texte
est PW, et la troisième PW. Nous essayons donc de segmenter notre texte
en tranches successives contenant chacune exactement PW et pas plus.
Ces tranches seront alors les rangées successives de notre tableau à double
entrée. Il s'agira souvent d'une phrase entière, mais pas nécessairement :
les différentes sections d'une phrase composée, chacune ayant sa propre
structure de phrase (comme les deux E'T du paragraphe 5.3.), peuvent
aussi constituer des tranches. Mais toute autre portion de la phrase peut
aussi constituer une de ces tranches. Par exemple, si nous avions dans
notre slogan la phrase : Millions of people — four out of five — can't
be wrong when they say they prefer X, qui, telle qu'elle est là, paraît
consister en PPWW, nous essaierions de la réduire à deux segments PW.
Ces segmentations, moins évidentes, demandent la plus grande attention,
car nous voulons non seulement que les occurrences de P et W soient les
mêmes dans chaque segment, mais aussi que le rapport entre P et W
soit le même. Quand, dans une suite de phrases, chaque phrase tout entière
se réduit à PW,le rapport entre P et W dans chaque segment est le même;
la linguistique descriptive nous apprend que c'est le rapport entre sujet
et prédicat. Nous n'avons pas besoin d'utiliser ce renseignement
spécifique pour analyser notre texte en PW successifs, mais nous tenons pour
acquis que, quel que soit le rapport entre P et W dans un segment, il est
le même dans tous les autres segments. Sans quoi il serait faux de dire,
en face d'un tableau à double entrée, comme les TE successifs du
paragraphe 5.4., que les segments successifs sont identiques pour ce qui est
de T et E. Nous verrons aux paragraphes 7.2. et 7.3. les techniques
permettant de vérifier que le rapport entre les classes d'équivalence de
chaque rangée est le même.

6.3. Séries de segments semblables.


On ne réussira généralement pas à diviser tout un texte en segments
contenant les mêmes classes d'équivalence (dans le même rapport les
unes par rapport aux autres). Il peut y avoir ici et là des phrases qui
tout simplement ne contiennent pas ces classes : elles peuvent se révéler
être des phrases d'introduction ou des ramifications d'une autre série
de classes d'équivalence. Et le texte peut être constitué de morceaux
successifs, sortes de sous-textes à l'intérieur du texte principal, comme des
25

paragraphes ou des chapitres contenant chacun ses propres classes


d'équivalence différentes de celles des autres morceaux.
En cherchant les segments qui contiennent les mêmes classes, on
découvrira les limites de cette appartenance à une même classe, c'est-
à-dire les endroits où l'on obtient des fragments du texte contenant des
classes différentes. En règle générale un texte ne se réduira donc pas à
une seule série de rangées identiques (chaque rangée, comme TE,
représentant un fragment contenant les mêmes classes d'équivalence), mais à
une succession de séries de rangées identiques à l'intérieur de chaque série
avec, ici et là, des rangées individuelles et différentes.
Ayant obtenu ce résultat, nous comparons alors les différentes séries
et rangées individuelles, pour voir leurs ressemblances et leurs différences
en ce qui concerne l'agencement de leurs classes, que les classes
spécifiques soient différentes ou non. Nous essayons de découvrir des schemes
dans l'occurrence de ces ressemblances au cours de la succession des séries
et des rangées individuelles. Par exemple, supposons un texte de la
forme AB TE TE TE A'B' EP EP AB KD LM LM K'D' MS MS MS
FBV MS. Si nous utilisons des crochets pour représenter une série de
fragments de la même forme en laissant momentanément BV de côté,
nous pouvons alors représenter le texte par AB [TE] A'B' [EP] AB KD
[LM] K'D' [MS]. Nous remarquons alors que AB [TE] A'B' [EP] et KD
[LM] K'D' [MS] sont structurellement identiques : tous deux sont de
la forme w [xy] w' [yz]; c'est un rapport particulier entre w, x, y et z;
notre texte consiste en deux occurrences de cette structure, plus une
deuxième apparition du w de la première occurrence (c'est-à-dire le AB)
entre les deux structures (ou avant la seconde structure), et plus un FBV
unique avant la fin de la dernière structure.

7. — Techniques auxiliaires.

Il faut affiner et compléter la procédure centrale, que nous venons de


voir, à l'aide de plusieurs techniques auxiliaires.

7.1. Occurrence indépendante.


La distribution des classes d'équivalences (leur scheme
d'occurrence) et la segmentation en fragments qui les contiennent, dépendent de
ce que nous reconnaissons être une occurrence d'un élément. A première
vue, cela peut paraître tout simple : dans la suite Say they prefer X- to
any hair tonic they've used before, nous trouvons évidemment say une fois,
they deux fois, etc., En y regardant de plus près cependant nous voyons
que toutes les occurrences des éléments ne sont pas indépendantes :
certains éléments ne se trouvent, dans un environnement donné, qu'en
présence d'un autre élément. Cette situation est connue en linguistique
descriptive; par exemple le 5- de he walks n'est pas pris comme élément
indépendant, mais comme une co-occurrence automatique de he, par
26

comparaison avec / walk, you walk 10; et dans des formes comme both
he and I, la présence de both entraîne toujours celle de and, si bien qu'on
peut considérer both ... and comme un seul élément — et non comme
deux éléments. De la même façon, si dans un texte nous trouvons des
éléments identiques (répétés) ou différents, dont l'un n'apparaît que si
l'autre est présent, nous concluons que ces occurrences ne sont pas
indépendantes l'une de l'autre et nous indiquons leur occurrence combinée
comme un seul élément dans notre représentation du texte.
Pour they prefer X- to any hair tonic they've used nous ne pouvons le
comparer qu'à you too and your whole family will prefer X- to any hair
tonic you've used. Dans les deux cas, ce qui vient avant prefer contient le
mot qui précède 've; nous pouvons donc dire que le mot qui précède 've
n'est pas indépendant ou, plutôt, que le choix de l'un des deux membres
du groupe they /you dépend de celui des deux mots de ce groupe qui se
trouve devant prefer. Si le signe Q représente la répétition du membre
du groupe
U X they \J I/you
\J qui
X se trouve dans ce qui
XXprécède prefer, on a :
they prefer X- to any hair tonic Q've used
You... will prefer X- to any hair tonic Q've used.
Maintenant que nous avons réduit ces énoncés à leurs éléments
indépendants, nous constatons que leurs dernières parties sont devenues
identiques; par conséquent les premières parties des deux phrases se
trouvent dans des environnements identiques, elles sont donc
équivalentes; puisque la première appartenait à la classe P, la seconde you too...
appartient aussi à P u.
Ceci était un type d'occurrence liée; il y en a bien d'autres sortes
qu'il faut étudier; et les enseignements tirés de cette étude sont utiles
à la fois pour l'analyse du discours et pour une linguistique descriptive
plus détaillée.
Les pronoms en offrent un exemple important. Si le slogan avait dit
you... will prefer it, au lieu de you... will prefer X-, nous commencerions
par considérer it comme un nouvel élément, à placer dans une nouvelle
classe d'équivalence. Mais, en fait, l'occurrence de it dépend de
l'occurrence de X- : si le X précédent avait contenu le morphème de pluriel
(X-s), le pronom dans cette phrase aurait été them. D'autres mots du
groupe de it, comme he ou you, ne peuvent figurer tant que X- apparaît
dans la phrase précédente. Il en est de même pour des mots comme
10. Le s fait aussi partie de tous les noms singuliers (The child walk-s, etc.). Ou on
peut également considérer que walks, goes, etc., sont des variantes de walk, go, etc.
après he et les noms singuliers.
11. Avant d'en venir là, il faut effectuer un certain nombre d'autres opérations pour
réduire Four out of fives... say they prefer... à deux séquences PW : Four... say... et they
prefer..., la phrase You... will prefer... étant une troisième séquence PW. Sinon, les mots
say they resteraient, puisque la séquence P (équivalente à millions) est seulement Four
out of five people in a nation wide survey, et puisque la séquence W corrigée (identique
au W de You... will prefer) est seulement prefer X- to any hair tonic Q've used (cf.
paragraphe 9).
27

this /these, who /which, qui dépendent eux aussi de mots particuliers
apparaissant à un autre endroit du texte. Sans faire appel à aucune
connaissance sur la signification de ces pronoms ou sur leur « référence » aux
noms qui les précèdent, nous pouvons conclure, d'après leur distribution
dans le texte, que ce ne sont pas des éléments indépendants : ils contiennent
une partie (discontinue) de l'occurrence du morphème auquel ils sont
correliés.
On rencontre un autre type d'occurrence liée dans des expressions
réciproques comme each other et together qui introduisent dans la langue
certaines des fonctions remplies par les variables dans les expressions
mathématiques — mais avec ce manque de netteté et cette complexité
qui sont caractéristiques de la langue. La phrase Foster and Lorch saw
each other at the same moment est normale; mais enlevez and Lorch, et
tous les anglophones remplaceront immédiatement each other par autre
chose. Autrement dit, nous ne trouvons pas de phrase qui contienne each
other sans contenir soit l'expression and Z, soit un morphème de pluriel
dans le nom correspondant. Et aussi bien nous trouverons la phrase
Electrons and positrons attract each other, mais nous ne trouverons pas
— dans un livre de physique tout au moins — la même phrase avec
omission de and positrons, sauf s'il y a aussi d'autres modifications telles
que le remplacement de attract par repel.
On peut remarquer que les éléments dépendants ont particulièrement
tendance à appartenir, dans leurs différentes occurrences, à des classes
d'équivalence différentes, puisque chaque occurrence appartient à la classe
de l'élément, quel qu'il soit, qui lui est correlié. Si le texte disait : You
will prefer X-, You will prefer it, The survey showed, It showed, la première
occurrence de it appartiendrait à la classe de X-, la seconde à la classe
de survey.
Dans tous ces cas, on peut éliminer les rapports spéciaux
d'occurrence liée entre des éléments particuliers, en faisant simplement de
l'élément dépendant une partie de l'élément auquel il est correlié (dont son
occurrence dépend). Il est bien entendu que, quand nous parlons de
dépendance, l'application que nous en faisons est restreinte au texte
particulier considéré. Il se peut que l'interdépendance entre les pronoms,
ou les mots réciproques, et un quelconque nom voisin se maintienne dans
tous les textes où ces mots apparaissent; mais l'interdépendance entre
les deux occurrences de they ou de you dans notre texte est spécifique
à ce texte; on pourrait trouver ailleurs la phrase they prefer X- to any
hair tonic you've used; mais dans ce texte particulier, nous n'avons pas
cette phrase. C'est pourquoi dans ce texte nous pouvons dire ce que le
second pronom doit être, en considérant le premier.

7.2. Subdivisions des phrases.


La présence d'éléments dépendants nous conduit à considérer
différemment la subdivision des phrases.
28

Quand les parties dépendantes d'un élément sont dispersées sur


toute une zone, nous devons généralement considérer toute cette zone
comme constituant un seul fragment comportant cet élément. Dans
they prefer X- to any hair tonic they've used par exemple, nous avons
montré que les deux occurrences de they sont interdépendantes dans ce texte;
nous pouvons donc décomposer cet énoncé en they (se présentant dans les
deux positions) plus... prefer X- to any hair tonic... 've used; de même
pour la phrase avec you (également dans les deux positions). Il s'agit là
d'un traitement plus général que celui du paragraphe 7.1., qui donnait
un statut privilégié à la première occurrence de they et de you en en
faisant dépendre la seconde occurrence, et qui fondait l'identité des deux
phrases dans leur dernière partie sur le fait que toutes deux renfermaient
le même type de dépendance (Q). Ce nouveau traitement élimine la
dépendance en considérant que l'unique they ou you figure dans les deux
positions, et établit sans conditions l'identité des secondes parties des
phrases. Le résultat de ce nouveau traitement est que, puisque le they
à double position s'étend sur presque toute la longueur de la seconde
partie, toute cette seconde partie doit être enfermée dans le même
fragment que they. L'unification des deux occurrences de they nous empêche
donc de faire là deux segments; sinon nous aurions pu avoir deux
segments : they prefer... et soit they've used soit Q've used.
D'un autre côté, il y a des cas où la dépendance nous conduit à
distinguer plus de segments que nous ne le ferions autrement. Prenons par
exemple la phrase Casals, who is self-exiled from Spain, stopped performing
after the fascist victory. Si nous étudions le texte dans lequel est enchâssé
cet énoncé, nous trouvons que le who est dépendant de Casais, tout comme
le second they est dépendant du premier : le texte contient And the same
Casals who... mais plus loin The records which... Nous pouvons donc dire
que le who « contient » Casals, c'est-à-dire qu'il en est soit la continuation,
soit la répétition. Mais laquelle des deux est-il? S'il en est la continuation,
nous n'avons qu'un segment, la première partie (C) étant Casals who,
la seconde (S) étant is self exiled... stopped... S'il en est la répétition, nous
avons deux segments, l'un enchâssé dans l'autre : le premier est constitué
de Casais (C de nouveau), plus stopped performing (Sx), le second de who
(considéré comme équivalent de Casals) plus is self-exiled (S2). Nous
n'opterions pour la seconde solution que si nous pouvions montrer, en
fonction du texte, que is self-exited... et stopped performing... sont deux
éléments distincts (et non simplement deux parties d'un même long
élément) — si, par exemple, nous trouvions dans le texte deux autres
phrases : The press failed to say why he stopped performing, etc. But he
has stated publicly why he is self-exiled, etc. Dans tous les cas, who contient
Casals. Mais si la phrase originelle est Casals who S, notre analyse donne
CS, tandis que si (à la lumière des deux dernières phrases) nous
considérons la phrase originelle comme étant Casals who S2SV notre analyse donne
CC S2 Sv et divise la phrase en deux segments CS2 et CSj, le résultat
29

étant que S2 et Sx sont équivalents puisqu'ils apparaissent tous deux


après C. La seule différence qu'il y a entre le fait déconsidérer un élément
dépendant comme une continuation et le fait de le considérer comme
une répétition réside dans le nombre de segments — un ou deux — en
lequel nous pouvons alors décomposer le tout.
Nous venons de voir que, quand une phrase contient un élément A,
qui est dépendant de B, nous pouvons soit considérer toute la phrase
comme un seul segment dans lequel A est simplement une continuation
de B, soit la considérer comme deux segments, l'un contenant B et l'autre
contenant A dans la même classe que B. En règle générale, on optera
plutôt pour cette seconde solution si le reste de la phrase peut se diviser
en deux parties comparables, l'une allant avec A et l'autre avec B.
Des choix de ce type peuvent se présenter même là où il n'y a pas
de formes dépendantes. Par exemple, dans notre second texte, nous
avons ensuite la phrase The self-exiled Casals is waiting across the Pyrenees
for the fall of Franco; nous souhaitons mettre self-exiled dans la même
classe que is self-exiled..., puisqu'ils comportent les mêmes morphèmes
(à condition de pouvoir montrer d'après le texte lui-même que self-exiled
est équivalent à self-exiled from Spain); ceci nous donne la structure de
phrase particulière S2 C S3, par comparaison avec les phrases CS
précédentes. Si maintenant par un heureux hasard le texte contenait également
la phrase Casals is waiting across the Pyrenees for the fall of Franco (ce
qui est trop demander en fait de répétition), nous serions à même de faire
l'analyse suivante : nous avons comme phrases du texte : CS1} C is S2,
S2CS3, CS3; les séquences S1} S2 et S3 sont toutes membres d'une même
classe d'équivalence S, puisqu'elles apparaissent toutes après C. La
difficulté vient de cet étrange objet qu'est S2CS3. Disons maintenant que
toute phrase XjAX2 peut être « transformée » en A is Xj : AX2 12; ceci
signifie que, si XjAXg se trouve dans le texte, alors A is Xx : AX3 s'y
trouve aussi; dans ce cas, nous considérons XXAX2 comme équivalent à
A is Xx : AX2. Notre étrange objet S2CS3 disparaît alors : nous le
remplaçons par C is S2 et CS3, qui tous deux se retrouvent ailleurs dans le même texte.
On peut continuer dans cette voie jusqu'à des transformations qui ne
sont pas déjà justifiées par le texte, pourvu qu'elles ne soient pas en
contradiction avec lui. Par exemple, nous trouvons dans le texte les phrases
The memorable concerts were recorded in Pardes... The concerts were
recorded first on tape. Nous pouvons écrire ceci MNRX : NR2 (l'équivalence de
Rx et R2 est supposée démontrée à un autre endroit du texte), et nous
transformerions la première phrase en N is M : NRr Nous ne prétendons
pas par là que notre transformation N is M (The concerts were memorable)
figure vraiment dans le texte, ou qu'il n'y ait pas de différence stylistique
ou autre entre The memorable concerts were recorded in Prades et The

12. Dans les formules comme A is Xt : AX2, le : indique la fin d'une phrase ou
d'un segment. (On l'utilise de préférence au point qui risquerait d'être confondu avec
le point marquant les fins de phrase dans le texte de l'auteur.)
30

concerts were memorable : The concerts (ou They) were recorded in Prades.
Tout ce que cette transformation signifie, c'est qu'on considère MNRj^
comme équivalent de N is M : NRj, parce qu'on trouve bien S2GS3
comme équivalent de C is S2 : CS3, en ce sens que tous deux figurent
dans le texte modifié.
D'une part nous avons éliminé de notre agencement en tableau la
structure de segment spéciale MNRX ou S2CS3 — spéciale parce que
les autres segments sont tous de la forme NR ou CS. D'autre part, nous
avons découvert que M (ou plutôt is M) est membre de la classe R. Mais
surtout nous avons établi qu'une phrase peut être représentée par deux
segments même si elle ne contient pas deux ensembles des classes
d'équivalence voulues. C'est ce qui arrive quand nous pouvons démontrer
qu'une seule classe dans la phrase a ailleurs un rapport indépendant avec
deux autres classes ou éléments. Cette classe est donc répétée une fois
dans chaque segment; et chaque segment marque individuellement le
rapport de cette classe avec l'une des deux autres 13.
Ces difficultés dans la division en segments viennent des rapports
que les classes d'équivalence entretiennent les unes avec les autres. Une
phrase n'est pas simplement l'occurrence simultanée de différents
morphèmes ou séquences; ceux-ci sont généralement liés, les uns aux autres,
par un rapport spécifique, qui peut s'exprimer par un ou plusieurs
morphèmes d'ordre : You wrote Paul et Paul wrote you ne diffèrent que par
l'ordre des morphèmes. Si nous trouvons dans notre texte plusieurs
segments de la forme CS, cela signifie que C est dans un rapport particulier
avec S — celui de se présenter avec S, et devant lui. Puisque nous
n'opérons pas sur le sens, nous ne savons pas ce que c'est que ce rapport, mais
nous prenons soin de représenter le même ordre de morphèmes dans la
phrase par le même ordre de classes dans le segment. Quand maintenant
nous trouvons S2CS3, nous ne savons pas quel est le rapport entre cet
ordre et l'ordre CS, et nous ne pouvons faire aucune comparaison entre
les deux phrases. Il faut donc réorganiser ce S2CS3 inconnu, pour qu'il
contienne les mêmes classes dans le même ordre que d'autres segments
— et, bien entendu, nous devons montrer que la forme remaniée est
équivalente, pour ce texte, à la forme originale. Dans la plupart des cas, la
seule façon d'y arriver est de diviser la phrase inconnue, au moyen de
transformations comme celles que nous avons vues plus haut, en deux ou
plusieurs segments, de façon à ce que les segments obtenus aient une forme
qui se rencontre dans le texte.
De cette manière, nous obtenons un grand nombre de segments de
structure semblable, même dans un texte dont les phrases sont très
différentes les unes des autres.

13. Nous avons considéré ici le cas important de la séquence adjectif + nom
+ verbe, dans laquelle le nom a des rapports indépendants avec l'adjectif et avec le
verbe. On peut représenter l'adjectif, aussi bien que le verbe, comme prédicat du nom.
Nous reviendrons sur cette question au paragraphe 7.3.
31

7.3. Transformations grammaticales.


Nous avons vu jusqu'ici comment on peut étudier la structure d'un
texte sans faire appel à aucune information qui ne soit pas fournie par le
texte lui-même : la procédure directe consiste à dresser des classes
d'équivalence et à découvrir des schemes de combinaison de ces classes dans
les segments successifs du texte (c'est-à-dire à trouver des combinaisons
semblables ou partiellement semblables). On obtient souvent cependant
beaucoup de petites classes et de segments qui ne sont pas semblables,
parce que les phrases sont si différentes les unes des autres; quand c'est
le cas, on s'aperçoit qu'en comparant les phrases du texte on peut parfois
montrer qu'une partie d'une phrase est équivalente (pour ce texte) à
une partie différente d'une autre phrase et, par conséquent, qu'elle contient
les mêmes classes. Ceci dépend du nombre de répétitions que contient le
texte.
Passons maintenant à la possibilité de pousser plus loin dans la
même direction en faisant appel à une information extérieure au texte;
celle-ci sera de la même nature que celle que nous avons cherché à établir
à l'intérieur du texte, c'est-à-dire qu'elle conservera l'équivalence de
parties de phrases (au sens où MNR est équivalent à N is M : NR); elle
reviendra à la même opération fondamentale, c'est-à-dire à la comparaison
de phrases différentes. Et elle tendra au même but : montrer que deux
phrases, différentes par ailleurs, contiennent la même combinaison de
classes d'équivalence, même si elles contiennent des combinaisons
différentes de morphèmes. La seule nouveauté, c'est qu'au lieu de comparer
deux phrases du texte, nous comparerons une phrase du texte à des
phrases qui ne sont pas dans le texte.
On pourrait penser qu'il s'agit là d'une différence capitale et
s'interroger sur la validité de l'application à notre texte d'une équivalence ainsi
établie. Nous avons déjà répondu à cette objection au paragraphe 3 : si
nous pouvons montrer que deux séquences sont équivalentes dans toutes
les phrases anglaises où elles figurent, alors elles sont équivalentes dans
tout texte écrit en anglais. Si dans toute phrase anglaise contenant XAY,
le XAY est équivalent à A is X : AY, alors si nous trouvons S2CS3 dans
notre texte anglais nous pouvons dire que S2CS3 équivalent à C is S2 : CS3.
Mais qu'est-ce que Y équivalence? Deux éléments sont équivalents
s'ils se trouvent dans le même environnement à l'intérieur de la phrase.
Deux phrases d'un texte sont équivalentes simplement si elles se trouvent
toutes deux dans ce texte (sauf si on découvre des détails de structure
assez fins pour montrer que deux phrases ne sont équivalentes que si elles
figurent dans des positions structurelles semblables dans ce texte). De
même, deux phrases d'une langue sont équivalentes si elles se rencontrent
toutes deux dans cette langue. En particulier, on dira que des phrases de
la forme A sont équivalentes à des phrases de la forme B si, pour chaque
phrase A, on peut trouver une phrase B contenant les mêmes morphèmes,
32

mises à part les différences dues à la différence de forme entre A et B :


par exemple, I^VNa est équivalent à N2 is V-en by Nx parce que pour
toute phrase comme Casals pldys the cello, on peut trouver une phrase
The cello is played by Casals.
Nous ne soutenons nullement que deux phrases équivalentes
signifient nécessairement la même chose, ni qu'elles soient pareilles du point
de vue stylistique. Mais par contre nous soutenons que toutes les phrases
ne sont pas ainsi équivalentes : la relation d'équivalence n'est pas sans
intérêt, comme elle le serait si elle existait pour toutes les phrases. Par
exemple, NjVN,} n'est pas équivalent à Nx is V-en by N2, parce que cette
dernière forme se trouve pour certains N± et certains N2 (I saw you et
/ was seen by you), mais pas pour tout Nj^ et tout N2 (on ne trouve pas
Casals is played by the cello) u. Nous affirmons de plus que l'application
de cette équivalence grammaticale provenant de l'extérieur nous
permettra de découvrir dans notre texte des segments semblables
supplémentaires que nous ne pourrions pas trouver par la simple comparaison des
phrases du texte. Ainsi, on peut démontrer que dans divers
environnements who, he, etc., sont grammaticalement équivalents aux noms qui les
précèdent, et que Nx who Vx V2 est équivalent à NjVg : N^; dans Casais,
who is self-exiled... stopped performing..., il y a deux segments CSX : G
is S2; nous aboutirions à ce résultat (sans avoir à nous préoccuper de
savoir si Casals who constitue une occurrence prolongée de C, ou deux
occurrences répétées), même s'il n'y avait pas d'autre occurrence de who
dans le texte, c'est-à-dire même si l'analyse était impossible à partir du
seul texte. L'équivalence grammaticale nous est particulièrement utile si
nous avons par exemple un grand nombre de segments contenant tous
Casais, entremêlés avec beaucoup d'autres contenant he, et si nous ne
pouvons trouver aucun environnement contextuel commun pour
démontrer que Casais et he sont équivalents. Dès que nous acceptons cette
équivalence grammaticale, nous pouvons montrer que tous les
environnements de Casais sont équivalents à ceux de he; et ceci peut à son tour
nous permettre de découvrir d'autres équivalences à partir du texte.
On peut explorer plus systématiquement l'équivalence grammaticale
en introduisant une technique de variation expérimentale. Supposons
que nous ayons une phrase d'une forme donnée A et que nous voulions
une forme B; nous essayons de modifier A, le changement consistant
uniquement en la différence formelle qui existe entre A et B, pour voir
ce qui se passe alors en A. Supposons par exemple que nous ayons The
memorable concerts were recorded... qui est de la forme MNR, et que nous
voulions rendre la forme de cette phrase comparable à celle de segments
précédents commençant par N; à cette fin, nous cherchons une variante

14. Il est vrai qu'on pourrait soutenir que cette dernière phrase est encore
grammaticale. Mais la grammaire actuelle ne fait pas de distinctions entre les divers membres
d'une classe morphologique. Par conséquent, l'exigence que la phrase B contienne les
mêmes morphèmes que la phrase A sort de la grammaire, au sens courant de ce terme.
33

de cette phrase qui commence par The concerts; on peut essayer de


l'obtenir en plaçant un informateur dans une situation sociale
authentique productrice de parole (et non un exposé linguistique sur la parole),
dans laquelle il énoncerait une phrase commençant par The concerts et
contenant les mots memorable et recorded 15. Ou bien on peut y arriver
par le travail fastidieux de l'observation, en cherchant une phrase qui
commence par The concerts et contienne memorable et recorded. Par l'une
ou l'autre de ces deux méthodes, nous pourrions obtenir The concerts
were memorable and were recorded, ou quelque chose d'approchant 16,
qui montrerait que quand M (ou tout autre adjectif) passe de l'autre côté
de N (le nom qui le suit), on insère is; MN est équivalent à N is M. Nous
découvrons ainsi que, quand MNR passe à une forme qui commence
par N, un is apparaît entre N et le M qui le suit.
Cette technique consistant à faire varier la forme grammaticale
d'une phrase, tout en gardant constants ses morphèmes ne peut pas
s'appliquer à l'intérieur d'un texte; car là, tout ce que nous pouvons faire,
c'est étudier le matériau qui nous est donné. Mais on peut l'utiliser pour
la langue, hors du texte, car nous avons le droit, en tant que locuteurs,
de créer une situation sociale qui pourrait amener un autre locuteur à
prononcer telle phrase plutôt que telle autre parmi toutes les phrases dont
il dispose. Cette technique est particulièrement utile avec une langue
comme l'anglais, où tant de morphèmes figurent dans diverses classes
grammaticales.
Le paragraphe précédent montre la précaution essentielle que nous
devons prendre quand nous appliquons l'équivalence grammaticale pour
étoffer les classes d'équivalence contextuelle : nous ne nous posons pas
simplement la question : Quelles formes de phrase sont équivalentes à
MNR? Il peut y en avoir beaucoup. La question que nous nous posons est :
Puisque N... est une forme commune dans ce texte, et puisque nous y
trouvons aussi MNR, peut-on remplacer cette dernière forme par une
phrase équivalente de la forme N...? Le sens du changement à opérer
n'est pas arbitraire mais vient entièrement du texte. Comme
précédemment, cela revient à diviser les phrases en des segments aussi semblables
que possible. Tout ce que nous nous demandons, c'est s'il existe une
équivalence grammaticale qui relie MNR à la forme N...; la réponse est oui,
pourvu qu'un is figure dans la forme N...; ce qui à son tour fait de is M

15. Pour donner un exemple très simple, on peut lire en compagnie de l'informateur la
phrase du texte The memorable concerts were recorded, puis s'arrêter et lui dire de façon
hésitante et interrogative « That is to say, the concerts » (c'est-à-dire, les concerts...)
et attendre qu'il donne la suite.
16. Nous pouvons trouver beaucoup de phrases qui commencent par The concerts
et qui contiennent les deux autres mots, par exemple The concerts were not memorable,
but were neverthless recorded. Ces phrases contiendront divers mots en plus de ceux de la
phrase originelle; mais le seul mot nouveau qui se trouvera dans toutes les phrases de la
forme voulue NMR (ou plutôt dans une sous-classe des phrases NMR) sera une forme
du verbe to be. C'est donc le seul mot nouveau qui soit indispensable quand on opère
le changement pour obtenir cette forme.
34

un équivalent de R. Comme ailleurs en linguistique, il ne s'agit pas de


donner à toutes les phrases n'importe quelle forme choisie
arbitrairement; la méthode permet simplement de décrire les formes moins
fréquentes du texte (MNR) en fonction des formes fréquentes (N...).
Pour l'analyse purement contextuelle, nous n'avons besoin de connaître
que les limites des morphèmes. Pour utiliser les équivalences
grammaticales, nous devons également connaître la classe morphophonologique à
laquelle chaque morphème de notre texte appartient, puisque les règles
grammaticales concernent des classes plutôt que des morphèmes
individuels. Dans le cas considéré, la règle grammaticale est : adjectif + noin
est équivalent à nom + is + adjectif; pour pouvoir l'appliquer à notre
séquence MN, nous devons savoir que le M est un adjectif et que le N
est un nom.
On a constaté empiriquement que le nombre d'équivalences
grammaticales auxquelles on fait appel à chaque fois pour réduire des phrases
d'un texte en des segments semblables, est relativement peu élevé. C'est
pourquoi, même si on n'est pas linguiste, on peut apprendre beaucoup
sur le texte en utilisant (en plus de la méthode d'analyse interne du texte)
une liste préétablie des principales équivalences grammaticales pour la
langue en question. Voici quelques-unes des équivalences qui sont
fréquemment utilisées (nous ne donnons aucune preuve de leur validité, et
seulement quelques indications très approximatives des environnements de
phrase où elles s'appliquent) 17.

1) Si nous trouvons XCY, alors X = Y (X est équivalent à Y). Le


C est une conjonction comme and, but, or, ou bien, dans certaines
circonstances spéciales, un syntagme comme as well as, rather than, A-er than.
X et Y doivent être dans la même classe grammaticale. Par exemple, dans
I phoned him but he was out, X et Y sont tous deux de la forme NV; dans
I saw it but went on, Y est seulement constitué par le syntagme verbal
went on, X ne peut donc inclure que le syntagme verbal saw it (et non
toute la séquence I saw if). Il s'ensuit que N^CN^ est équivalent à
deux segments N^ : N2V2 et NV^V-j = NVX : NV2.

2) La séquence Nx is N2 indique que Nj_ = N2. La classe de is comprend


remains et d'autres verbes.

3) Nj N2, avec un accent primaire sur chaque N, indique que Nx = N2;


exemple : The pressure P increases est équivalent à The pressure increases
et P increases.

4) NV (that) NV = NV : NV; exemple / telegraphed that we'll arrive


to-morrow est équivalent à I telegraphed : we'll arrive to-morrow.

17. A = adjectif. N = nom, V = verbe, P = préposition. Les indices indiquent des


morphèmes particuliers, sans tenir compte de leurs classes.
35

5) NjVK^ = NgV*^, V et V* étant respectivement actif et passif ou


vice versa.
6) NjPNa = NaP*^; exemple : (they seek) the goal of certainty
est équivalent à une certaine forme comme (they seek) certainty as a goat.
Quand on inverse deux noms la modification des prépositions est bien plus
grande que la modification correspondante des verbes : dans le cas des
verbes, elle s'effectue simplement par l'addition ou le retrait du morphème
de passif et du mot by; dans le cas des prépositions, il faut remplacer une
forme par une forme entièrement différente. Les paires de prépositions
équivalentes ne sont pas fixes : entre certains noms, le substitut de of
peut être as; entre d'autres noms, il peut être with. Néanmoins il est
possible de trouver des structures dans lesquelles les noms de la séquence
N2 P N2 sont inversés.
7) Nj P N2 = Ag N1$ autrement dit, le morphème du second nom
apparaît sous une forme adjectivale avant le premier nom; exemple : training
in médecine et medical training.
8) Des pronoms comme he, et certains mots commençant par wh-
et th-, répètent un nom déjà énoncé. Quand ils sont précédés de plusieurs
noms, quel nom répètent-ils? Cela dépend des détails de l'environnement
grammatical; c'est généralement le nom qui les précède immédiatement,
ou le dernier nom figurant dans un environnement grammatical comparable.
Par exemple, who = the man dans The man who phoned left no name
(N who Vx V2 = NV2 : NVj); who = my roommate dans The man spoke to
my roommate, who told him to call again (N^Ng who V2 = N^Ng :
N2 V2). Il y a de nombreux procédés pour déterminer quel est le nom qu'un
pronom répète, et quel verbe va avec chaque nom. Dans the man who
phoned, on ne peut pas insérer un sujet avant phoned, il faut donc prendre
who comme sujet. Dans The man I phoned was out, nous réduisons d'abord
en / phoned : The man was out; ensuite, puisqu'on ne peut pas insérer un
complément d'objet après phoned dans la phrase originelle, nous faisons
de the man le complément d'objet 18 de phoned et nous obtenons
l'équivalent : / phoned the man : The man was out (

9) NV15 V2-ing = NVj_ : NV2; exemple : They escaped, saving nothing


est équivalent à They escaped : They saved nothing.
10) NiClNLj VX = IS^VM, : NgVNj. Ici X représente une classe
d'expressions réciproques comme each other; par exemple : The Giants
and the Dodgers each beat the other twice est équivalent à The Giants beat
the Dodgers twice : The D. beat the G. twice. L'équivalence est quelque peu
différente pour les différents groupes de formes X.

18. La seule façon d'exprimer l'exclusion d'un complément d'objet uniquement en


fonction de l'occurrence des éléments est de dire que l'objet figure déjà. Ce ne peut être
I puisque / est le sujet de phoned, ce doit donc être l'autre N, the man.
36

11) ANV = N is A : NV, cf. l'exemple the self-exiled Casals... du


paragraphe 7.2. De même NVANj = NVNj who is A = NVNX : Nt is A;
exemple : They read the interdicted books = They read the books which were
interdicted — They read the books : The bocks were interdicted.

12) NjVKjPNg = NjVNa : N^VPNg; c'est-à-dire qu'on peut


remplacer un double complément d'objet par deux compléments d'objet
distincts dans deux segments qui répètent le sujet et le verbe; exemple :
/ bought it for you = I bought it : I bought for you.

Ces équivalences grammaticales conservent les morphèmes et leurs


rapports grammaticaux, mais sous une autre forme grammaticale. On
ne peut avoir NjVNa = NgVNj, parce que cela modifierait le rapport
sujet-objet avec le verbe; mais on peut avoir N2V*NX comme équivalent
de NjVNa parce que là le verbe aussi est modifié de façon à ce que soit
préservé son rapport grammatical avec les noms inversés. II est
absolument essentiel de préserver les rapports grammaticaux, car ces rapports
existent toujours entre les morphèmes d'une phrase. Autrement dit, il y a
des restrictions de commutabilité d'ordre et d'intonation entre les
différents morphèmes (ou classes de morphèmes) d'une phrase et, quand nous
passons d'une phrase à une phrase équivalente, nous voulons pouvoir
retrouver les mêmes restrictions quand nous reviendrons à la phrase de
base — puisque cette phrase de base, comme toute phrase, se définit par les
restrictions qui lient ses différentes parties. Par conséquent, quand nous
divisons une phrase en différents segments pour dresser un tableau, nous
ne voulons pas que deux combinaisons des mêmes classes d'équivalence
(par exemple les deux premières combinaisons TE ci-dessus) représentent
des rapports grammaticaux différents. C'est pourquoi, quand nous
transformons une phrase qui contient certaines classes d'équivalence, nous
prenons soin de conserver leurs rapports grammaticaux originels.
Cependant, nous trouvons quelquefois des morceaux de phrase qui
ne contiennent aucune de nos classes d'équivalence; autrement dit (dans
le cas le plus simple), ils ne contiennent aucun matériau qui se retrouve
ailleurs dans le texte. Le rapport grammatical entre les morceaux uniques
et le reste de la phrase doit être conservé dans notre disposition en tableau,
au même titre que celui des morceaux récurrents. Mais nous n'avons pas
à nous préoccuper de conserver leur rapport quand leur position relative
change, puisque nous n'avons pas de raison de changer leur position
relative : c'est seulement les classes d'équivalences que nous voulons
redisposer. Pour ce matériau non récurrent, nous voulons seulement
connaître son rapport aux classes d'équivalence et indiquer ce
rapport dans l'analyse. L'étude du texte seul ne suffira peut-être pas, mais
nous pouvons y arriver en faisant appel aux données grammaticales ou
à la variation expérimentale. Revenons par exemple aux séquences Casais,
who is self-exiled from Spain et the self -exiled Casals... Si cette dernière
orme est S2 C, la première est C, C is S2 from Spain; puisque from Spain
37

est unique, tout ce que nous voulons savoir, c'est où le mettre quand nous
disposons nos classes d'équivalence, autrement dit, quel est son rapport
à ces classes. La grammaire nous apprend que dans des phrases de la forme
NV APN l'unité minimale, dont PN est un constituant immédiat, est APN
et que ce APN peut être remplacé par A tout seul 19. Par conséquent, si le
A se trouve être membre d'une de nos classes d'équivalence alors que le
PN ne l'est pas, nous associons le PN à A dans sa colonne d'équivalence
en écrivant APN au lieu de A tout seul comme membre de la classe.
De façon plus générale, le matériau qui n'appartient à aucune classe
d'équivalence, mais qui est lié grammaticalement à un membre d'une classe,
est joint à ce membre pour former un membre élargi de la classe en
question; ainsi self-exiled from Spain est maintenant dans la même classe que
seïf-exiled. Ceci se justifie par le fait que, puisque ce matériau ne se retrouve
nulle part ailleurs dans le texte (ou ne s'y retrouve que dans le même
rapport grammatical à la même classe d'équivalence), son seul effet, quand on
représente le texte par ses classes d'équivalence spécifiques, est
précisément son rapport au membre spécifique auquel il est grammaticalement lié.
On rencontre un cas particulier assez intéressant quand deux membres
de la même classe d'équivalence constituent conjointement l'unité
immédiatement supérieure de leur phrase (c'est-à-dire quand ils sont les
constituants immédiats de cette unité), quand, par exemple, ces deux membres
sont un adjectif suivi d'un nom, avec AN = N. Dans ce cas, nous pouvons
considérer que ces membres constituent à eux deux un seul membre de
leur classe commune et entrent tous deux dans un seul segment. Si nous
les considérions comme deux occurrences de leur classe commune, il nous
faudrait mettre chaque occurrence dans un segment distinct.
Les données grammaticales sont particulièrement utiles quand il
s'agit de reconnaître les particules conjonctives. Il est facile d'identifier
ces morphèmes à partir de la grammaire formelle, tout à fait
indépendamment de leur sens, mais il peut être difficile de les identifier dans
l'analyse purement contextuelle. Leur importance réside dans le fait que
beaucoup de phrases d'un texte peuvent contenir les mêmes classes, à part
quelques mots non classés, souvent situés au début, dont la fonction
grammaticale est de lier ou d'introduire les phrases, et qui n'entrent pas dans
les classes spécifiques qui couvrent la phrase ou le segment. Dans notre
disposition en tableau, nous mettrons ces éléments, en raison de leur
position grammaticale, dans une colonne spéciale au début. Nous pouvons
même aller plus loin et mettre dans cette première colonne tout matériau
qu'on ne peut faire entrer dans aucune des colonnes d'équivalence. Ce
matériau conjonctif n'est pas toujours immédiatement évident;
remarquons qu'on peut analyser beaucoup de phrases de la forme JVV that
N1V1 comme constituées des classes d'équivalence N^, le NV that étant
relégué dans la première colonne; par exemple dans la phrase We are proud

19. Sémantiquement, on dira que PN « modifie » le A.


38

that these concerts were recorded by our engineers, les membres connus des
classes d'équivalence sont concerts et recorded; les mots qui les précèdent
ne se retrouvent pas dans le texte et ne sont liés grammaticalement à aucun
membre d'une classe; bien au contraire, du point de vue grammatical
on peut les remplacer par des adverbes introductifs comme indeed, même si
au sens purement grammatical ils sont en fait le sujet et le verbe
principaux de la phrase.
En plus des rapports grammaticaux des classes grammaticales tout
entières, on peut utiliser des informations concernant le rapport entre
des morphèmes spécifiques ou des sous-classes grammaticales et les classes
grammaticales; on peut par exemple établir que (dans certaines langues)
les verbes intransitifs forment une sous-classe qui ne se trouve jamais
accompagnée d'un objet et qui est équivalente à un verbe transitif
accompagné d'un objet. Dans un texte donné, cela peut nous permettre de mettre
un verbe transitif et son objet dans la même classe qu'un verbe intransitif
ayant une position comparable.
Enfin un grand nombre d'équivalences détaillées s'appliquent à des
morphèmes spécifiques. Les renseignements concernant ces équivalences
ne nous sont pas fournis par la linguistique descriptive, qui traite
généralement de classes entières, mais on peut les obtenir par des méthodes
linguistiques puisqu'ils concernent des occurrences couplées et des
restrictions spéciales — bien que dans la plupart des cas il soit nécessaire
d'étudier ces restrictions en considérant plus d'une phrase à la fois. Supposons,
par exemple, que nous trouvions les mots buy et sell dans un texte. Leurs
environnsments dans ce texte peuvent ne pas se ressembler assez pour nous
permettre de les ranger dans la même classe d'équivalence, en dépit des
avantages que cela pourrait avoir pour l'analyse. Mais si nous examinons
un certain nombre d'autres textes assez courts où ces deux mots figurent,
nous constaterons qu'ils apparaissent souvent dans des environnements qui
se correspondent et que, à certains égards, ce sont des inverses distribu-
tionnels; autrement dit, nous trouvons de nombreuses phrases comme
N-t buys from N2 : N2 sells to Nt (I bought it from him at the best price I could
get, but he still sold it to me with a profit). Si les environnements de buy et
sell dans notre texte sont semblables aux environnements couplés des
autres textes, nous pourrons quand même, en considération de ces
résultats plus généraux, mettre les deux mots dans la même classe
d'équivalence, ou même les analyser comme étant inverses l'un de l'autre.
De cette façon on peut mettre dans une même classe contextuelle
plus de mots qu'il ne serait possible autrement, et on peut faire usage de
ce qui paraît être des liaisons sémantiques spéciales entre des mots (comme
entre buy et sell ou même entre un verbe transitif et la présence d'un
complément d'objet), sans sortir du cadre d'une étude purement formelle
des occurrences. La raison en est qu'il y a un haut degré de corrélation
entre les différences de sens et les différences de distribution linguistique;
et si, dans les limites d'un texte, on ne peut pas montrer les similitudes
39

de distribution entre deux mots liés, on peut souvent y arriver dans un


plus grand choix de textes, même très courts.
Nous n'avons fait qu'esquisser ici, avec quelques rares exemples, le
genre d'information extérieure qu'on peut utiliser, à la fois parce que le
domaine est vaste et parce qu'il y a encore beaucoup à faire. Des travaux
plus approfondis dans ce sens, non seulement seront utiles à l'analyse de
discours, mais constitueront également une extension intéressante de la
linguistique descriptive.

Résultats

8. — Le tableau a double entrée.

L'analyse du discours nous donne une succession de segments


contenant chacun certaines classes d'équivalence. Pour les disposer en tableau20,
nous écrivons les segments les uns au-dessous des autres dans l'ordre du
texte, les membres successifs de chaque classe formant une colonne comme
au paragraphe 5.4., ce qui donne pour le texte très court du
paragraphe 7.2. :

CS2 (S2 après C est is S2)


CS2 (= S2 G sans le is)
CS
(= MN; R^, = is N)

NR2
Les rangées indiquent les classes d'équivalence présentes dans chaque
segment, selon leur ordre (ou un autre rapport) à l'intérieur du segment;
les colonnes indiquent les membres spécifiques de chaque classe présents
dans les segments successifs. Le matériau qui ne rentre dans aucune classe
d'équivalence, mais qui est lié grammaticalement à un membre
spécifique d'une classe entre avec ce membre dans sa colonne, ainsi in Spain
est compris dans le premier S2. Le matériau qui ne rentre dans aucune
classe d'équivalence et qui n'est pas lié grammaticalement à un membre
spécifique d'une classe entre dans une colonne spéciale au début (ici non
représentée), qui se révélera contenir des morphèmes qui lient les phrases
20. Le tableau donné ici représente les phrases suivantes, extraites d'une
chronique concernant des disques récemment sortis : Casals, who is self-exiled from Spain,
stopped performing after the fascist victory... The self-exiled Casals is waiting across the
Pyrenees for the fall of Franco... The memorable concerts were recorded in trades... The
concerts were recorded first on tape. (Les autres phrases analysées en 7.2. ont été inventées
par moi à des fins de comparaison.) Ces phrases ne constituent pas un fragment continu
du texte, ce qui limite très sérieusement la pertinence du tableau à double entrée;
mais cela n'a pas d'importance ici, puisque ce tableau sert seulement à illustrer
l'organisation de ces dispositions.
40

ou les segments entre eux, ou indiquent un changement dans plusieurs


classes d'un unique segment. Cette disposition en tableau donne donc du
texte originel à une dimension une représentation à deux dimensions,
dans laquelle chaque élément a deux coordonnées : l'une horizontale,
par rapport aux autres éléments du segment auquel il appartient; l'autre
Verticale, par rapport aux autres membres de sa classe.
On peut considérer que ce tableau à double entrée représente le
texte tout entier, puisque tous les morphèmes du texte appartiennent
à une classe ou à une autre du tableau et puisque celui-ci conserve les
rapports entre les morphèmes. Même quand on a effectué de nombreuses
transformations contextuelles et grammaticales, les classes et leurs
membres sont définis à chaque étape de manière à ce qu'on puisse toujours
reproduire le texte en partant du tableau et de la définition complète des
classes qu'il contient. Il se peut que les segments du tableau, considérés
séparément, ne soient pas « idiomatiques », c'est-à-dire qu'ils ne
figureraient pas de façon naturelle dans la parole; mais la méthode n'exige pas
qu'on préserve la langue idiomatique : tout ce que nous Voulons, c'est
que la succession des segments soit équivalente contextuellement et
grammaticalement au texte original. Même si le tableau suggère une
critique littéraire ou une amélioration possible du texte, il n'est pas destiné
à remplacer l'original.
On peut aussi considérer que ce tableau à double entrée indique les
rapports purement distributionnels qu'entretiennent les classes
d'équivalence qui s'y trouvent. En se plaçant à ce point de Vue, on peut
travailler sur l'agencement en tableau, et examiner ses propriétés. On peut
trouver des moyens de simplifier le tableau, en retirant par exemple les
éléments communs, ou en rassemblant des groupes de séquences
équivalentes plus importants que ceux utilisés dans la confection du tableau.
On peut apprendre à traiter différents cas particuliers, comme par exemple
une classe mobile qui entre dans un rapport étroit tantôt avec une classe,
tantôt avec une autre, ou qui figure un nombre différent de fois dans
divers segments. On peut essayer de régulariser ou de « normaliser » le
tableau en harmonisant tous les segments, pour établir un unique
segment « normal » auquel on pourra comparer tous les segments réels : par
exemple, étant donné un segment où une des classes ne figure pas, on
peut essayer de le transformer en un segment contenant toutes les classes
(en préservant l'équivalence au cours de la transformation). On peut
essayer de formuler une règle générale couvrant les modifications subies
par les membres successifs d'une classe en descendant une colonne, pour
tenter d' « expliquer » ou de « prédire » la forme spécifique prise par les
classes de chaque segment — c'est-à-dire pour dériver les segments
successifs à partir de la forme normale.
Toutes ces opérations sur le tableau ont pour effet d'isoler les éléments
indépendants les plus généraux à partir desquels on peut décrire le texte
(en dernière analyse les axes horizontal et Vertical), et de faire ressortir
41

les rapports qu'ils entretiennent dans le texte. En ce sens, toutes ces


opérations ne sont que des raffinements de nos procédures initiales.

9. — Résultats.

On peut tirer diverses conclusions sur un texte particulier (ou un


certain type de texte) en étudiant les propriétés de son tableau à double
entrée, directement ou sous forme simplifiée. On aurait sans doute pu
arriver à beaucoup de ces conclusions intuitivement et sans cette analyse
formelle, mais l'intuition donne des résultats qui ne sont ni explicites ni
rigoureux. De plus, à certains égards, la complexité et la masse du
matériau nous mettent dans l'impossibilité de tirer toutes les conclusions
pertinentes sans une analyse formelle et minutieuse. Les textes que nous
avons été amenés à choisir ici à titre d'échantillon sont trop courts et
trop simples pour montrer quel genre de conclusions l'analyse donne sur
un texte ou un style particulier — nous réserverons ceci pour une
présentation ultérieure d'un échantillon plus long, bien que seule l'analyse de
très nombreux discours puisse montrer les détails de la méthode et la
gamme de conclusions auxquelles elle permet d'aboutir. Pour donner une
petite idée de ces conclusions, nous allons achever l'analyse de notre
premier texte (paragraphe 6). L'analyse en était restée à ceci : P a comme
membres Millions, Four out of five people in a nation wide survey, You
too wilt, (and) your whole family will. W a comme membres Can't be wrong,
Prefer X- to any hair tonic... 've used. Quatre des phrases, y compris le
titre, sont représentées par cinq segments PW.
Arrivé là, on peut difficilement continuer sans avoir recours à
l'équivalence grammaticale (cf. 10 n). Dans four out of fwe... say they prefer...
nous avons P et W mais aVec say they entre les deux. Si notre texte se
trouvait contenir they et four out of five dans des environnements
équivalents, nous pourrions analyser directement cette phrase. Comme ce
n'est pas le cas, nous faisons appel à l'équivalence grammaticale de they
au nom qui le précède et qui est situé de façon comparable : four out of
five..., sujet de say, parallèle à they, sujet de prefer. Nous mettons donc
they dans la même classe P que four out of five... La phrase devient alors
P say PW, qui se décompose en deux segments P say : PW, par
application de la formule NV (that) NV = NV : NV; par conséquent, say est
membre de W, puisque, à la suite deP, il forme avec Pun segment complet.
Venons-en maintenant à la, dernière phrase : You too will be satisfied.
Nous savons que la première partie est membre de P; donc be satisfied
est inclus dans W.
Ceci nous donne un point de départ pour l'analyse de la phrase
précédente Every year, we sell more bottles of X- to satisfied consumers.
Grammaticalement, X- to satisfied consumers est X- to AN, qui est équivalent à
X- to N : N is A. Nous obtenons ainsi un segment consumers are satisfied;
42

et puisque la seconde partie de ce segment est W, nous mettons consumers


dans P. Le reste de la phrase contient de nouvelles classes : puisque bottles
se retrouve ailleurs dans le texte, nous le considérons comme
représentant une classe possible d'équivalence, et nous le notons B; à cette
occurrence de B nous associons le mot more, qui ne se retrouve pas ailleurs et
qui est lié grammaticalement à bottles. Puisque sell se retrouve dans sold
(== sell + morphème de passif), nous le notons S et nous lui associons
every year, qui lui est lié grammaticalement. (Every year n'est semblable
que par un morphème à since... years ago de la première phrase; plutôt
que d'essayer de faire entrer ces syntagmes dans de nouvelles classes
d'équivalence, nous remarquons que chacun d'eux est lié au membre de S
qui lui est proche, et nous associons chaque syntagme à son membre
de S). Il reste we, qui, grammaticalement, ne fait partie ni du syntagme B
ni du syntagme S; en dépit du fait qu'il ne paraît pas se retrouver ailleurs,
nous le mettons, à titre d'essai, dans une nouvelle classe /. (Nous Verrons
plus loin qu'on peut considérer qu'il y a une forme zéro de / dans la
première phrase.) Nous obtenons ainsi ISB to P; ce qu'on peut encore
simplifier, puisque c'est grammaticalement équivalent à ISB : IS to P.
Enfin, il y a la première phrase : Millions of consumer bottles of X-
have been sold since its introduction a few years ago. Si nous prenons
comme point de départ Millions, membre reconnu de P, nous nous
trouvons en face d'un reste, commençant par of, que nous ne pouvons
pas analyser. Rapprochons plutôt bottles of X- have been sold de we sell
bottles of X-. La première séquence est de la forme NXV, la seconde de
la forme N^V^. Grammaticalement, have been sold est sell + passé +
passif; donc, si nous prenons sell comme V, been sold est V*.
Grammaticalement aussi, V + passif + by N est équivalent à V + passif (is sold
by us = is sold). L'absence de tout by us après sold ne nous empêche donc
pas de rapprocher les deux propositions; de we sell bottles (N2VNX) nous
rapprochons bottles have been sold (NjV* = N± V*IV2); nous pouvons même
dire que le morphème de passif, suivi ou non de 1' « agent » (by + N),
est équivalent au sujet du verbe actif (c'est-à-dire le verbe sans le
morphème de passif). Si we sell bottles of X- est ISB, alors bottles of X- have
been sold est l'équivalent BS*I avec / zéro. Nous associons au S* qui le
précède le morceau since... years ago, comme faisant aussi partie du
morphème de passé, puisque ni l'un ni l'autre ne se retrouve ailleurs dans nos
classes d'équivalence. Millions et consumer sont tous deux membres
de P 21, mais il n'y a pas moyen de tirer parti de ce fait.
Grammaticalement, consumer bottles est N^N^ = 2N, et millions of N2 est N3PN2= AT2;
ainsi toute la séquence est liée grammaticalement à bottles (de la même
façon que more était lié à bottles, cf. plus haut), ce qui laisse la phrase

21. Nous avons consumer dans P; et puisque la distinction singulier-pluriel ne


figure pas dans nos classes, nous pouvons lier la chute du -s à l'occurrence de consumers
dans la première phrase. En enlevant le s de l'élément P consumers, nous obtenons une
forme P consumer pour la phrase.
43

sous la forme BS*I. Ceci signifie qu'il y a deux occurrences de mots P


qui se perdent par l'inclusion dans une occurrence de B. Ce millions et
ce consumer n'ont pas d'autre rapport distributionnel avec une autre
occurrence de classe dans le texte (sauf leur analogie à more); il n'y a
donc pas moyen de les faire entrer dans le tableau à double entrée. Les
mêmes morphèmes se retrouvent bien ailleurs comme membres de P,
mais dans des rapports différents avec d'autres classes.
Ceci met en évidence le rapport trompeur entre le titre et la première
phrase. Si nous prenons le titre comme point de départ, nous trouvons
Millions dans la première phrase et, en nous fondant sur notre analyse
du titre, nous le mettons dans la classe P, pour nous apercevoir alors
qu'il n'y a pas de classe P dans l'analyse finale de la phrase. (Les millions
qui ne peuvent se tromper se révèlent être des bouteilles 22.) Si nous
commençons par le slogan lui-même, nous avons une classe P (four out
of five; you) qui est liée à W, et une classe B (bottles, millions of. ..bottles)
qui est liée à S; et si nous en venons alors au titre, nous trouvons que le W
est précédé non par un membre connu de P, ni par un mot nouveau que
nous pourrions ranger dans P, mais par un mot qui ailleurs a été associé
à un membre de B. (Les bouteilles se révèlent être des gens.) Voilà le
résultat formel obtenu, qui est parallèle à ce qu'on aurait pu dire comme
critique sémantique — à savoir que le texte du slogan (des millions de
bouteilles vendues — tant de gens ne peuvent pas avoir tort de
préférer X-) ne répond pas au titre (des millions ne peuvent pas avoir tort).
Le tableau à double entrée du slogan ne présente pas grand intérêt
en lui-même :
PW Millions of people can't be wrong!
BS*I (le B contenant le pseudo P) Millions of consumer bottles...
have been sold...
CPW And four out of five people... say
PW they prefer X-...
P Four out of five people... can't be wrong.
PW you too will prefer X~...
PW your whole family wilt prefer X-...
BS*I (= ISB) Every year we sell more bottles of X-
S*I to P we sell to consumers
PW You too will be satisfied!

10. — Interprétations.

Les résultats formels obtenus par ce genre d'analyse font plus que
définir la distribution des classes, la structure des segments ou même la
22. Puisque millions of consumers serait un syntagme anglais courant (Pt of P2
= P2), l'emploi de la séquence presque identique millions of consumer devant bottles a
pour effet de donner une première impression que la phrase parle de P; mais quand on
atteint le mot bottles on voit que le sujet de la phrase est B, les mots P n'étant
qu'adjectifs de B.
u

distribution des types de segments. Ils peuvent aussi révéler des


particularités à l'intérieur de la structure, par rapport au reste de la structure.
Ils peuvent montrer en quoi certaines structures ressemblent à d'autres,
ou en quoi elles en diffèrent. Ils peuvent conduire à de nombreuses
conclusions concernant le texte.
Tout ceci cependant est encore distinct de Y interprétation des
résultats, qui doit tenir compte du sens des morphèmes et poser la question
de savoir ce que l'auteur Voulait faire quand il a écrit ce texte. Cette
interprétation est bien entendu tout à fait distincte des résultats formels, bien
qu'elle puissse les suivre étroitement dans les voies qu'ils ouvrent.
Même les résultats formels peuvent conduire à des conclusions d'un
intérêt plus général et qui dépassent le texte. L'examen de divers types
de structure d'énoncé peut mettre en évidence des corrélations avec la
personne ou la situation qui est à l'origine du texte, sans la moindre
référence aux significations des morphèmes. Il peut aussi montrer quelles
sont les faiblesses — d'un point de vue donné — inhérentes à un certain
type de structure et quelles sont celles que l'on peut supprimer. Il peut
révéler la présence des mêmes types de structure dans des textes différents,
et il peut peut-être montrer les avantages de types particuliers de structure
pour des textes futurs ou pour du matériau non linguistique.
Enfin cet examen remplit la fonction importante d'indiquer quels
segments supplémentaires peuvent être ajoutés au texte sans en changer
la structure. Il est souvent possible de montrer que si nous ajoutons aux
différentes combinaisons de classes que nous trouvons dans les segments
du texte, des segments contenant certaines combinaisons nouvelles de
classes, la description de la structure d'énoncé devient plus simple et
les exceptions disparaissent (pourvu que nous gardions intactes les
exceptions intrinsèques, comme par exemple les conditions de délimitation).
L'addition de ces segments peut rendre le texte plus régulier du point de
vue de l'analyse du discours. Si, par exemple, le texte contient AB : AG : ZB,
on peut dire que Z est équivalent au second degré à A, puisque tous deux
se rencontrent devant B, mais A seulement se rencontre devant C. S'il
n'y a pas d'exceptions intrinsèques au texte qui affectent cette restriction
concernant Z, on peut ajouter le segment ZC au texte. Dans ce texte
augmenté, l'équivalence A = Z est maintenant une question de parfaite com-
mutabilité dans une gamme identique d'environnements, et non plus
seulement le résultat secondaire d'une chaîne d'équivalences. L'addition
de ces segments ne ressemble en rien à l'addition au texte de segments
arbitraires. Cette recherche des segments que l'on peut ajouter devient
particulièrement intéressante si l'on Veut savoir ce qui est impliqué mais
n'est pas explicitement formulé dans un texte donné, ou si l'on veut voir
ce que l'on peut tirer d'un texte donné en plus de ce que l'auteur y a déjà
mis.
45

RÉSUMÉ.

L'analyse du discours effectue les opérations suivantes sur tout texte


suivi, considéré individuellement. Elle rassemble les éléments (ou séquences
d'éléments) dont les environnements à l'intérieur d'une phrase sont
identiques ou équivalents, et les considère comme équivalents entre eux
(c'est-à-dire, membres de la même classe d'équivalence). Le matériau qui
n'appartient à aucune classe d'équivalence est associé au membre (d'une
classe) avec lequel son rapport grammatical est le plus étroit. On divise
les phrases du texte en segments, constitués chacun d'une succession de
classes d'équivalence, de façon à ce que chaque segment obtenu soit aussi
semblable que possible, par des classes qui le composent, aux autres
segments du texte. On examine alors la succession des segments pour repérer
la distribution des classes qu'elle offre et, en particulier, pour repérer des
schémas d'occurrence de classes.
Ces opérations ne font appel à aucune connaissance concernant le sens
des morphèmes, l'intention de l'auteur, ou sa situation. Elles n'exigent
que la connaissance de la limite des morphèmes, y compris les junctures de
phrase et autres intonations morphologiques (ou ponctuation).
L'application de ces opérations peut être renforcée par l'utilisation des équivalences
grammaticales (ou rapports d'occurrence de morphèmes individuels),
tirées de toute la langue ou du corps linguistique dont le texte en question
fait partie. Dans ce cas, il est nécessaire de connaître les classes
grammaticales des différents morphèmes du texte.
L'analyse du discours donne une foule de renseignements sur la
structure d'un texte ou d'un type de texte, ou sur le rôle de chaque élément
dans cette structure. La linguistique descriptive, elle, ne décrit que le rôle
de chaque élément dans la structure de la phrase qui le contient. L'analyse
du discours nous apprend, de plus, comment un discours peut être bâti
pour satisfaire à diverses spécifications, exactement comme la linguistique
descriptive construit des raisonnements raffinés sur les façons dont les
systèmes linguistiques peuvent être bâtis pour satisfaire à diverses
spécifications. L'analyse du discours donne aussi des renseignements sur
des fragments de discours plus longs que la phrase; ainsi, il se révèle qu'il
y a des rapports entre les phrases successives, mais que ces rapports ne sont
pas visibles dans la structure de phrase (en termes de ce qui est sujet et
ce qui est prédicat, etc.), mais le sont dans le scheme d'occurrence des classes
d'équivalence dans les phrases successives.

Traduit par Françoise Dubois-Charlier


Paris.

Vous aimerez peut-être aussi