Vous êtes sur la page 1sur 29

Franois RASTIER

CNRS, INaLF, Paris / CLF, Paris IV

LA SMANTIQUE DES THMES OU LE VOYAGE SENTIMENTAL


II aurait fallu juger des paroles par les sentiments et non pas des sentiments par les paroles. (Bossuet)

Malgr sa place, cette tude n'est pas une conclusion ni une synthse. Simple contribution personnelle, elle n'engage aucunement les autres collaborateurs du volume. L'occasion que j'ai eue de lire l'ensemble me permet simplement un regard rtrospectif. I. Pour dfinir le thme La notion de thme tient une place particulire dans le paysage intellectuel franais. La critique thmatique issue de Bachelard a t si bien accepte par les autorits acadmiques que les programmes des concours l'honorent rgulirement, et les sujets de mmoire ou de thse qui s'en inspirent se comptent par centaines chaque anne. Elle s'est tant diffuse que bien des recueils de textes l'usage des coliers, du petit classique au manuel, sont maintenant organiss par thmes. Fort utilise, la notion de thme reste en gnral intuitive1. Du moins, les dfinitions ordinaires n'ont pas de rapport prcis avec les sciences du langage. Par exemple J.-P. Richard, dont les tudes thmatiques se signalent par leur finesse ingale, dfinit le thme comme un principe concret d'organisation, un schme ou objet fixe autour duquel aurait tendance se constituer un monde ( 1961, p. 24). Ce vocabulaire d'inspiration philosophique rend hommage Merleau-Ponty, et plus gnralement la phnomnologie existentielle. La notion philosophique de thme nous parat insuffisante. Soit elle dsigne une catgorie transcendantale, ou un schme, voire un archtype au sens jungien, alors que notre objectif est de montrer la formation et l'volution des thmes au

224

L'ANALYSE THMATIQUE DES DONNES TEXTUELLES

sein d'une smantique historique et compare, partie intgrante d'une smiotique des cultures non d'une anthropologie philosophique2. Soit elle s'applique la relation d'un sujet au monde, et veut en faire la cause de son langage, alors mme que cette relation est mdiatise par son expression. Dans les deux cas l'autonomie relative du smiotique se trouve lude, le monde ou le sujet philosophique gouvernant la problmatique du thme. Dfinir plus gnralement le thme comme un concept ou comme une relation affective le maintiendrait l'cart des sciences du langage. Du moins, les dfinitions qui ont cours doivent-elles tre rapportes l'analyse linguistique des textes, et rlabores dans ce cadre. En linguistique, le thme pourrait se dfinir par diverses voies, selon qu'on privilgie le signe ou le texte, et dans le signe, le signifiant ou le signifi. a) La voie lexicographique dfinit le thme comme un mot-vedette, gnralement un substantif, auquel sont rapports divers parasynomymes ou quivalents partiels. Un dictionnaire de thmes sera donc un sousensemble d'un dictionnaire. Cette voie est lie une linguistique du signe. b) La voie smantique ne confre pas de prminence un mot-vedette identifi par son signifiant. Elle met en vidence des rseaux de rcurrences smantiques. Elle relve plutt de la linguistique du texte que de la linguistique du signe. Explorons donc cette voie. a) La voie smantique Nous nommerons thme une structure stable de traits smantiques (ou smes), rcurrente dans un corpus, et susceptible de lexicalisations diverses. Cette dfinition provisoire va tre spcifie, en caractrisant ces traits, ce corpus, et ces lexicalisations ; puis en posant la question de l'interrelation des thmes entre eux et des paradigmes thmatiques. (i) La notion de catgorie smantique est trop vague3 et l'on convient de distinguer entre smes gnriques et spcifiques (cf. Portier, 1974) : les uns indexent les smmes dans des classes (taxmes, domaines et dimensions), les autres les opposent aux membres de leur classe de dfinition. La rcurrence d'un sme gnrique induit une isotopie gnrique. Et parfois, dans son acception gnrale, le mot thme est employ pour dsigner le sujet d'un texte, c'est--dire son isotopie gnrique dominante, ordinairement un domaine smantique4. Par exemple, on pourra caractriser (trs faiblement) La Princesse de Clves comme un roman d'amour. Nous avons parl ce propos de thme gnrique, ce qui est quelque peu abusif, car une isotopie n'est pas une structure5.

LA SMANTIQUE DES THMES

225

En revanche, un thme spcifique peut se dfinir comme une molcule smique, c'est--dire un groupement structur de smes spcifiques. Une molcule se reprsente par un graphe smantique, dont les nuds sont tiquets par des smes, et les liens, par des primitives smantiques (cas et relations structurales). En voici un exemple6.
Excursus 1 : De l'ennui On hsite revenir sur l'ennui aprs la thse de Sagnes (1969), les tudes de Bouchez (1973), et d'veline Martin (1993, pp. 146-202) et de David Erlich ici mme. Mais les donnes dj recueillies, publies et labores nous permettront d'abrger notre illustration. Un sentiment est une structure actantielle o un actant humain se trouve affect d'valuations. Cette structure peut tre reprsente par un graphe smantique7, qui dcrit sa molcule smique. Dfinissons d'abord le contenu du graphe ci-dessous en soulignant de faon diffrencie les tiquettes de ses nuds et de ses liens. Le graphe se divise en deux sections : l'une nie (dsormais N) dcrit la possession d'un objet de valeur, l'autre affirme (dsormais A) l'action du sentiment sur le sujet. Voici les smes constituants de la molcule smique suivis de quelques expressions typiques. L'actant Ego n'est pas spcifi autrement que par le sme /humain/. Les autres smes sont propags par le contexte. Il est Ergatif dans N, et Accusatif dans A. L'agent est dfini alors par le irait /sentiment/ ; les autres spcifications de l'ennui sont dfinies par les relations entre l'agent et le reste du graphe. L'actant Accusatif dans N est spcifi par une valuation positive /mlioratif/. Le procs dans N est ni. On trouvera donc dans les contextes le sme /privation/, exprim par des tours ngatifs (aucun moyen de comprendre, aucune occupation, ne sachant que faire, il ne rencontre rien de ferme, sans que le dsir s'y mlt) ; des prfixes (inaction, impossibilit). D'autres expressions ne sont ngatives que par infrence (ex. : vide, mains ballantes, province). Dans A, le procs est caractris par deux attributs smiques : /imperfectivit/ : indfiniment, hbtude mditative, langueurs de moribond, abattement sans bornes ; mais aussi l'emploi frquent de temps verbaux imperfectifs, notamment l'imparfait ; ou encore araigne, dimanche. /itrativit/ : dsagrge, dvore, ptrit, ronge, lpre, habitudes sans cesse recommenantes, les jours se succdaient, une rgularit monotone, il retrouvait [...] le mme ennui. Dans ces expressions, les deux smes sont frquemment lexicaliss ensemble* : ex. errer. Le rsultat du procs est un attribut /dysphorie/affect Ego, et qui se lexicalis par des expressions comme : vide, hbtude, endort, alanguir.

226

L'ANALYSE THMATIQUE DES DONNES TEXTUELLES

N.B. : ERG abrge ergatif, ACC accusatif, ATT attributif, RES rsultatif ; - symbolise la ngation. Ces graphes sont des types, car certains de leurs nuds, tiquets en capitales, peuvent ne pas tre instancis (comme le rappelle le symbole x). La capacit descriptive de cette reprsentation peut tre mise l'preuve sur des exemples, de manire souligner aussi comment les crivains s'approprient le thme. Quand Prvert crit : ceux qui crvent d'ennui le dimanche aprs-midi parce qu'ils voient venir le lundi (Paroles, 1946, pp. 19-20), il remotive le dimanche, frquemment associ l'ennui, par le sme /imperfectif. Par la menace du lundi, topos du populisme de l'poque9, il fait du travail ce qui gche mme l'inaction.

LA SMANTIQUE DES THMES

227

Ou encore, Barthes note : L'ennui n'est pas loin de la jouissance : il est la jouissance vue des rives du plaisir (1973, p. 43), il instancie par la jouissance l'objet du dsir dont Ego est spar (graphe N)- La sparation est figure par l'image du fleuve, qui reprend les traits /imperfectivit/ et /itrativit/. Et classiquement, le plaisir reste associ l'ennui (. Martin, op. cit., p. 108, relve dans des contextes antrieurs : l'air d'ennui dans les treintes ardentes, l'ennui de cet accouplement), et il se trouve dans le graphe N sa place. Le remaniement lacanien du thme aura consist mettre la jouissance l o les potes fin de sicle plaaient l'azur.

(ii) Un thme, dfini comme molcule smique, peut recevoir des expressions diverses, par des units qui vont du morphme au syntagme. Nous les nommerons, pour simplifier, lexicalisations. On peut distinguer des lexicalisations synthtiques qui manifestent au moins deux smes, et des lexicalisations analytiques, qui n'en manifestent qu'un. Ainsi, un thme peut lre manifest de manire diffuse, par exemple dans un paragraphe o divers smes seront lexicaliss tour tour. La lexicalisation la plus synthtique ne jouit d'aucune prminence thorique par rapport aux autres lexicalisations : elle n'est pas le mot juste dont toutes les autres expressions ne seraient que d'imparfaits avatars10. Selon les discours et les genres, les normes de lexicalisation des thmes varient : la posie lyrique (la seule qui nous reste) cultive les lexicalisations analytiques, alors que dans les discours techniques, les synthtiques sont de rigueur. Mme si leur lexicalisation la plus synthtique relve d'une classe bien identifie, les thmes sont indpendants d'une classe smantique, ou plus exactement peuvent se manifester sur diverses isotopies gnriques. Par exemple, si l'on nomme Ennui la molcule smique qui comprend les traits /privation/ (notamment : /inactivit/), /imperfectif/, /itratif/ (souvent combins en /monotonie/), ce thme peut se manifester par araigne, par dimanche, ou par monotone. Il ne s'agit pas de mtaphores, car un thme spcifique est par principe indpendant de toute isotopie gnrique ; en d'autres termes, il n'y pas de mot propre, mme si le mot ennui reste une dnomination commode. Et alors que ce mot se rencontre seulement quatre fois dans Madame Bovary, les composants du thme apparaissent souvent, notamment propos de Charles. Par exemple, dans cette phrase clbre : La conversation de Charles tait [/imperfectif/] plate [/imperfectif/, /monotonie/] comme un trottoir de rue [/monotonie/], et les ides de tout le monde [/itratif/, /monotonie/] y dfilaient [/imperfectif/, /itratif/], dans leur costume ordinaire [/itratif/, /monotonie/], sans [/privation/] exciter d'motion [/euphorie/], de rire [/euphorie/] ou de rverie [/euphorie/] (I, vn)11. Cela rappelle le principe soulign par Hjelmslev qu'il n'y a pas d'isomorphisme entre les plans de l'expression et du contenu, malgr les vux d'une certaine linguistique du signe.

228

L'ANALYSE THMATIQUE DES DONNES TEXTUELLES

Les molcules smiques sont des formes smantiques simples, alors que les isotopies gnriques sont des fonds smantiques sur lesquels elles se prsentent la perception. Dans certains discours, le rapport entre forme et fond est univoque ; mais dans le discours littraire, des formes analogues peuvent se prsenter sur des fonds diffrents, qui sont entre eux dans des relations de hirarchie et de dominance. Quand deux occurrences de la mme molcule sont releves sur deux isotopies diffrentes, on peut les dire en relation mtaphorique. Mais l'orientation de cette relation dpend de la dominance entre isotopies et du parcours interprtratif qui l'tablit. En d'autres termes, frisson n'est pas une mtaphore de peur ; ces deux mots lexicalisent sur des isotopies gnriques diffrentes le mme thme. L'opposition entre les dimensions //physique// et //moral// est alors secondaire pour l'analyse thmatique. Il reste bien sr prciser l'incidence des fonds sur les formes, et les remaniements que peut apporter une molcule smique l'adjonction d'un trait gnrique12. Mais on voit pourquoi une thorie des classes smantiques reste utile, mais ne suffit pas constituer une thmatique, car elle ne concerne que les fonds. En prenant pour exemple les sentiments, nous entendons inventorier et dcrire les formes smantiques relies un mme fond de rfrence par le dploiement d'une classe smantique. Le rapport entre forme et fond souligne la dpendance de la perception smantique l'gard du contexte {cf. l'auteur, 1991, ch. VIII). Ce rapport n'est pas statique, et ne doit pas tre conu l'image d'une figure gomtrique sur un plan ; la comparaison avec la composition musicale ne serait pas mauvaise. Les formes ellesmmes ont en effet des modes de diffusion divers, et peuvent passer l'arrire-plan en constituant des faisceaux d'isotopies spcifiques. Ainsi un thme peut tre latent ou saillant, selon que des constituants sont pars ou regroups. b) Le palier de l'analyse thmatique La notion d'unit textuelle est quelque peu ambigu. Une analyse de texte peut en rester au palier du mot, comme le fait par exemple la statistique lexicale. Rappelons donc qu'un texte peut tre analys trois paliers principaux : micro-, mso-, et macrosmantique, qui correspondent au smme, au contenu de la priode, et la structure textuelle. Ces trois paliers correspondent d'une part des degrs de systmaticit dominants : systme fonctionnel de la langue, normes socialises, normes idiolectales. D'autre part, des zones de localit qui intressent la propagation des traits smantiques : elle est maximale au sein du syntagme ; bonne entre les syntagmes d'une mme priode ; entre priodes, cette propagation demande une prise en charge par des structures macrosmantiques.

LA SMANTIQUE DES THMES

229

Chaque trait smantique a un potentiel d'activation, qui se diffuse localement, en fonction des inhibitions et facilitations rgules par les structures morphosyntaxiques. Selon la nature des traits, et le mode de propagation de l'activation, on peut distinguer trois cas remarquables. L'actualisation d'un trait favorise sa ritration. En ce cas, et selon le statut de ce trait, cela constitue une isotopie gnrique ou spcifique. La production des antonymes, massivement atteste par les associationnistes du sicle dernier, est un exemple d'activation au sein d'un mme taxme, par la constitution d'une isotopie gnrique minimale. L'actualisation d'un trait favorise aussi la ritration des traits voisins dans la mme molcule smique : c'est pourquoi des lexicalisations partielles d'un mme thme sont frquemment cooccurrentes dans la mme priode, voire dans le mme syntagme. Ce phnomne pourrait tre appel paratopie. Il est l'uvre dans ce que l'on nomme les anaphores associatives13. Ces diffusions d'activation sont le corrlat smantique des phnomnes que la Gestalt nommait lois de bonne continuit, et que la psychologie cognitive tudie sous le nom gnral d'amorage (priming). Elles justifient smantiquement l'tude statistique des cooccurrences lexicales pour l'analyse thmatique. Le thme, par ses rcurrences, intresse la macrosmantique. Mais en tant qu'unit, il relve de la msosmantique. D'aprs nos relevs, ses lexicalisations diverses apparaissent gnralement dans un espace infrieur trois cents mots. Un espace de cinquante mots environ suffit pour identifier quatre occurrences d'un thme sur cinq. Prsenter la thmatique relativement aux diffrents domaines de l'analyse textuelle excderait l'objectif de cette contribution. Notons simplement les relations du thme par rapport aux autres composantes textuelles (c/. l'auteur, 1989,1). Relativement la tactique, le thme a des positions identifiables dans ses manifestations denses on peut relever des rythmes thmatiques. Relativement la dialectique, les occurrences groupes des corrlats d'un thme ont une mme position dans un intervalle dialectique ; et relativement la dialogique, elles sont situes dans un mme monde et dans un mme univers. Cela spcifie les thmes par rapport aux units des autres composantes smantiques, qui mettent en jeu des diffrences dialectiques, dialogiques, ou tactiques. Par exemple, un thme rcurrent dans plusieurs intervalles dialectiques et intgr des structures dialectiques se dfinit alors comme un acteur14. c) Les structures thmatiques et topiques Aux conditions statistiques de dfinition du thme s'ajoutent des conditions structurales.

230

L'ANALYSE THMATIQUE DES DONNES TEXTUELLES

Le problme de l'organisation paradigmatique des thmes se pose d'une faon diffrente de celle des paradigmes lexicaux proprement dits, car ils relvent d'un palier de complexit suprieur. Les classes de thmes ne relvent donc pas de la lexicologie, encore moins de la lexicographie15, mais de la thmatique ; ou de la topique, si l'on convient de nommer ainsi l'tude des formes smantiques strotypes au palier msosmantique16. Pour tracer la limite entre thme et topos, admettons qu'un thme est rcurrent au moins une fois dans le mme texte ; un topos au moins une fois chez deux auteurs diffrents. S'il existe des paradigmes thmatiques, la mthodologie de leur (re)constitution diffre sans doute de celle des paradigmes lexicaux, car ils n'ont pas le mme statut. Par rapport aux thmes, les smmes sont des units primaires, et qui sont rputes appartenir au systme de la langue, alors que les thmes relvent de normes socialises. La relation structurale la plus simple est l'antonymie. Et les tudes de cooccurrence lexicale, quand elles sont menes avec soin, montrent qu'un nom de sentiment est frquemment associ son antonyme17. Mais si l'antonymie est frquente au palier lexical, il n'est pas certain qu'elle soit gnralise au palier thmatique. Parmi les lexicalisations de thmes, certaines peuvent se trouver en relation d'antonymie, d'autres non. Quand elle est atteste, elle se manifeste par des sries d'oppositions smiques (alors que les smmes antonymes ne diffrent ordinairement que par un sme). Par exemple, le topos complexe de la fleur au bord de l'abme, fort rcurrent l'poque romantique, comprend deux thmes, Fleur et Abme, qui peuvent tre lexicaliss par ros, plante, gouffre, prcipice, vertige, profondeur, etc. Ils s'opposent par les catgories smiques /saillant/ vs /creux/, /fragile/ vs /puissant/, /attirant/ vs /repoussant/, /vivant/ vs /mortel/, /color/ vs /sombre/ {cf. l'auteur, 1989, p. 63). Mais on ne saurait gnraliser cet exemple, car l'antonymie lexicale entre smmes ne se traduit pas au palier suprieur par une antonymie entre les molcules smiques qui constituent les thmes18. Retenons que thmes et topo sont susceptibles de divers types de groupements. Une seule molcule smique comme celle de l'pe peut devenir partie d'un groupement qui met en relation deux molcules (ex. la Plume et l'Epe ; les Armes et les Amours ; la Maman et la Putain19). Les groupements ternaires sont lgion dans la tradition indo-europenne, en liaison de ce que Dumzil a appel l'idologie trifonctionnelle ; les groupements quinaires abondent en Chine (comme l'a soulign notamment Gernet) ; les septnaires dans l'antiquit moyen-orientale (sans doute sous l'influence du culte astral babylonien). Bref, ces groupements sont l'homologue des taxmes au palier lexical, mais leurs structures refltent des normes d'un autre ordre. Par ailleurs,

LA SMANTIQUE DES THMES

231

les couples antithtiques, comme les Armes et les Amours opposent et relient des domaines et dimensions topiques. On ne peut cependant transposer directement ce que l'on sait des structures lexicales aux structures thmatiques. C'est prcisment un des buts de la thmatique de reprer les regroupements de thmes, de faire la part entre topo et thmes personnels20 ; enfin, montrer les traitements personnels des topo, ou plus prcisment souligner comment les topo sont spcifis, voire remanis par leur contexte. d) L'tude des motifs Aprs le topos, un mot du motif, car thme et motif sont frquemment associs, dans une tradition qui remonte la folkloristique du sicle dernier21. Cette notion librale appelle des clarifications : malgr les propositions thoriques des formalistes russes, les listes de motifs ne sont pas distingues des inventaires de thmes, et selon les bibliographies, on y trouve aussi bien le Juif errant, le fminisme dans l'Enide, le mesmristne et le tabac. Trousson a nagure propos une distinction : un motif est une toile de fond, un concept large, dsignant soit une certaine attitude par exemple la rvolte soit une situation de base, impersonnelle, dont les acteurs n'ont pas encore t individualiss , alors qu'un thme serait l'expression particulire d'un motif, son individualisation [...] On dira que le motif de la sduction s'incarne, s'individualise et se concrtise dans le personnage de Dom Juan (1981, pp. 21-22). D reste une confusion des relations type/instance et fonction/acteur qui se conjoignent dans le rapport sduction /Dom Juan ; en outre, ces relations ne sont pas distingues des relations fond/forme (le motif est compar une toile de fond, comme chez Sauer). Les motifs peuvent tre (re) dfinis comme des structures textuelles complexes de rang suprieur (macrosmantique) qui comportent des lments thmatiques, mais aussi dialectiques (par changement d'intervalle temporel), et dialogiques (par changement de modalit). Par exemple, le motif du mort reconnaissant, relev par le Motif-Index of Folk-Literature de Thompson, est une structure thmatique et dialectique complexe, qui met en jeu des fonctions dcs, bienfait, et gratitude, ainsi que des acteurs humains. En somme, le motif est un syntagme narratif strotyp, et partiellement instanci par des topo, alors que le thme est une unit du palier infrieur, non ncessairement strotype, et qui se trouve dans toutes les sortes de textes. Bref, le thme est au syntagme narratif ce que le topos est au motif.

232

L'ANALYSE THMATIQUE DES DONNES TEXTUELLES

Soit, en bref :
Units thmatiques D'un discours ou d'un genre D'un texte Topos Thme Units dialectiques Motif Fonction, syntagme narratif

Ces formes sont susceptibles de degrs de typicit, selon que l'on considre dans une reprsentation par graphes seulement les tiquettes des liens, certaines tiquettes des nuds, ou toutes les tiquettes des nuds. N.B. : Le type, tel qu'il est dfini par Panofsky en iconologie (1967, p. 17), correspond explicitement au topos en histoire de la littrature chez Curtius. Proposons une prcision, d'aprs l'exemple de Panofsky : le topos de la femme l'pe devient un type ds lors par exemple qu'on l'identifie comme Judith. En ce cas un type est une sorte de topos, dont la molcule smique contient un nom propre.

Topo et motifs sont deux sortes de formes smantiques. Comme tels, ils ont une histoire, et sont tributaires de corpus. Leur tude relve de la smantique historique et compare, partie intgrante de la smiotique des cultures. En tudiant les sentiments nous avons voulu contribuer cette entreprise. Cela impose une dontologie philologique dans la dlimitation et l'exploitation des corpus ; cela suscite paralllement des questions hermneutiques. e) Le problme de la pertinence et l'assise hermneutique de la thmatique Comme toutes les units smantiques, un thme est un construit, non un donn : en cela, la thmatique dpend de conditions hermneutiques. Les dictionnaires et index thmatiques refltent l'tat moyen des conceptions contemporaines du thme. Si par exemple, comme l'a relev plus haut F. Surdel, le thme de la piti en est absent, c'est que les sentiments, a fortiori les sentiments charitables, sont de fait exclus du champ de la thmatique la franaise qui, influence notamment par Bachelard et Merleau-Ponty, s'est attache dcrire plutt les qualits sensibles que les qualits morales. A notre connaissance, aucun dictionnaire de thmes n'est encore construit partir d'un corpus, aucun ne part de considrations linguistiques. La plupart se bornent compiler des listes sans principe de dfinition commun, et dont des classements de bon sens cachent le caractre htroclite. L'intuition, indispensable, doit tre soumise un contrle mthodologique. De prtendus thmes comme l'agressivit sont des catgories descriptives gnrales qui peuvent correspondre des hypothses anthropologiques, non des thmes dans un corpus littraire classique. Le caractre anachronique des catgories descriptives doit tre problmatis : si l'agressivit est vieille comme Can, le concept d'agressivit est minemment moderne. Rendre justice aux textes du pass, pouvoir leur donner sens, c'est aussi apprcier ce qui nous en spare.

LA SMANTIQUE DES THMES

233

En outre, l'interprtation des donnes textuelles se place dans un cercle mthodologique dpendant du cercle hermneutique. L'analyse lexicale, dont la statistique est un auxiliaire, ne propose pas d'elle-mme des indices l'analyse thmatique. Toute slection de corpus, tout prlvement dans un corpus, tout recueil de donnes est tributaire de choix qu'il importe de rendre explicites. En d'autres termes, pour atteindre ses objectifs, la thmatique doit guider l'analyse lexicale, puis interprter ses rsultats qui sans cela resteraient inutilisables pour une smantique textuelle. Les logiciels d'interrogation imposent certaines dmarches, mais ne proposent rien. Ils servent confirmer ou infirmer des hypothses, qui dpendent de la stratgie d'interprtation.
Remarque : Plus gnralement, la notion de donne invite la prudence. En premier lieu, les informations non interprtables comme les frquences absolues ne mritent pas d'tre considres comme des donnes. D'autre part, les donnes textuelles n'ont rien de smantique, ce sont des chanes de caractres localises par quelques prcisions philologiques minimales : l'auteur, l'uvre, la date de l'uvre et la place dans l'uvre. Les chanes de caractres ont le mme type d'objectivit que les suites de chiffres. Elles sont galement dpourvues de sens : on peut les identifier, non les interprter. En somme, une donne est donne non l'observateur, mais par l'observateur, du seul fait qu'une hypothse a prsid son recueil. D'une part, toute acception est lie un genre et un discours, il importe donc, pour la rendre interprtable, de restituer cet entour. De la mme faon qu'en archologie, mler des vestiges d'un mme champ de fouilles conduit l'chec, mler des textes htrognes par le type de discours, le genre et l'poque, interdirait de restituer les normes smantiques qui sont notamment l'objet de la thmatique. Le choix d'un corpus rpond une attente globale. En outre, tout sous-ensemble du corpus convoqu par une requte rpond une attente plus prcise. L'art de l'interprtation j'adapte ici l'expression de Schleiermacher consiste alors croiser les requtes pour objectiver les attentes.

II. De l'analyse lexicale l'analyse thmatique 1. Difficults de principe Dtaillons les difficults thoriques rencontres pour passer de l'analyse lexicale l'analyse thmatique. la diffrence des lexmes, les thmes ne sont pas des signes, ni, corrlativement, des units du franais : ils dpendent en effet d'autres normes que la langue. Si le lexme et le thme diffrent aussi bien par le niveau que par le palier d'analyse, le premier tant un signe, et relevant de la morphologie et de la microsmantique, le second une unit du contenu au palier msosmantique, il est clair que tout lexme n'est pas un thme. Une analyse thmatique qui en resterait au palier lexical compterait potentiellement autant de thmes que de mots de la langue. Sauf bien sr restreindre cet inventaire, comme le font les dictionnaires de thmatique, de faon normative et non critique. On objectera que les thmes sont ordinairement dnomms par un lexme. Mais ce lexme est simplement une lexicalisation privilgie du thme. Et l'on pourrait fort bien rencontrer des thmes sans lexicalisation privilgie (comme celui que nous avons dcrit chez Zola, 1989).

234

L'ANALYSE THMATIQUE DES DONNES TEXTUELLES

Comment savoir si un lexme donne ou non accs un thme ? Nous retrouvons ici le problme de la pertinence. Pour l'claircir, posons-le propos d'un mot, nombril chez Flaubert. Aprs enqute, nous pouvons faire tat de quelques modestes dcouvertes.
Excursus 2 : Nombril dans l'ceuvre de Flaubert Le choix de ce thme d'tude nous a t suggr par une affirmation vertigineuse de Frdric Nef : Madame Bovary n'a pas une infinit de nombrils possibles ; tout simplement, elle n'a pas de nombril. Dans tous les mondes accessibles partir du ntre c'est un individu incomplet qui manque cette proprit (1992, p. 10). Le mot nombril revient seize fois dans l'uvre de Flaubert, rcits de voyage et correspondance comprise (d. Conard). Il ne figure pas dans Madame Bovary. Dans la premire version de l' Education sentimentale (1845) on trouve une commre d'environ quarante-sept ans, assez frache encore, bien nippe et bien nourrie, un peu haute en couleur, l'il vif et le caquet prompt, trs fournie de gorge, puisqu'on entend par l ce qui s'tend depuis le menton jusqu'au nombril (p. 39). La Tentation de 1849 reprend : l'ombre de la vigne, couche sur le gazon, elle avance les lvres pour saisir le raisin mr : un grain tombe, il glisse sur sa joue, et, roulant entre ses seins, la chatouille tout entire, depuis le menton jusqu'au nombril (p. 360). La correspondance atteste aussi cette acception originale de nombril comme limite infrieure d'une gorge abondante, propos des femmes grecques, qu'elles soient modernes : Elles prennent leur vtement, et pour se cacher la mine, se dcouvrent ce qu'il est convenu d'appeler la gorge, c'est--dire l'espace compris entre le menton et le nombril (Corr., 1850, p. 136) ou bien antiques comme l'atteste cette description d'un bas relief sur l'Acropole : II ne reste plus que les deux seins, depuis la naissance du cou jusqu'au dessus du nombril (Corr., 1852, p. 298). Dans la Tentation de 1874, le nombril fminin s'rotise encore jusqu' annoncer le sexe : J'ai d'abord cherch une femme comme il convient : de race militaire, pouse d'un roi, trs bonne, extrmement belle, le nombril profond, le corps ferme comme du diamant : et au temps de pleine lune, sans l'auxiliaire d'aucun mle, je suis entr dans son ventre (p. 123). Dans Salammb et la Tentation , nombril prend une autre acception : il est alors li au divin ou au magique, comme origine d'un ou plusieurs cordons ombilicaux, voire de chanes qui devraient enchanter les nombreux psychanalystes de Gustave : Son corps occupait le plafond tout entier. De son nombril pendait un fil un uf norme (Salammb, p. 81). Ou encore : plusieurs rues partaient devant lui. Dans chacune d'elles, un triple rang de chanes en bronze, fixes au nombril des Dieux Pateques, s'tendait d'un bout l'autre, paralllement (p. 162). Dans la Tentation de 1849 des courtisanes ont achet des mages des plaques de mtal qui se portent au nombril (p. 219). L'ombilic gniteur se retrouve dans : des ftus quadrupls se tenant par le nombril (Tentation, 1849, p. 408) ; puis en 1856 : des ftus quadrupls se tenant par le nombril et valsant comme des toupies (p. 599, repris littralement en 1874, p. 197). Mais il devient omphalopsychique22 dans : je contemplais en souriant s'leva de mon nombril la tige verte d'o devait clore le dieu nouveau (p. 448). En 1874 : sur le nombril du dieu, une tige de lotus a pouss : et, dans son calice, parat un autre dieu trois visages (p. 123). Une dernire acception se trouve dans la correspondance. Pour les hommes, le nombril divise, platoniquement, le corps en deux : nous ne devons entrer dans la vie relle que jusqu'au nombril. Laissons le mouvement dans la rgion des jambes (Corr., 1857, p. 46). Ces trois acceptions correspondent trois formes textuelles diffrentes. La premire lexicalis fort obliquement un thme propre la correspondance, c'est le thme de la poitrine fminine23. La seconde est une lexicalisation partielle du motif de la Gense monstrueuse, rcurrent dans les romans orientalisants (la Tentation et Salammb). La troisime acception ne correspond pas non plus un thme, si l'on convient qu'il faut au moins une rcurrence pour faire thme24. En somme, le mot nombril est une lexicalisation partielle d'un thme dans la correspondance, d'un motif dans deux romans, et d'un topos isol dans la correspondance.

LA SMANTIQUE DES THMES

235

Rsumons. Un lexme peut ne lexicaliser aucun thme ; par exemple le mot thme ne correspond aucun thme dans le corpus romanesque que nous avons tudi. Mais il peut aussi en lexicaliser plusieurs. Enfin, son lien avec le palier thmatique est relatif un discours (littraire, mdical, etc.), un genre, et un corpus. Par suite, le rapport au corpus n'est pas le mme pour l'analyse lexicale et l'analyse thmatique. Le corpus doit tre maximal pour une tude lexicographique qui entend mettre en vidence toutes les possibilits de la langue. Dans l'analyse thmatique, il doit tre restreint bon escient pour pouvoir caractriser la spcificit des discours et des genres : les thmes du roman ne sont pas ceux de l'essai ni du pome. Ainsi, en dpouillant un corpus trop tendu qui mlait des romans et des essais dans la priode 1830-1870, nous nous sommes aperu que les sentiments du roman n'taient pas ceux de l'essai. Par exemple, le sentiment de fraternit, rcurrent dans les ouvrages de Leroux, et celui d'quit chez Proudhon, n'ont pas t relevs dans les romans, l'exception confirmatrice des Misrables, qui alterne des chapitres romanesques et d'autres qui relvent du genre de l'essai. supposer mme que le mme mot se rencontre dans des genres diffrents, rien n'assure qu'il se rapporte aux mmes thmes : amour se rencontrera certes en posie et dans le roman, mais le thme de l'Amour diffre pourtant avec ces genres. Il n'a pas la mme molcule smique, ni les mmes lexicalisations, ni les mmes antonymes et l'on remarque que l'Ambition n'est pas un thme en posie, alors que dans le roman elle est frquemment couple avec l'Amour (cf. supra la contribution de Erlich). Tout cela loigne la thmatique de la lexicologie, et a fortiori de la lexicographie. En particulier, les mthodes lexicographiques visant l'largissement du corpus sont impropres pour l'analyse thmatique. Les lments encyclopdiques qui se mlent souvent aux dfinitions seraient alors oiseux. La structure de l'article de dictionnaire ne conviendrait pas un rpertoire thmatique : la distinction des acceptions et leur hirarchisation reflte une ontologie ; en outre, les dictionnaires, par leur fonction mme, ont un rle normatif, alors que la thmatique ne peut tre que descriptive. Pour progresser, la thmatique doit donc dpasser l'analyse lexicale. Elle en est cependant tributaire, notamment pour des raisons de fait qui tiennent l'tat de l'art. D'une part, seule l'interrogation de banques informatises permet de vrifier certaines hypothses, et de recueillir des faits l o personne n'aurait l'ide d'en chercher25. D'autre part, les logiciels d'interrogation acceptent pour unit la chane de caractres, simple signifiant, et ne constatent que des cooccurrences de signifiants qui peuvent tre soumises traitement statistique.

236

L'ANALYSE THMATIQUE DES DONNES TEXTUELLES

L'enjeu consiste passer de ce zro meaning l'analyse thmatique, pallier l'absence de donnes smantiques en tirant profit de la thorie smantique. Cette situation est sans doute temporaire, et l'volution des architectures connexionnistes laisse prvoir des logiciels qui permettront de faire merger, par apprentissage et discrtisation sur de grands corpus, des faisceaux de cooccurrences spcifiques. Cela permettra de guider la formulation des hypothses, mais sans modifier pour autant les conditions hermneutiques que nous avons soulignes. Si l'on veut prciser encore le rapport de l'analyse lexicale l'analyse thmatique, il faut prciser que le mot partir duquel commence la recherche n'en est pas l'objet, la diffrence d'un mot-vedette qui ferait l'objet d'une recherche lexicographique. On va certes chercher, en utilisant les moyens d'assistance informatiss, d'autres mots et expressions qui sont cooecurrents. Une fois interprts, les cooecurrents pour lesquels on aura identifi une relation smantique seront considrs comme des corrlats, c'est--dire comme des lexicalisations complmentaires de la mme molcule smique. Le rseau des corrlats relie les manifestations lexicales du thme. Mais il faut pouvoir discerner le(s) meilleurs) point d'entre(s) dans ce rseau. La vedette n'est alors qu'un mot d'entre, choisi pour sa frquence, et dans l'hypothse qu'il prsente une lexicalisation synthtique du thme que l'on cherche dcrire. 2. Qu 'est-ce qu 'un sentiment ? En analysant le champ lexical des sentiments, nous ne postulons pas que ce champ soit uniforme, ni qu'il constitue une unit de langue. Il contient sans doute plusieurs taxmes. Il ne constitue pas un domaine dlimit par l'incidence d'une pratique sociale. Il s'agit donc d'un regroupement ad hoc, convoqu par la pratique descriptive en cours. En dnombrant les noms de sentiments, nous ne prtendons pas compter autant de thmes. Certains peuvent lexicaliser le mme thme (piti, compassion), d'autres des thmes diffrents : par exemple, le mot sentiment signifie par dfaut 'amour' (cf. Le Rouge et le Noir, p. 406 ; Eugnie Grandet, p. 57) et prend pour antonymes : mariage (Nucingen, p. 627) ; malheur (Le Rouge et le Noir, p. 407) ; intrt (La Duchesse de Langeais, p. 249). Pour mettre en vidence les difficults, retraons rapidement les tapes d'une recherche lexicale prparatoire certaines contributions de ce volume. Il s'agissait de faire manuellement c'est--dire intellectuellement un inventaire des sentiments dans un sous-corpus constitu de 138 romans, soit un par an dans l'intervalle chronologique choisi ( l'exception de deux annes o la

LA SMANTIQUE DES THMES

237

banque ne comptait aucun roman). Nous avons pour cela slectionn les contextes de sentiment et de sentiment de ou d', dans l'tendue d'une phrase. La liste ainsi obtenue, dtaille ci-dessous, a t ensuite croise sur elle-mme : en appelant tous les passages qui contenaient au moins deux membres de cette liste, nous avons pu slectionner un sous-corpus haute teneur sentimentale et viter pour l'essentiel les ambiguts qui peuvent s'attacher aux occurrences isoles26. a) Rserves d'inventaire Au cours de cette enrichissante lecture, nous avons rencontr deux problmes classiques. Celui de la polysmie : sentiment, qui dsignait d'abord la facult de sentir, qu'il s'agisse de la sensibilit physique ou de la conscience, est venu dsigner aussi, au cours du XVIII sicle, les affections et passions de l'me. Cette volution a sans doute accompagn la conqute de l'intriorit. Mais dans notre corpus, la premire acception perdure, et l'on relve par exemple le sentiment de son costume. Elle se rencontre jusqu'au premier tiers de ce sicle, notamment chez des auteurs conservateurs en politique (Barrs) et qui se plaisent quelques archasmes, innocents moyens de retrouver le bon vieux temps. Certains sentiments n'ont pas de lexicalisation synthtique, et sont manifests par des lexies complexes. Dans le meilleur des cas, elles sont rcurrentes, mais parfois plusieurs sont employes de faon apparemment quivalente. On pourrait alors parler de sentiments sans nom, comme le sentiment du beau, que Balzac nomme sentiment inexprimable (Le Colonel Chabert, p. 48) ; ou le sentiment maternel, dit aussi de la maternit (le plus saint de tous, Dumas, Monte Cristo, H, p. 254 ; tendresse des tripes, Groult, p. 883), d'tre mre ; de mre (Rops, p. 597). Il s'agit, plus techniquement, de thmes sans lexicalisation privilgie. Ces sentiments sans nom mriteraient eux seuls une tude particulire, dont la monographie de Danielle Bouverot (cf. supra) permet de mesurer la difficult et l'intrt. Ils engagent souligner encore les limites d'une approche purement lexicale. D'autant plus que les mthodes d'interrogation et les calculs statistiques diffrent selon qu'il s'agit de lexicalisations synthtiques, de syntagmes intgrs, ou de syntagmes non intgrs. Or il faudrait, pour l'analyse smantique, intgrer les rsultats de ces traitements divers dans un protocole commun. Faut-il considrer comme quivalents les parasynonymes comme espoir, esprance ? Pour les homologuer, il convient de chercher s'ils se trouvent en relation de collocation. Si ce n'est pas le cas, ils sont smantiquement assez proches pour tre substituables en contexte. Cela n'entrane cependant pas qu'ils aient les mmes corrlats ; esprance, par exemple, convient mieux des

238

L'ANALYSE THMATIQUE DES DONNES TEXTUELLES

contextes religieux. En somme, les parasynonymes ont des distributions complmentaires. Cela explique que leurs collocations soient rares ou nulles. b)Anatomie des corps trangers Les relevs font apparatre des contenus qui ne sont pas ordinairement classs comme des sentiments. Par exemple, 'dignit' avait t chass d'une premire liste par un sentiment linguistique majoritaire dans un groupe de travail. Cependant, on trouve un sentiment de dignit personnelle et d'orgueil (Maupassant, p. 177). On peut conclure que localement 'dignit personnelle' entre dans la classe des sentiments. Mais comment interprter des coordinations comme de fureur et de vengeance (France, p. 333), d'autre sentiment que l'orgueil et la force (Tharaud, p. 324), de malaise et d'aversion (Aym, p. 478), de colre et de revendication (Rops, p. 537), de srnit, de puissance, de libert (Martin du Gard, p. 691), de regret, de mortification (id., p. 693). Il est vraisemblable que coexistent ici des deux acceptions de sentiment que nous relevions plus haut, par une sorte d'antanaclase diachronique qui apparat notamment dans : sentiment de joie inconnue et d'lection merveilleuse (Gracq, p. 812), ou sentiment de permanent dgot, de permanente impuissance et de permanente dcomposition (Simon, p. 929). Dans ces cas l, plutt que de considrer le sentiment inattendu comme le corrlat d'un autre, mieux vaut admettre que l'inventaire des sentiments n'est aucunement arrt, et que les variations contextuelles refltent des normes individuelles propres des auteurs particuliers. Ici encore, il faut tenir compte du fait que le syntagme est la zone de localit qui facilite le plus la propagation des traits smantiques. La parataxe notamment instaure des relations d'quivalence (cf. l'amour, la tendresse, la fidlit , Abellio, p. 746), de mme que la comparaison (cf. sentiment d'tonnement comparable l'angoisse , Duhamel, p. 704), la gradation (ex. : sentiment de responsabilit, voire de culpabilit , Martin du Gard, p. 674 ; sentiment d'admiration, presque d'envie , Green, p. 786). On ne saurait oublier non plus que le mlange des sentiments fait partie de la psychologie romanesque, et l'on trouve des numrations comme : amiti, sentiment, tentation, oubli, silence, rotisme (Sabatier, p. 915), qui semblent, plutt que des coq--1'ne potiques, des romans miniature. c) Classement propos Les sentiments ont t classs selon deux critres. D'une part, leur structure actantielle : ego passif, rflexif, actif sur un ou plusieurs congnres ou objets ; d'autre part, le taxme o ils sont indexs. Le premier critre domine le premier :

LA SMANTIQUE DES THMES

239

les rubriques finales comprennent des sentiments relationnels. La prsentation ci-dessous est grossire, car il y manque une classification croise :
I. Sentiments antiques : 1. existentiels : angoisse, anxit, de culpabilit, garement, ennui, espoir, tonnement, de la fatalit, impuissance, incertitude, inquitude, insouciance, mlancolie, nostalgie, rsignation, de scurit, de (sa, la) solitude, stupeur, trouble. Les aspectualiss sont anticipateurs : anxit, espoir, inquitude, insouciance ; ou rtrospectifs : nostalgie, rsignation. 2. thymiques : aise, allgresse, amertume, ardeur, bonheur, colre, dgot, dpit, dsespoir, dtresse, enthousiasme, pouvante, exaltation, extase, flicit, fureur, gaiet, horreur, indiffrence, indignation, joie, lassitude, malaise, malheur, mcontentement, panique, peur, plaisir, plnitude, rpugnance, rpulsion, satisfaction, srnit, surprise, tristesse. On peut les diviser en euphoriques aise, satisfaction, gaiet, joie, allgresse, bonheur, flicit, extase ; et dysphoriques : amertume, malaise, mcontentement, malheur, dsespoir, dtresse. II. 3. Sentiments relationnels : admiration, affection, amiti, amour, amour-propre, anti-sympathie, antipathie, aversion, bienveillance, camaraderie, complicit, confiance, crainte, cruaut, curiosit, dfiance, dlicatesse, effroi, embarras, envie, estime, exaspration, frustration, gne, gratitude, haine, honte, humiliation, sentiment d'infriorit, indulgence, ingratitude, ironie, orgueil, pudeur, rancune, reconnaissance, respect, sentiment (par dfaut = amour), soumission, de (la, sa) supriorit, sympathie, tact, timidit, vanit, vnration. Ds se divisent leur tour en passifs et actifs, euphoriques et dysphoriques. III. 3.1. Sentiments de filiation : amour filial, amour maternel, de la famille, sentiment filial, sentiment maternel, de la maternit, de parent, paternel, de la paternit, de la pit filiale, tendresse. 3.2. d'alliance : fidlit, jalousie, amour. 3.3. sociaux : ambition, sentiment colonial, dignit, du devoir, de ses devoirs, de ses droits, de discipline, fraternit, hrosme, sentiment hirarchique, honneur, humanit, intrt, sentiment national, d'oppression, patriotisme, sentiment patriotique, de la proprit, de rbellion, de responsabilit, rvolte, de solidarit. IV. 3.4. religieux : charit, compassion, sentiment de faute, esprance, ferveur, foi, humilit, pit, sentiment religieux, de religion, remords. 3.5. esthtiques : de l'art, du beau, de la beaut, de la vraie beaut, sentiment inexplicable, potique.

Soit 98 dsignations de sentiments, avant rduction des parasynonymes, pour les rubriques I et II ; et 34 pour les rubriques III et IV. Soit 128 en tout. Ce chiffre dpend sans doute pour une part du corpus trait, mais nous avons relev un effet de saturation : au fil de la lecture, les sentiments nouveaux deviennent de plus en plus rares. La distinction dterminante est certainement celle de l'valuation positive ou ngative. Ces dimensions smantiques divisent le champ des sentiments, ce que confirme par d'autres moyens l'analyse factorielle conduite par Brunet (cf. la fig. 5 de son tude, dont la partie gauche, dysphorique, s'oppose la partie droite). On vrifie subsidiairement la distinction entre les sentiments on tiques (dans le bas du tableau) et les sentiments relationnels (dans le haut). Plus gnralement, il est remarquable que les rsultats de notre analyse smantique et ceux de son analyse statistique concordent globalement, bien que ces tudes aient t conduites sparment. Cela confirme que les proximits statistiques sont bien fondes sur des proximits smantiques.

240

L'ANALYSE THMATIQUE DES DONNES TEXTUELLES

3. Cooccurrence et corrlation Le passage de l'analyse lexicale l'analyse thmatique conduit de signes non interprts des units smantiques qui rsultent d'un parcours interprtatif. Il se concrtise par le passage des cooccurrents aux corrlats. a) La cooccurrence intresse les signifiants Les cooccurrents ne sont que des signifiants certains disent aussi formes, ou chanes de caractres associes statistiquement par la mthode de l'cart rduit ou de l'cart hypergomtrique27. Il convient de distinguer plusieurs zones de cooccurrence : immdiate, proche, et large. Contrairement l'intuition, les cooccurrents immdiats ne sont pas toujours d'un grand intrt pour l'tude thmatique. Si l'on interroge la banque textuelle partir de mots isols, le bruit le plus sensible est d aux constituants des expressions phrasologiques reviennent avec insistance. On peut distinguer ici entre les expressions compltement intgres comme avoir cur, ou savoir par cur, qui fausseront par exemple les rsultats d'une interrogation sur les parties du corps ; et les phnomnes de cooccurrence restreinte, propres des syntagmes moins intgrs (comme prouver un sentiment), et que Mel'cuk a tudi sous le nom de fonctions lexicales. Par exemple, dans son analyse de joie (1981, p. 25) et de dsespoir (p. 22), il relve la fonction Oper 1, qui prend la mme valeur prouver. Il est clair que ce cooecurrent ne permet pas de diffrencier la joie du dsespoir. En rgle gnrale, on relve dans les syntagmes en voie de figement une dsmantisation des constituants, dont les lexies se confondent en une seule. Aussi la cooccurrence de ces constituants n'a-t-elle qu'une pertinence faible ou nulle. C'est dans le contexte indpendant des fgements phrasologiques que l'on trouve les cooccurrents les plus pertinents. Par extrapolation, peut-on faire l'hypothse que le contexte proche soit plus sensible aux nonnes sociolectales que le contexte large, de l'ordre du paragraphe ? La question est dlicate, car l'on trouve des usages individuels des topo aussi bien au palier du syntagme qu'au palier du paragraphe. Retenons cependant que le paragraphe est l'homologue (non l'analogue) sur le plan de l'expression de la priode sur le plan du contenu. C'est ainsi dans l'espace du paragraphe que l'on trouve l'essentiel des cooccurrents correspondant au thme recherch. Selon l'tendue du corpus et les objectifs de la description, on peut faire varier les seuils de pertinence quantitative retenus. Les listes de cooccurrents ainsi tablies contiennent de bons candidats la qualification smantique.

LA SMANTIQUE DES THMES

241

b) La corrlation intresse les signifis Les units de cooccurrence sont des chanes de caractres, et ne correspondent pas ternie terme aux units de corrlation qui sont des lexies. Ces dernires connaissent deux zones de localit qui favorisent de faon dcroissante la propagation des traits smantiques : le syntagme et la priode (cf. l'auteur, 1994, ch. V). La qualification des cooccurrents est cruciale, car elle permet le passage du quantitatif (les cooccurrents) au qualitatif (les corrlats). Elle se rgle sur les principes hermneutiques que le global dtermine le local, et que l'hypothse gouverne l'objectivation. Ainsi, les cooccurrents ne sont levs la dignit de corrlats que s'il est possible d'tablir une relation d'isotopie ou de paratopie avec d'autres cooccurrents. Par exemple, parmi les cooccurrents ' ennui, dimanche et araigne se slectionnent mutuellement, dans le contexte d'inaction. Ils lexicalisent un des composants du thme recherch, et c'est ce titre qu'ils sont qualifis. Comme les corrlats sont des signifis, les classes morphologiques qui les manifestent n'ont pas d'importance ce niveau d'analyse, et l'on sait que le mme sme peut tre lexicalis par un prfixe, un nom, un adjectif, un verbe, etc.28. L'hypothse qui fonde la transformation de la cooccurrence en corrlation est celle-ci : le contexte proche est structur par des isotopies qui marquent l'appartenance un mme fond smantique, ou des paratopies qui marquent l'appartenance la mme forme smantique. Tout corrlat peut tre reli par une relation casuelle avec un autre corrlat, ou partage au moins un sme avec au moins un autre corrlat. Ainsi, un corrlat X peut partager le sme a avec le corrlat Y, et le sme b, avec le corrlat Z, etc. ; cependant Z partage le sme c avec X ou W, etc. Le rseau des relations casuelles ou d'quivalence partielle ainsi dessin constitue le thme. Si ces relations ne peuvent tre tablies, l'hypothse initiale doit tre rvise, car l'on n'a pas choisi un bon point d'entre, et l'on a conduit l'interrogation partir d'un smme faiblement corrl au thme recherch ; soit encore on n'a pas affaire un thme ou du moins un thme stabilis dans le corpus choisi. La recherche des coocurrents et la promotion de certains au rang de corrlat reprend, un palier infrieur, mais une chelle quantitative nouvelle, l'antique technique hermneutique des passages parallles, dj thorise avant notre re par Hillel l'ancien. Bref, rsumons les principales tapes d'une recherche thmatique assiste : 1. Choix des hypothses, en fonction de l'objectif gnral de la recherche. Une pranalyse statistique peut guider la recherche d'hypothse, mais la frquentation pralable du corpus reste indispensable pour guider les intuitions.

242

L'ANALYSE THMATIQUE DES DONNES TEXTUELLES

2. Recherche de cooccurrents par la mthode statistique ds carts rduit ou hypergomtrique. 3. Transformation interprtative des cooccurrents en corrlats, et constitution des rseaux thmatiques. Cette tape est facilite si l'on a pratiqu une interrogation simultane sur plusieurs cooccurrents (cf. supra Bourion, I. 2)29. 4. Validation des rsultats : par croisement de l'analyse thmatique avec l'analyse d'autres composantes du mme corpus ; par test sur un corpus de contrle ; par confrontation avec d'autres recherches thmatiques. m. Problmes pistmologiques : de la philologie l'hermneutique Tout protocole mthodologique se rgle sur des principes pistmologiques, explicites ou non. Aussi, plutt que de dtailler ces protocoles eux-mmes, qui dpendent de l'tat de l'art, et doivent se rgler sur le type de corpus choisi, comme sur le type d'hypothse valider, il nous parat plus utile de prciser leurs principes dontologiques. La philologie et l'hermneutique sont les deux disciplines concernes au premier chef. Une smantique du texte doit les concilier, car elle ne peut se satisfaire de la sparation entre la lettre et l'esprit, quand bien mme la philologie a connu nagure une drive positiviste, et l'hermneutique une involution spculative. 1. Les choix mthodologiques et la philologie Mme si l'on convient de dpasser par l'tude des corrlations le stade de la cooccurrence lexicale, comment formuler l'hypothse initiale, comment choisir le ou les mots qui permettent d'entrer dans le rseau thmatique ? Une recommandation gnrale suggre de choisir des mots du corpus. J'emprunte par exemple les rsultats prliminaires d'une tude reste indite de R. Chon. Voulant tudier le sentiment d'infriorit dans le roman du XIXe sicle, elle n'en a pas trouv d'attestation ; en revanche, le sentiment d'crasement n'est pas rare, bien qu'il ne figure pas dans les dictionnaires thmatiques, et soit tranger la doxa contemporaine en matire de sentiments. Si bien que l'hypothse qui a prsid l'interrogation doit tre reformule, ou abandonne. Le sentiment d'crasement affecte des personnages situs au bas de l'chelle sociale, et rsulte de l'oppression et de l'injustice qui s'exerce sur eux ; il est dcrit pour ainsi dire de l'extrieur. En revanche le sentiment d'infriorit est une cration contemporaine, qui affecte des personnages vus de l'intrieur, et n'a pas de cause sociale bien identifie.

LA SMANTIQUE DES THMES

243

Faut-il, peut-on rechercher les thmes contemporains dans les textes des sicles passs ? Cette question dpasse la distinction entre l'approche onomasiologique qui part de signifis ou de concepts pour en rechercher l'expression, et l'approche smasiologique qui prend le chemin inverse. Elle engage aussi bien la philologie que l'hermneutique, et nous allons l'illustrer par un parallle. Les deux contributions de Brunet et Bhar & Bernard se placent explicitement dans le cadre d'une histoire des mentalits. On a vu comment Bhar et Bernard compilent neuf listes de sentiments la manire d'un sondage d'opinion 30. La liste rsultante, qui ne retient que les termes figurant dj dans le thsaurus de la BDHL, soit 106, reste htrogne, puisqu'on y trouve l'alcoolisme, le culte, la dpression nerveuse, le mysticisme, la soif, la toxicomanie. La garantie d'une attestation majoritaire dans les listes de dpart rduit ce nombre une liste homogne de vingt. Cela entrane l'limination de quatre-vingts noms de sentiments attests par ailleurs dans le corpus romanesque de langue franaise de 1830 1970. Ici apparat le caractre normatif d'un thsaurus, qui, pour une tude de thme conduit ne slectionner que ce qui peut rpondre une indexation pralable. Les auteurs soulignent bien dans leur conclusion que l'tude de la littrature a affaire des opinions , mais en se plaant du ct du lecteur, se range du ct de l'histoire des mentalits . Il s'agit bien entendu du lecteur d'aujourd'hui. La question du lecteur d'hier et des mentalits du sicle dernier ne se pose pas dans ce cadre. Pour sa part, Brunet ne prend en considration que le corpus Frantext et part de notre relev indicatif. Il fixe comme seuil de pertinence un seuil de frquence31. Il trouve statistiquement 124 mots-cooecurrents du mot sentiment. Ils ne sont pas ncessairement des noms de sentiment, mais des formes comme prouvait, prouvais ou visage, cri, vie. Dans l'environnement de ces 124 entres, il trouve 164 noms de sentiment, et le mot sentiment luimme. Il accrot ainsi d'un quart la liste indicative initiale, tablie partir du tiers du corpus. Et partir de cette liste tendue, il construit des donnes nouvelles sur la structure du champ des sentiments, son histoire et son volution. Si ces deux tudes partageaient les mmes objectifs, on pourrait par gnralisation opposer deux stratgies. La premire semble accueillante, car elle multiplie les sources. Mais elle reste normative, dans la mesure o elle ne retient que ce qu'elles ont de commun, et conduit une restriction des hypothses. La seconde, simplement descriptive, conduit une extension des hypothses et la constitution de donnes riches. Cette symtrie reste fausse, car la slection des uvres par indexation et leur exploration assiste n'obissent pas aux mmes objectifs. Une question reste pose : comment choisir les thmes qui servent indexer les uvres ? Ou bien

244

L'ANALYSE THMATIQUE DES DONNES TEXTUELLES

l'on reflte la doxa contemporaine en la matire, ou bien l'on cherche restituer les thmes importants l'poque tche qu'un logiciel d'analyse thmatique pourrait prcisment assister. La question philologique reste pose. L'exploration d'un corpus exige des prcautions - l'image de tout travail historique. La premire est le respect des limites du corpus. Si l'on convient que tout relev, pour tre pertinent, doit correspondre au corpus, c'est-dire des coordonnes prcises dans le temps et dans l'espace textuel, les sources annexes sont par l-mme oiseuses. Enfin, un corpus inanalys ne peut en clairer un autre que si l'on dmontre que l'on peut les confondre. Nous n'avons pas l'illusion pour autant de nous transporter par la thmatique dans la mentalit de nagure. L'entreprise mme d'une smantique des textes et les moyens d'assistance informatique sont bien de notre temps. Du moins, pour viter le narcissisme des recherches qui ne retiennent que ce qui conforte leurs hypothses, pouvons-nous soumettre rvision les ntres, pour accueillir par exemples des sentiments sans nom, mls ou disparus. Sans quoi la thmatique, comme la plus belle fille du monde selon Proust, ne donnerait que ce que l'on croit recevoir. IV. Directions de recherche 1. Ouvertures mthodologiques Ce n'est pas le lieu ici de revenir sur les problmes classiques de l'analyse statistique et de la consultation de banques de donnes, comme la polysmie, le bruit, et le silence. Il faut cependant souligner que l'amlioration des outils logiciels et l'enrichissement des corpus conditionnent en pratique l'analyse smantique. Les rsultats magistraux prsents ici-mme par Brunet n'auraient pas t obtenus sans l'usage des logiciels qu'il a labors. Plus gnralement, retenons que le quantitatif et le qualitatif ne s'opposent aucunement : seule une analyse qualitive peut rendre significatifs des phnomnes quantitatifs remarquables, et interprter leurs variations. La smantique des textes est d'ailleurs la partie de la linguistique la plus utile pour cela, dans la mesure aussi o elle permet de relativiser les phnomnes quantitatifs. Par exemple, Erlich ici-mme a figur les rafales thmatiques de l'Ambition et de l'Amour dans Le Pre Goriot. Mais les silences lexicaux, comme il le souligne, ne sont pas pour autant des silences thmatiques : ces thmes, pour n'tre pas nomms, sont intgrs ailleurs et d'une autre manire des structures dialectiques. L'on pourrait par paradoxe soutenir que dans ce roman l'Ambition et l'Amour sont partout l'uvre quand ils ne sont pas

LA SMANTIQUE DES THMES

245

nomms 32 , et culminent la mort du personnage ponyme, o leurs lexicalisations privilgies font pourtant dfaut. 2. Pour une thmatique historique et compare Les thmes, en tant que formes smantiques, sont lis l'histoire culturelle, dont ils sont une expression privilgie, surtout quand leur rcurrence les promeut au rang de topo. L'exemple des sentiments est rvlateur. Les dates d'apparition de nouveaux sentiments ne manquent pas d'intrt, qu'ils soient lis l'histoire politique, comme le sentiment patriotique qui apparat en 1912 et reparat en 1940, ou l'histoire de la mtapsychologie, comme ce sentiment de frustration qui apparat en 1960. L'volution diachronique des sentiments, et de leur valuation trouve un excellent exemple dans la contribution de F. Surdel : partir des annes 1870, la piti devient un sentiment suspect. Nous ne nous chargerons pas d'accuser les Communards ou leurs adversaires. Mais il faut souligner que les attaques venues des crivains catholiques, de Bloy Mauriac, ont accompagn sa fin, si bien que ce sentiment, perdant ses derniers soutiens, s'est absent du roman, et sans doute de la vie. L'humanitaire a pris sa place, dans de tout autres contextes. Plus gnralement, une histoire globale du monde sentimental devient possible. Par exemple, le tableau que prsente Brunet (figure 9) est loquent : on assiste un assombrissement continu des sentiments dans le roman depuis 1830. Enfin, et l encore les rsultats de Brunet sont pleins d'enseignement, une thmatique compare selon les genres permettrait de spcifier les particularits de chacun, et de restituer l'articulation gnrale du discours littraire. 3. Des formes culturelles au vcu : les sentiments et les affects Nous avons dfini les thmes comme des units smantiques, mais ils correspondent sans doute des reprsentations socialises. Comment sont-elles lies leur expression linguistique ? Gardons l'exemple des sentiments. Une premire voie de rponse consiste rechercher comment les sentiments prouvs trouvent leur expression linguistique. Mais le monde sentimental n'est-il pas li sa reprsentation ? Pour les crivains peut-tre, et pour leurs lecteurs assidus. Hors mme de la culture littraire, les sentiments ne sont-ils pas insparables de leur verbalisation ? La demi-douzaine d'motions de base rpertories par les thologistes expliquent peut-tre l'existence des affects, mais non la varit des sentiments, et encore moins le caractre historique et culturel de leur expression. L'acdie rmitique et la dpression nerveuse ont peut-tre les mmes substrats biochimiques, mais non la mme dfinition. Les sentiments, en tant que formes

246

L'ANALYSE THMATIQUE DES DONNES TEXTUELLES

culturelles, varient selon les poques et les socits ; ils ne sont d'ailleurs pas ncessairement individualiss comme tels, car ils supposent un sujet autonome et dou d'une vie intrieure. Et chacun sait combien d'une langue l'autre les sentiments sont difficiles traduire, mme dans des socits trs proches culturellement. Bref, une culture transforme les affects en sentiments. Un homme normal, dit Sacks, est un homme qui peut se raconter son histoire. Mais ce rcit demande une verbalisation, et qui sait si notre vcu, du moins ce qui en demeure hors de l'instant, n'en dpend pas ?

NOTES 1. Trousson (1981, p. 12 sq.) relve par exemple ces dfinitions : point de rencontre d'un esprit crateur et d'une matire littraire ou simplement humaine (Cl. Pichois et A.-M. Rousseau) ; un vnement ou une situation infantiles (J.-P. Weber) ; rseau organis d'obsessions (Barthes). A quoi Collot (1988, p. 80) ajoute : le thme [...] n'est rien d'autre que la coloration affective de toute exprience humaine (Doubrovsky) et renchrit en soulignant que le thme exprime la relation d'un sujet au monde sensible (p. 81). La dfinition du TLF tmoigne du poids de l'anthropologie en matire de thmatique : Unit du contenu (d'un discours, d'un texte ou d'une uvre littraire) correspondant une constante du symbolique ou de l'imaginaire. Or un thme peut tre spcifique un texte ou une groupe de textes, et comment faire fond sur ces constantes minemment discutables ? La critique thmatique a d'ailleurs mis en vidence des thmes personnels , et l'tude de Richard sur Mallarm est l'exemple minent d'une analyse idiographique. Todorov dfinissait le thme comme une catgorie smantique qui peut tre prsente tout au long du texte ou mme dans l'ensemble de la littrature (le thme de la mort, par exemple) (in Ducrot et Todorov, 1972, p. 283). Nous nous cartons videmment de la problmatique raliste ordinaire en philosophie du langage comme de la linguistique qu'elle influence (cf. Reinhardt et Kuno), pour laquelle le thme est le rfrent de l'nonc. Pour une typologie des thmes gnriques, cf. l'auteur, 1989, ch. IV. Nous avons propos des exemples de thmes sans lexicalisation privilgie chez Zola (1989, H, ch. II), et chez Eluard (1991, ch. IV"). Nous appelons ainsi l'adaptation des graphes conceptuels dfinis par Sowa (1984) aux besoins de la description linguistique ; sur les avantages et les limites de cette sorte de reprsentation, cf. l'auteur, 1989, ch. V. Ces deux smes aspectuels ont une grande importance dans la reprsentation du vcu, dans la mesure o les formes du vcu correspondent des types de temporalisation. On dit encore dans les ateliers a va comme un lundi, pour signifier a irait bien si on n'avait pas encore une semaine tirer. Un thme peut avoir une lexicalisation privilgie (ex. ambition), ou plusieurs (piti, commisration, compassion). Il peut s'agir d'une lexie (amour paternel) ou n'avoir pas de nom retenu par l'usage (sentiment du beau, amour de l'art). La parasynoymie des lexicalisations privilgies se manifeste par le fait qu'ils n'apparaissent pas dans les mmes contextes (ex. spleen apparat rarement dans le contexte de ennui, non parce qu'il en est trop loign, mais vraisemblablement parce qu'il est trop proche (cf. supra Gorcy).

2.

3. 4. 5. 6. 7. 8. 9. 10.

LA SMANTIQUE DES THMES

247

11.

12. 13.

14. 15. 16.

17. 18.

19. 20.

21.

22.

23.

Le foyer nonciatif qui prside la description est alors celui d'Emma. On sait que Flaubert passe sans doute bon droit pour le crateur du style indirect libre, prcisment dans Madame Bovary. Cet exemple vaut pour les graphes A et N. Le contenu du graphe N se trouve dtaill dans les phrases qui suivent, et que rsume cette interrogation : Un homme, au contraire, ne devait-il pas tout connatre, exceller en des activits multiples, vous initier aux nergies de la passion, aux raffinements de la vie, tous les mystres ? Une molcule smique a le statut de type. ses nuds peuvent tre attachs des smes ou des axes smantiques (attributs dans la terminologie de l'intelligence artificielle) susceptibles de prendre diverses valeurs selon les occurrences. Par exemple, dans Nous montmes dans un fiacre. La promenade fut enivrante, promenade lexicalis un sme de fiacre. Nous ne postulons pas de traitement dterministe, tel que la propagation d'activation irait du mot vers ceux qui le suivent immdiatement. Le rapport du thme aux lexicalisations de ses attributs est homologue du rapport de l'acteur aux lexicalisations de ses actants. Nous emploierons d'ailleurs la mme notation pour le thme et l'acteur : une majuscule l'initiale. Encore que les dictionnaires de thmes puissent rendre des services, en pdagogie notamment. On peut distinguer trois acceptions du mot topos. La plus traditionnelle (depuis la rhtorique d'Aristote) est une forme argumentative strotype (elle a t reprise, avec une extension moindre, par certains pragmaticiens). La seconde, que nous avons utilise (1987) est un axiome normatif socialis (comme Les gascons sont vantards) qui permet une affrence en termes logiques, cette proposition complte un enthymme. La troisime, que nous employons ici, dsigne une structure thmatique strotype, familire en histoire de la littrature : ainsi, le topos du locus amoenus. Cf. supra l'lude de Brunet, et les syntagmes contradictoires relevs par Bourion, comme pouvant de joie, terroriser d'amour, dsir panique. C'est peut-tre l une des raisons des difficults releves plus haut par Grard Gorcy : les noms de sentiments peuvent se trouver en relation antonymique, mais cela ne devient certain que si l'on relve des cooccurrences. Cependant, si les noms de sentiments tudis relvent d'un thme, ft-ce en qualit de corrlats privilgis, on ne peut conclure sans mdiation une antonymie entre les thmes, car d'autres corrlats des mmes thmes pourraient ne pas tre opposs. A la diffrence des prcdents, ce complexe topique reste ommiprsent. Cheb Khaled expliquait rcemment les contradictions de l'Algrie en opposant deux acrostiches : FIS signifierait Fatma interdiction de sortir, et FLN Femme libre la nuit... Personnel signifie ici idiolectal, relevant de nonnes individuelles. Certains auteurs, comme Trousson, estiment que les thmes personnels ne sont pas proprement parler des thmes, rservant le nom de thmes aux topo. C'est l un effet des objectifs de la littrature compare, qui privilgie la topique. Mais il reste prciser, au sein d'un mme texte, les rapports entre thmes et topo, ne serait-ce que pour montrer comment sa globalit particulire intgre des lments gnraux. Bdier employait le mot lment, et motif nous vient de Vesslovski ; il a t repris par Chklovski : Par motif, j'entends l'unit narrative la plus simple, qui, en forme d'image, rpondait aux diverses exigences de l'esprit primitif et de l'observation quotidienne (d'aprs Segre, 1988, p. 10). Cette dfinition conduira Tomachevski et Propp voir dans les motifs des fonctions narratives. Le nombril eut un rle pour ainsi dire central dans la controverse sur l'hsychasme qui dans la Byzance du XTVe opposa notamment Barlaam de Seminara Grgoire Palamas. En effet, les mystiques athonites pratiquaient la prire du cur pour accder la vision de la lumire divine ; or, ils considraient le nombril comme le lieu du cur sur lequel il fallait se concentrer, d'o le sobriquet d*omphalopsychiques (qui ont l'me au nombril) dont les affubla le caustique Barlaam. Cf. e.g. cette description de Kuchuk-Hanem (1850) Corr., t. II p. 174 : C'est une impriale bougresse, ttonneuse, viande.

248

L'ANALYSE THMATIQUE DES DONNES TEXTUELLES

24. 25. 26. 27. 28. 29. 30. 31.

32.

Cette division platonicienne, encore vivace dans des expressions comme au-dessous de la ceinture, constitue bien un topos, mais son occurrence isole dans notre corpus ne permet pas de l'intgrer une analyse thmatique. Cf. supra Bhar et Bernard sur l'abondance des sentiments chez Raymond Roussel, alors que toute la tradition critique insiste sur sa mthode d'criture qui ne leur laisse aucune place. Quand par exemple une requte sur amour slectionne des occurrences dans des expressions comme pour l'amour de dieu ou les enfants de l'amour. Prendre en considration l'cart absolu interdit en pratique d'apprcier les contrastes, et en thorie loigne irrmdiablement la recherche des principes de la linguistique compare. Mme les signes de ponctuation peuvent se trouver resmantiss : par exemple, certains sentiments sont associs des points d'exclamation, d'autres des points de suspension... La requte simultane sur plusieurs cooecurrents (relevant de diverses classes morphologiques) permet de slectionner un sous-corpus dense et patinent. Cinq dictionnaires dont quatre lectroniques, un analogique, un thsaurus d'indexation (BDHL), un relev dans les Passions de l'me de Descartes, notre relev dans le corpus de romans de Frantext ; enfin une liste de mots pouvant figurer aprs prouver. Les seuils de frquence engagent l'analyse statistique sur la voie de la topique plutt que la thmatique individuelle. Cela est ncessaire pour que ses rsultats soient significatifs, mais il faut y reconnatre une contrainte quantitative sur le qualitatif. Les hapax cependant ne signifient pas moins que les autres occurrences, mme s'ils signifient autrement. De mme plus haut, propos de l'Ennui dans Madame Bovary.

BIBLIOGRAPHIE BOUCHEZ (M.), L'Ennui de Snique Moravia, Paris, Bordas, 1973. BOURION (). L'Exprience d'extraction des contenus thmatiques l'aide du test de l'cart rduit, ms, 1994, 5 p. BRUNET (.), THIEF, in Traitements informatiss de corpus textuels, d. par . Martin, Paris, CNRS-INaLP, Didier rudition, 1994, pp. 239-261. COLLOT (M.), Le Thme selon la critique thmatique, Communications, n 47,1988, pp. 79-92. DUCROT (O.), T0D0R0V (T.), Dictionnaire encyclopdique des sciences du langage, Paris, Seuil, 1972. LEBART (L.), SALEM (A.), L'Analyse statistique des donnes textuelles, Paris, Dunod, 1988. MARTIN (.), Reconnaissance de contextes thmatiques dans un corpus textuel. lments de lexico-smantique, Paris, CNRS-INaLF ; Didier rudition, 1993 (tudes de smantique lexicale). MEL'CHUK (L), IORDANSKAJA (L.), ARBATCHEWSKY-JUMARIE (N.), Un nouveau type de dictionnaire : le dictionnaire explicatif et combinatoire du franais contemporain, Cahiers de lexicologie, 38-1, 3-34,1981 MEUNIER (J.-G.), Le Traitement et l'analyse informatique des textes, Actes de V1CO Qubec, 1990, pp. 9-18. NEF (F.), Smantique et ontologie II, Smiotiques, n 2,1992, pp. 7-18. PANOFSKY (E.), Essais d'icanologie, Paris, Gallimard, 1967. RASTTER (F.), Smantique interprtative, Paris, PUF, 1987. RASTIER (F.), Sens et textualit, Paris, Hachette, 1989. RASTIER (F.), Smantique et recherches cognitives, Paris, PUF, 1991. RASTIER (F.), Thmatique et gntique, Potique, n 90,1992a, pp. 205-228. RASTIER (F.), Ralisme smantique et ralisme esthtique, TLE, D 10,1992b, pp. 81119. RASTIER (F.), Smantique pour l'analyse, avec la collab. de A. Abeille et M. Cavazza, Paris, Masson, 1994. RICHARD (J.-P.), L'Univers imaginaire de Stphane Mallarm, Paris, Seuil, 1961.

LA SMANTIQUE DES THMES

249

ROBERT (R.), Jalons pour une tude du traitement des Topo romanesques dans le roman sentimental, in Le Roman sentimental, Limoges, Pulim, 1990, pp. 13-27. SAGNES (G.), L'Ennui dans la littrature franaise de Flaubert Laforgue, Paris, Armand Colin, 1969. SEGRE (C), Du motif la fonction, et vice versa, Communications, n 47,1988, pp. 9-22. SOWA (J.), Conceptual Structures, New York, Addison-Wesley, 1984. TROUSSON (R.), Thmes et mythes : questions de mthodes, Bruxelles, ditions de l'Universit de Bruxelles, 1981.

NB : J'ai plaisir remercier de leurs observations Henri BHAR, Danielle BOUVEROT, Pierre LAFON.