Vous êtes sur la page 1sur 32

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

COMMENT L'ORDINATEUR PEUT-IL SERVIR DANS L'ÉTUDE STYLISTIQUE D'UN TEXTE LITTÉRAIRE ?

Margareta KASTBERG SJÖBLOM

CNRS / Université de Nice

SOMMAIRE :

1. Introduction

2. La distribution des parties du discours du corpus ; analyse “grammatico-métrique”

3. Les pronoms

4. La catégorie verbale

5. Les modes verbaux

6. Conclusion

Quel est l’intérêt d’analyser la distribution des parties du discours dans un corpus littéraire informatisé, et de quelle façon cette analyse peut-elle contribuer à la compréhension de l’utilisation et de la fonction des catégories grammaticales ? En effet, la distribution des parties du discours n’est pas constante, elle varie selon les époques, les auteurs et les genres. Cette distribution, qui est bien un critère de distinction des œuvres, manifeste peut-être des choix plus subtils que celui du vocabulaire – en tout cas moins liés à la thématique de chaque ouvrage, ce qui peut apporter à l’analyse des éléments nouveaux.

Désormais la quantification et la lemmatisation des corpus ouvrent la voie à cette composante essentielle de l’écriture qu’est l’étude de la distribution des parties du discours. L’intégration de lemmatiseurs et d’analyseurs morphosyntaxiques dans les logiciels lexicométriques permet le recensement automatique et impartial de ces choix inconscients faits par l’auteur lors de la création et de l’élaboration d’un texte et permet de recenser des choix grammaticaux caractéristiques et personnels.

On se propose de montrer l’intérêt de ces nouvelles analyses que nous appelons “grammatico- métriques” à partir de l’œuvre de J.M.G. Le Clézio, numérisée, étiquetée et lemmatisée, et traitée avec le logiciel Hyperbase. On se demandera s’il est possible, à partir de l’étude des parties du discours de mieux comprendre l’écriture leclézienne ? Quelles sont les particularités grammaticales qui contribuent à son style d’écriture ? L’informatisation de l’œuvre de Le Clézio et l’application du logiciel Hyperbase permettent l’étude impartiale et exhaustive d’un style qui change avec l’évolution de l’œuvre littéraire.

Après avoir étudié la distribution des catégories grammaticales du corpus Le Clézio, nous nous attarderons sur quelques aspects morphologiques et syntaxiques qui nous ont paru intéressants et révélateurs dans la catégorie verbale.

1. Introduction

et révélateurs dans la catégorie verbale. 1. Introduction La production littéraire de Le Clézio est vaste,

La production littéraire de Le Clézio est vaste, s’étend sur plus de quarante ans et englobe plusieurs genres littéraires. Le corpus informatisé dans une version lemmatisée contient 2.257.931 occurrences et 31.520 lemmes répartis sur trente et une œuvres de l’auteur.

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

Le corpus est constitué tout d’abord des six premières œuvres, classées, par leur style particulier et innovant, comme appartenant à l’École du “nouveau roman” : Le procès-verbal, les nouvelles de La fièvre, Le déluge, Le livre des fuites, La guerre et Voyages de l’autre côté. Les romans qui suivent cette période, considérés par les critiques comme plus “traditionnels”, sont au nombre de neuf :

Désert, Le chercheur d’or et Voyage à Rodrigues écrit sous forme de journal personnel, Angoli Mala, Onitsha, Etoile errante, La quarantaine, Poisson d’or, et Hasard.

Mydriase et Vers les icebergs sont difficiles à classer dans un genre précis, ce sont plutôt des récits poétiques. Lorsque certaines critiques les rapprochent de la poésie en prose, d’autres parlent de textes anecdotiques. Le corpus inclut ensuite les recueils de nouvelles : Mondo et autres histoires, La ronde et autres faits divers ainsi que Printemps et autres saisons. Les essais littéraires sont de différentes époques. L’extase matérielle et L’inconnu sur la terre traitent de thèmes généraux tandis que Trois villes saintes et Le rêve mexicain ou la pensée interrompue s’intéressent exclusivement à la culture amérindienne. La culture amérindienne est également le principal centre d’intérêt des ouvrages à vocation ethnologique, Les prophéties du Chilam Balam et La fête chantée, tandis que Sirandanes s’intéresse à la culture de l’île Maurice. Sont inclus en outre dans le corpus deux livres pour enfants : Voyage au pays des arbres et Pawana ; sont présents enfin Diego et Frida, la seule biographie, et Gens des nuages, le récit de voyage.

Déjà l’étude de Guiraud [1] montre que la distribution des parties de discours dans les ouvrages littéraires est fortement influencée par le genre et l’époque où ils s’inscrivent. Ces conclusions ont été confirmées et développés par des études plus récentes de Brunet, Rastier et Malrieu et Beauregard.

La riche variation typologique des textes de notre corpus et l’importance du genre littéraire dans l’analyse lexicométrique, déjà bien documentée par ailleurs [2] nous a incitée à diviser ce corpus “multigénérique” en deux : le corpus A qui englobe tous les 31 ouvrages et un sous-corpus “romanesque” qui comprend exclusivement les romans et les recueils de nouvelles (le corpus B) et permet d’affiner l’analyse.

L’analyse des parties du discours, qui demande l’accès à la forme canonique du mot, au lemme, ne peut guère se fonder sur la distribution des effectifs d’un corpus s’appuyant sur la forme graphique. C’est la lemmatisation qui permet d’étiqueter le corpus selon les catégories grammaticales et de classer les éléments du vocabulaire selon leur appartenance à une catégorie spécifique. Les codes grammaticaux fournis par l’étiqueteur morphosyntaxique au cours de l’opération de lemmatisation “automatique” constituent ici un outil indispensable.

Toutefois, la lemmatisation automatique repose sur des critères préétablis selon des méthodes d’analyse différentes et les résultats peuvent varier selon le choix de l’étiqueteur et de ses principes. Il faut également savoir que la lemmatisation automatique n’est pas sans erreurs : erreurs d’analyse contextuelles, mauvaise définition de certaines classes grammaticales, etc. Il est donc recommandé de tenir compte de ces imperfections lors de l’exploitation des résultats.

Pour sa part, notre étude de catégories grammaticales dans l’œuvre leclézienne exploite la version lemmatisée d’Hyperbase selon le programme Cordial.

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

2. La distribution des parties du discours du corpus ; analyse “grammatico-métrique”

La version lemmatisée d’Hyperbase selon le programme Cordial 7 aboutit au bout du traitement à quelque 200 codes grammaticaux différents en utilisant toutes les combinaisons possibles. Le logiciel Hyperbase regroupe par la suite certains de ces codes pour constituer des catégories plus synthétiques et fournit la liste des fréquences des différents groupes grammaticaux sur lesquels nous nous appuyons dans cette étude.

L’analyse de la distribution relative de la distribution relative des catégories grammaticales permet de constater la richesse en substantifs (20,5%) de notre corpus, une des caractéristiques des corpus de langue française. Les catégories des déterminants, des signes de ponctuation et des verbes occupent chacune entre 14 et 15% du corpus. Quant aux pronoms et aux prépositions, ils se regroupent autour de 10% chacun tandis que les adverbes, les adjectifs et les conjonctions se rassemblent autour de 5% chacun. Les catégories de numéraux et d’interjections sont dérisoires par leur nombre.

On a pu observer dans des études antérieures [3] que, dans la littérature, le nombre de substantifs et celui des verbes varient en proportion inverse, le substantif étant dominant dans la prose abstraite et le verbe dans les récits. La richesse du substantif dans l’écriture leclézienne, caractéristique partagée avec les grands écrivains du XIX ème siècle, est étonnante car on aurait pu croire que les romans et les nouvelles de Le Clézio relevaient du genre du récit et donc devaient favoriser le verbe. Parmi les écrivains du XIX ème siècle, Chateaubriand était favorable à la catégorie nominale (adjectifs et substantifs), Zola cultivait plutôt les participes et les verbes, Proust accumulait les mots de relation, Hugo avait un penchant pour le substantif et le verbe et enfin Giraudoux fuyait les adjectifs, en cherchant, tout comme Hugo, les noms et les verbes [4]. Le Clézio s’approche dans son profil de ces deux derniers, avec un goût prononcé pour le nom, et comme Giraudoux, une aversion pour l’adjectif.

Toutefois, les variations que l’on peut observer à l’intérieur d’un corpus peuvent parfois être aussi importantes qu’entre différents écrivains. Il convient donc, avant de se prononcer sur la distribution des catégories grammaticales d’un corpus aussi varié que le nôtre, de prendre en considération la distribution à l’intérieur même du corpus.

En effet, si nous regardons d’un peu plus près les catégories grammaticales dans notre corpus, nous constatons que leur distribution n’est pas régulière. Pour une vision synthétique des accords qui lient les codes grammaticaux et les différents sous-corpus, nous avons recours à l’analyse factorielle de la liste de fréquences de ces codes dans les 31 œuvres du corpus :

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

dans l’étude stylistique d’un texte littéraire ? Figure n°1 : Analyse factorielle de la distribution

Figure n°1 : Analyse factorielle de la distribution grammaticale selon la lemmatisation par Cordial 7 du corpus A.

Le premier facteur de l’analyse factorielle oppose en premier lieu la catégorie verbale et la catégorie nominale. Le substantif attire les prépositions, les déterminants et les adjectifs tandis que le verbe attire les pronoms et les adverbes. Cette bipolarité n’a rien d’original car on observe souvent dans un corpus clos, comme nous venons de le faire, que deux camps, la catégorie nominale et la catégorie verbale, s’affrontent : la classe du verbe et les catégories qui lui sont proches (subordonnants, relatifs, pronoms et adverbes) s’opposent à la classe nominale qui réunit autour du substantif les adjectifs, les déterminants, les prépositions et souvent les coordinations. Cette opposition classique se superpose ici très nettement à une opposition générique. Les ouvrages ethnologiques se regroupent du côté du substantif, tandis que les œuvres fictionnelles se trouvent ensemble du côté du verbe ; mais une subdivision apparaît au sein de ce groupe.

En effet, le second facteur met en évidence l’importance de la chronologie de l’écrivain. La proximité des premiers ouvrages, Le procès-verbal, La fièvre, Le déluge, La guerre et Le livre des fuites des catégories grammaticales secondaires témoignent d’une écriture foisonnante (adjectifs, adverbes et interjections). Les derniers romans, La quarantaine, Poisson d’or, Etoile errante, Le chercheur d’or et Hasard, se rapprochent des catégories fondamentales, témoignant peut-être d’un assagissement de l’écriture, d’un travail de simplification de style.

Telles sont les grandes tendances que dégage l’analyse grammatico-métrique du corpus Le Clézio :

l’opposition purement grammaticale des différents parties du discours, l’évolution de l’écriture dans le temps et l’importance de l’opposition des genres littéraires différents.

Mais de quelle façon l’étude statistique - avec ses chiffres, ses pourcentages et ses tableaux

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

mathématiques complexes comme l’analyse factorielle – peut-elle être utile pour l’analyse stylistique d’une œuvre littéraire ? L’analyse quantitative peut-elle apporter à l’étude esthétique des éléments nouveaux ?

Nous pensons en effet que l’analyse grammatico-métrique peut être un complément intéressant à l’étude purement littéraire ; elle éclaire et conforte par une approche différente l’étude de l’évolution du style d’un écrivain et nous nous proposons d’illustrer la complémentarité des différentes techniques d’analyse par l’étude du syntagme verbal et de ses différents composants, en commençant par les pronoms.

3. Les pronoms

composants, en commençant par les pronoms. 3. Les pronoms Les pronoms constituent, avec leurs 243.150 occurrences,

Les pronoms constituent, avec leurs 243.150 occurrences, presque 10% de notre corpus. Nous ne nous intéresserons pas ici à la distribution de la catégorie dans son ensemble mais à une sous- catégorie : des pronoms personnels.

Pour diviser la catégorie des pronoms en sous-catégories, nous avons encore une fois eu recours au logiciel Hyperbase qui grâce à l’analyseur syntaxique Cordial répartit nos pronoms en sept sous- catégories : pronoms personnels réfléchis, pronoms personnels non réfléchis, pronoms possessifs, pronoms démonstratifs, pronoms interrogatifs, pronoms indéfinis et pronoms relatifs.

Ce regroupement permet de faire la même observation que dans presque toutes les autres études de même caractère : les plus grands nombres d’occurrences se trouvent dans les deux premières classes, celles des pronoms personnels qui, à eux seuls, occupent 67,8% de l’effectif.

Les pronoms personnels sont sujets à de nombreuses ambiguïtés. Une difficulté dans l’analyse statistique est leur homographie avec les articles : le, la, l’ et les sont facilement confondus avec les articles et les formes élidées sont souvent difficiles à désambiguïser. A ceci s’ajoute aussi le problème de la signification et le fait que dans la littérature, étant donné qu’il s’agit souvent de fiction et de narration, certains phénomènes stylistiques notamment, dans la littérature de l’école “nouveau roman”, mettent en jeu l’usage conventionnel des pronoms personnels.

Avec l’aide du logiciel Hyperbase nous pouvons fractionner encore la catégorie pour nous intéresser aux différentes personnes. Des 164.799 pronoms personnels, la première personne compte 35.573 occurrences, la deuxième 8.794 et la troisième 120.432. Ces résultats n’étonneront aucun lecteur de Le Clézio ; les résultats de l’analyse statistique confirment ici ce qui est visible à l’œil nu : que l’écriture leclézienne est très favorable au récit à la troisième personne. L’analyse factorielle des différents pronoms personnels permet d’y voir plus clair :

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

dans l’étude stylistique d’un texte littéraire ? Figure n°2 : Analyse factorielle des pronoms personnels du

Figure n°2 : Analyse factorielle des pronoms personnels du corpus A.

L’analyse distingue bien les trois personnes le long de l’axe horizontal de gauche à droite : Le chercheur d’or, La quarantaine, Poisson d’or et Printemps sont très près des pronoms à la première personne du singulier (tous rassemblés) avec la première personne du pluriel pas loin. Les ouvrages “nouveau roman” se rapprochent à leur tour des pronoms de la deuxième personne, et les pronoms de la troisième personne se trouvent à droite du tableau entourés des romans plus traditionnels de la deuxième période de Le Clézio. Le second axe sépare le singulier du pluriel, qui semble être favorisé par les ouvrages ethnologiques.

Des 164.799 pronoms personnels, la première personne compte 22% des occurrences, la deuxième 5% et la troisième 73%. Il est intéressant d’analyser les différentes personnes individuellement afin de mieux connaître leur distribution propre.

L’analyse de la distribution des pronoms personnels à la première personne montre que Le Clézio limite leur usage (relatif) à huit livres du corpus. En effet, l’usage de la première personne est excédentaire (sans pour autant atteindre un niveau significatif) dans le premier livre Le procès- verbal. Ensuite Le Clézio exploite de façon dominante le récit à la première personne dans L’extase matérielle, Le chercheur d’or, Printemps et autres saisons, Etoile errante, Pawana, La quarantaine ainsi que dans Poisson d’or (écart réduit de +86,3). La première personne est évidemment déficitaire dans les ouvrages ethnographiques.

Pour cette raison, isolons pour un instant l’œuvre romanesque et regardons l’histogramme de la distribution relative des pronoms personnels à la première personne :

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

dans l’étude stylistique d’un texte littéraire ? Figure n°3 : La distribution des pronoms personnels à

Figure n°3 : La distribution des pronoms personnels à la première personne dans le corpus B (écarts réduits).

L’histogramme souligne cette fois-ci l’importance de la première personne dans la seconde moitié de la production, surtout dans Le chercheur d’or et dans Poisson d’or mais aussi dans Printemps et dans La quarantaine, et à un moindre degré dans Etoile errante. Est-ce à mettre en rapport avec l’acceptation d’un certain classicisme, avec l’abandon des principes du “nouveau roman” ?

“Mon langage ne serait plus seulement celui des hommes et de leurs livres, écrit Le Clézio à cette époque [5], mais s’adresserait à n’importe qui sur la terre, et n’importe qui pourrait le comprendre.”

Toutefois, les taux déficitaires de la première période ne sont peut-être pas seulement l’effet d’un style recherché ; le fait d’éviter le récit à la première personne témoigne aussi de ce sentiment profond chez notre écrivain d’être à l’écart des autres, de la “non-acticvité”, comme l’appelle Jean Onimus [6] et de la “non-participation” à la société avec les autres.

Le Clézio essaye, au moins dans la première partie de sa production, de s’inscrire dans une marge de silence qui est produite par l’effacement du je de l’énonciation. En fait, il aimerait trouver ainsi une neutralité du langage, un espace où les mots pourraient s’accumuler d’eux-mêmes les uns à la suite des autres, où le livre pourrait s’écrire sans intervention d’aucun auteur. D’autre part, la disparition du je laisse aussi une place à un silence. C’est pourquoi Le Clézio nous dit que pour atteindre ce silence il lui faudrait tuer en lui un grand nombre de mots [7] :

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

“Ce n’est pas facile de rendre les mots silencieux. Ce n’est pas facile de soudain éteindre le haut-parleur qu’on a branché dans ma gorge, de voiler les lentilles qu’on a cachées dans mes yeux, de crever les membranes qui vibrent au fond de mes oreilles… […] Quand on a appris à parler, que reste-t-il ? Apprendre à se taire voilà.”

Le “je” de la première période n’est pas non plus le même que celui de la dernière période.

L’évolution du “je” depuis le premier roman Le procès-verbal

d’une vie et d’une œuvre. Entre le “je” du jeune homme Adam Pollo et celui du capitaine décadent Moguer dans Hasard le lecteur fait un long voyage à travers le monde et accumule beaucoup d’expérience, aboutissant à ce ”je” de la maturité, d’un homme d’un certain âge, parfois résigné.

jusqu’à la fin du corpus est bien celle

Regardons maintenant la situation de la deuxième personne, totalement différente. La deuxième personne est la moins fréquente dans l’œuvre leclézienne et sa distribution diffère de celle de la première personne de façon significative. L’histogramme ci-dessous rend compte de la différence :

L’histogramme ci-dessous rend compte de la différence : Figure n°4 : La distribution des pronoms personnels

Figure n°4 : La distribution des pronoms personnels à la deuxième personne dans le corpus A (écarts réduits).

Il est aisé de constater que Le Clézio fait l’usage de la deuxième personne surtout au début de sa carrière littéraire, dans les premiers ouvrages ; Le procès-verbal, La fièvre, Le déluge ainsi que Voyages de l’autre côté en sont des témoins significatifs. Par la suite, nous pouvons observer un déclin de son usage à travers le corpus : le coefficient de corrélation chronologique atteint ici un taux significatif.

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

Les valeurs d’usage des pronoms de deuxième personne peuvent naturellement être assez variées :

le pronom vous, ambigu, peut être une forme de politesse ou un vrai pluriel ; le pronom tu peut apparaître dans les dialogues entre personnages, comme dans Poisson d’or, ou lorsque l’auteur s’adresse fictivement au lecteur, comme dans Voyages de l’autre côté où l’auteur mène une sorte de dialogue avec le lecteur et l’“implique” ainsi dans le récit [8] :

“Naja Naja voyage dans les arbres. Ça, ce n’est pas facile. Voici comment il faut faire : tu sors de la ville, et tu montes tous ces escaliers qui conduisent vers le haut des collines bleues. Tu montes les marches des escaliers sans te presser. C’est même préférable de monter lentement, pour garder ton souffle. Il y a de moins en moins de maisons, de plus en plus de jardins. De temps à autre, tu te retournes et tu vois la ville qui s’étend au pied des collines bleues.”

Néanmoins le regroupement des formes du singulier au début de l’œuvre manifeste aussi une part d’homogénéité dans leur emploi. Il convient donc de rappeler que cette catégorie du pronom personnel à la deuxième personne, tout en étant minoritaire dans l’ensemble, est quand même significative d’un style et d’une technique d’expression que Le Clézio semble abandonner au fur et à mesure que l’œuvre progresse.

C’est effectivement la troisième personne qui domine la catégorie des pronoms personnels avec ses 120.432 effectifs, englobant 73% des occurrences. Le lecteur de Le Clézio sait déjà qu’il favorise globalement le récit traditionnel à la troisième personne.

Cependant, l’histogramme de la figure n°5 montre que la distribution interne n’est pas régulière à travers le corpus :

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

dans l’étude stylistique d’un texte littéraire ? Figure n°5 : La distribution des pronoms personnels à

Figure n°5 : La distribution des pronoms personnels à la troisième personne dans le corpus A (écarts réduits).

Les pronoms personnels à la troisième personne sont, soit légèrement excédentaires, soit déficitaires dans les premiers ouvrages inspirés par l’école du “nouveau roman” qui privilégie des formes moins conventionnelles que le récit traditionnel à la troisième personne. L’histoire de Naja Naja dans Voyages de l’autre côté exploite en revanche de façon significative la troisième personne. Mondo, qui marque le tournant dans l’écriture romanesque de Le Clézio, est aussi largement excédentaire. Les romans qui suivent – à l’exception du roman Le chercheur d’or, de Voyage à Rodrigues et de La quarantaine - offrent également des excédents. Nous avons vu que la réticence à l’égard de la première personne s’estompe à la fin de son œuvre ; corollairement, la troisième personne perd alors de son importance.

En revanche, Le Clézio exploite moins la troisième personne dans les genres non romanesques où nous trouvons des valeurs déficitaires parfois importantes.L’histogramme ci-dessous, s’appuyant sur le corpus purement romanesque, rend mieux compte de l’évolution de l’utilisation de la troisième personne dans l’écriture uniquement romanesque :

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

dans l’étude stylistique d’un texte littéraire ? Figure n°6 : La distribution des pronoms personnels à

Figure n°6 : La distribution des pronoms personnels à la troisième personne dans le corpus B (écarts réduits).

La figure permet en effet de distinguer plusieurs périodes dans l’œuvre : une première déficitaire, un changement après Le livre des fuites vers un emploi significatif de la troisième personne jusqu’à Le chercheur d’or,où l’emploi de la première personne dominait nettement [9]. Par la suite, notons un

nouvel emploi significatif, suivi des valeurs déficitaires dans La quarantaine mais qui se termine par une hausse dans le dernier livre du corpus.

et dans Poisson d’or

Dans Le livre des fuites Le Clézio nous annonce sa première rupture de style. Après avoir déclaré au début du livre [10] : “Malhonnêteté désespérante de celui qui n’ose pas dire ‘je’, Le Clézio passe progressivement dans les livres suivants à un récit à la troisième personne qui se rapproche parfois du conte. Jean Onimus est persuadé que l’œuvre de J.M.G. Le Clézio est avant tout celle d’un conteur [11] :

“Dire que Le Clézio est plutôt un conteur qu’un romancier peut paraître un paradoxe quand on pense au caractère typiquement “baroque” de ses livres, avec leur intense, leur exubérante vitalité, la variété des tons et de styles, la tragique obsession de la mort, le dédain pour les stylisations classiques. Pourtant n’est-il pas l’auteur de contes pour enfants ?”

Ce récit à la troisième personne semble correspondre aussi au personnage de Le Clézio qui, connu par sa modestie, a souvent évité le “je” au profit de l’écriture à la troisième personne. Jean-Xavier Ridon consacre une étude à cet effacement de soi [12] :

“Cet effacement de la voix propre à l’auteur se réalise constamment dans les textes de le

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

Clézio par le jeu des pronoms personnels mais aussi par l’utilisation des différents discours (direct, indirect, indirect libre) qui constituent la langue. On ne sait pas toujours qui parle ou qui s’écrit. Est-ce l’auteur ? Est-ce les personnages ou bien nous-mêmes, lecteurs, auxquels on prêterait la parole ?”

Cependant, l’utilisation répétée du pronom personnel on (9158 occurrences) nous montre aussi que Le Clézio garde en lui le désir d’une écriture qui puisse s’élaborer sans je, ou tout du moins dépasser le cadre de cette instance énonciatrice tout en gardant une forme d’honnêteté.

L’emploi du pronom on, très important dans la première partie de l’œuvre, est abandonné à la fin des années 70, au même moment que le récit à la troisième personne est introduit de façon significative dans l’œuvre. L’utilisation du pronom on, qui culmine dans Voyages de l’autre côté, semble vraiment caractéristique de la première période de l’écriture leclézienne, influencée par l’école du “nouveau roman”.

Le pronom on permet de concilier toutes les voix (celle de l’auteur, celle des personnages ou bien celle des lecteurs) car il peut représenter en même temps le narrateur, son personnage, l’écrivain et le lecteur. En ce sens, il place dans un espace identique une diversité de voix différentes, technique caractéristique de l’école du “nouveau roman”.

Mais on est aussi un principe de multiplicité et de différence puisque la voix qui parle par son intermédiaire est rendue générale, donc multiple ; cela donne un caractère de doute au récit, comme ici dans Le livre des fuites [13] :

“On fuyait vraiment, on s’en allait comme s’il y avait eu une catastrophe toute proche qui devait détruire ce pays. Eux ne le savaient pas. Personne ne le savait.”

Mais ce on vient aussi prendre le lecteur, en incluant dans un mouvement que l’écriture et par la suite la lecture tenteraient de lui procurer. Le Clézio nous renverrait alors à la dimension de la lecture comme voyage et selon le même principe de dérive que l’on voit chez les auteurs appartenant à l’école du “nouveau roman”.

Les pronoms sont dans les analyses factorielles de la distribution des parties du discours [14], étroitement liés à une autre catégorie grammaticale, celle des verbes. Car au-delà des pronoms, la catégorie verbale et la façon dont elle est exploitée dans le récit peut être très révélatrice d’un écrivain et de son style, d’une époque ou bien d’une mode. On ne saurait donc envisager l’étude “grammatico-métrique” de Le Clézio sans s’intéresser à la sphère verbale.

4. La catégorie verbale

à la sphère verbale. 4. La catégorie verbale La difficulté de l’analyse verbale est bien documentée

La difficulté de l’analyse verbale est bien documentée ; les ambiguïtés lexicales aussi bien que celles qui relèvent de la grammaire posent de nombreux problèmes. Il y a donc deux préparations importantes à effectuer lors du traitement des formes verbales pour que la recherche statistique soit fiable et valable : d’abord la lemmatisation, qui a pour tâche de lever les ambiguïtés lexicales, ensuite l’étiquetage morpho-syntaxique pour lever les ambiguïtés grammaticales.

Nous avons pu effectuer une analyse de l’ensemble des verbes dans le corpus Le Clézio avec l’aide

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

du logiciel Hyperbase qui a l’avantage d’opérer de façon totalement automatique pour ainsi – même si certains ambiguïtés restent insolubles – effectuer un tri qui s’appuie sur une analyse syntaxique toujours égale.

Des études antérieures, notamment du corpus Frantext, avaient déjà repéré [15], le progrès des verbes au détriment des substantifs sur la période 1789-1960 [16]. Dans notre corpus les verbes progressent dans les œuvres de fiction - romans et recueils de nouvelles, mais en revanche ils reculent dans les essais et les ouvrages d’ethnologie. Le rêve mexicain, La fête chantée et Diego et Frida, qui comptaient des valeurs excédentaires importantes en substantifs, sont fortement déficitaires en verbes.

Les textes qui favorisent les substantifs sont souvent caractérisés comme “descriptifs”, “pittoresques” et “substantiels” tandis que ceux qui favorisent les verbes sont qualifiés comme étant “pleins d’actions”. Dans notre corpus “l’action” ne semble pas être située dans les ouvrages que nous venons de citer, mais plutôt dans les romans.

Écartons donc pour un instant les ouvrages d’ethnologie et les essais, pour regarder de plus près l’œuvre romanesque. L’histogramme de la distribution de verbes dans le corpus romanesque (B) permet d’affiner l’analyse des variations constatées auparavant :

l’analyse des variations constatées auparavant : Figure n°7 : La distribution relative de verbes dans le

Figure n°7 : La distribution relative de verbes dans le corpus romanesque (le corpus B).

L’histogramme divise cette fois-ci plus clairement l’œuvre leclézienne en plusieurs périodes. Les verbes sont déficitaires dans toute la première période, ce n’est qu’à partir de Mondo que nous pouvons observer des valeurs excédentaires. Cette variation correspond bien au changement du

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

style dans l’écriture leclézienne et à la rupture dans l’œuvre dont les différentes études statistiques témoignent. Par la suite, durant la deuxième période, Désert, Le chercheur d’or, Voyage à Rodrigues et Onitsha – les romans riches en substantifs – sont déficitaires en verbes et vice versa. Dans le dernier tiers du corpus nous constatons l’augmentation progressive des verbes, correspondant au retour vers le roman traditionnel, et une écriture plus conventionnelle. Ces livres semblent privilégier l’action au détriment du substantif, plus “contemplatif”. L’opposition la plus marquée est à observer dans Poisson d’or, le livre le plus riche de verbes (écart réduit de +19), dans lequel la jeune Laïla affronte la vie, un roman qui abonde véritablement en action [17].

“Quand je sentais qu’il était bien fatigué, je m’en allais. J’embrassais sa main, et lui appuyait un instant sa paume sur mon front, descendait sur mes yeux, sur mon nez, mes joues, mes lèvres. Il disait : “Au revoir, ma fille”, comme si j’étais vraiment Marima. Peut-être qu’il croyait vraiment que j’étais elle. Peut-être qu’il avait oublié. Peut-être que c’était moi qui étais devenue semblable à elle, à force de venir auprès de son grand-père, à force de l’écouter raconter ce qu’il avait vécu là-bas, au bord du fleuve.”

Toutefois, lorsque l’on s’intéresse à la fréquence et à la distribution de verbes dans un corpus, il convient de prendre en considération la distinction des différentes catégories de verbes. Le logiciel Hyperbase permet désormais de distinguer et de regrouper les sous-catégories de verbes de façon automatique. L’analyse regroupe les verbes selon leur statut de principal ou d’auxiliaire, selon le mode, selon le temps exprimé ou bien selon la personne [18]. Nous nous intéresserons ici à un caractère fondamental de la forme verbale : le mode.

5. Les modes verbaux

de la forme verbale : le mode. 5. Les modes verbaux Les modes du verbe français

Les modes du verbe français se distinguent selon la tradition et les textes officiels en cinq ou en six modes : infinitif, participe, subjonctif, impératif, indicatif et conditionnel [19].

La distribution des différents modes dans notre corpus est celle que l’on trouve dans pratiquement tous les corpus littéraires, c’est-à-dire avec un indicatif qui domine largement (63,3%), les participes et les infinitifs qui occupent à peu près un quart du groupe (respectivement 19,2% et 14,4%). Quant aux autres modes, ils sont largement minoritaires (conditionnel 1,6%, impératif, 0,8% et subjonctif

0,7%).

L’analyse factorielle nous permet de situer les différents ouvrages de notre corpus par rapport à la distribution des modes :

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

dans l’étude stylistique d’un texte littéraire ? Figure n°8 : Analyse factorielle des modes verbaux dans

Figure n°8 : Analyse factorielle des modes verbaux dans le corpus A.

Le premier axe du graphique rend compte de l’opposition des genres littéraires, qui semble avoir une influence importante sur l’usage des différents modes verbaux. Les romans “traditionnels” se trouvent relativement au milieu du champ, dans la partie supérieure entre l’indicatif, qui est le mode traditionnel du récit, et le participe, qui est ici la trace des temps composés, en particulier celle du passé composé. Le subjonctif, le conditionnel et l’impératif appartiennent aux livres inspirés de l’école “nouveau roman”, regroupés en bas et à droite du graphique. Les essais tardifs, Le rêve mexicain et La fête chantée ainsi que Diego et Frida, se trouvent ensemble éloignés du reste, en bas et à gauche. L’axe vertical reflète la chronologie de l’œuvre et rend bien compte de l’évolution dans l’écriture leclézienne. Les effets du style et la langue souvent recherchée du début de l’œuvre – se manifestant par le recours à des modes comme le subjonctif, le conditionnel ou l’impératif qui va bien de pair avec l’abondance des exclamations relevée par ailleurs [20] – seront abandonnés en faveur d’un style moins recherché, d’un récit plus traditionnel et une simplicité voulue de l’écrivain, privilégiant l’indicatif. L’indicatif domine effectivement le récit leclézien ; attardons-nous quelques instants sur ce mode, celui du récit par excellence.

L’indicatif tient une position centrale dans le système verbal. Nous avons vu que dans notre corpus il occupe 63,3% de la catégorie verbale. L’analyse de la distribution interne met encore en relief l’opposition des genres littéraires que nous avons constatée dans l’analyse factorielle. Les romans et les recueils de nouvelles privilégient l’indicatif – à l’exception des premiers romans et de Voyages à Rodrigues – tandis que ce mode est déficitaire dans les essais, dans les ouvrages d’ethnologie, dans la biographie et dans le récit de voyage. Nous pouvons aussi observer la tendance chronologique de cette distribution, avec des valeurs négatives de plus en plus importantes au fur et à mesure que l’œuvre progresse. C’est dans ces livres que nous avons pu observer auparavant les

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

déficits les plus grands par rapport à la catégorie des verbes dans son ensemble.

L’étude de l’œuvre purement romanesque, la même analyse permet d’affiner l’étude :

romanesque, la même analyse permet d’affiner l’étude : Figure n°9 : La distribution relative de l’indicatif

Figure n°9 : La distribution relative de l’indicatif dans le corpus B (écarts réduits).

Les valeurs largement déficitaires des premiers romans témoignent de la particularité du style “nouveau roman” qui, une fois de plus, s’écarte des autres parties de l’œuvre de façon significative. L’écriture expérimentale de cette période repousse le verbe en général, et semble particulièrement “éviter” le mode de l’indicatif qui est son principal associé.

En ce qui concerne Voyage à Rodrigues, l’explication du déficit important (écart réduit de -18) réside probablement dans le style particulier - ni favorable au récit, ni à l’action - du livre, rédigé souvent sous forme de notes et d’observations écrites par le grand-père de Le Clézio, une écriture qui semble à première vue favoriser les participes [21] au détriment des verbes à l’indicatif [22] :

“Le point R : “Coin nettement poinçonné dans la pierre, dont l’un des pans est dirigé vers le point Z.” Le point Z : “Énorme bosse en forme de fût de colonne, enterrée perpendiculairement dans le sol, et dont le sommet supérieur, aminci par deux pans parallèles, était dirigé vers le point 29.”

Les valeurs significativement positives de l’emploi de l’indicatif sont à trouver dans les romans qui privilégient l’action et le récit plus traditionnel. Néanmoins, le graphique permet de constater des différences par rapport à l’histogramme de la distribution de la catégorie verbale dans son ensemble. La guerre et Voyages de l’autre côté sont déficitaires de verbes dans l’ensemble mais excédentaires

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

pour le mode à l’intérieur de la catégorie verbale. A l’inverse, La quarantaine et Hasard qui sont excédentaires en verbes semblent puiser leur richesse dans d’autres modes que celui de l’indicatif.

Un autre mode, plus marginal, qui met en relief les changements dans l’écriture leclézienne, est celui de l’impératif.

Bien que l’impératif soit un mode très limité dans notre corpus, sa distribution n’est pas sans intérêt. L’histogramme ci-dessous rend compte de la distribution relative des 2721 effectifs de la classe :

la distribution relative des 2721 effectifs de la classe : Figure n°10 : La distribution relative

Figure n°10 : La distribution relative de l’impératif dans le corpus A (écarts réduits).

Le style particulier des premiers livres du corpus, ceux influencés par l’école du “nouveau roman”, fait appel à l’impératif. A partir de Voyages de l’autre côté, Le Clézio abandonne totalement ce mode (coefficient de corrélation significativement négatif : -0,575). Nous avons déjà commenté ce changement de style lors de notre étude du point d’exclamation [23], mais il convient de noter à ce propos que l’impératif ne fait pas toujours appel au point d’exclamation et par conséquent les histogrammes ne sont pas tout à fait superposables, comme rend compte, ci-dessous, les deux courbes mises en parallèle :

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

dans l’étude stylistique d’un texte littéraire ? Figure n°11 : La distribution relative du mode impératif

Figure n°11 : La distribution relative du mode impératif et point d’exclamation dans le corpus A (écarts réduits).

Nous ne retrouvons pas dans la courbe de l’impératif le pic extraordinaire de Le livre des fuites qui contient 23% des points d’exclamation à lui seul, et La fête chantée, excédentaire en verbes à impératif, est déficitaire en points d’exclamation. C’est peut-être la courbe du quotient [24] sur les deux catégories qui nous renseigne le mieux sur leur corrélation :

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

dans l’étude stylistique d’un texte littéraire ? Figure n°12 : Quotient sur impératif/point d’exclamation

Figure n°12 : Quotient sur impératif/point d’exclamation dans le corpus B (écarts réduits).

En effet, la corrélation est loin d’être significative. C’est dans les ouvrages des genres autres que romanesques et dans Voyage à Rodrigues que nous trouvons les “pics” les plus importants, notamment dans les livres ethnologiques et les œuvres qui traitent du monde amérindien. Dans ces œuvres la recherche des effets stylistiques et d’un style particulier est évidemment moindre, le but de l’écriture étant différent.

Les histogrammes de l’impératif reflètent bien sûr la proximité entre ce mode et l’usage de la deuxième personne. C’est en effet dans les livres où l’usage de la deuxième personne est important que nous trouvons les formes de l’impératif.

Un autre mode qui semble aussi particulièrement lié à la première période de l’écriture leclézienne est celui du conditionnel. 1,6% des verbes (5131 occurrences) de notre corpus sont conjugués au conditionnel. L’histogramme suivant illustre l’évolution de l’emploi du conditionnel dans l’écriture romanesque (corpus B) :

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

dans l’étude stylistique d’un texte littéraire ? Figure n°13 : La distribution relative du conditionnel dans

Figure n°13 : La distribution relative du conditionnel dans le corpus B (écarts réduits).

Ce graphique permet de distinguer clairement les trois périodes que nous pouvons si souvent observer dans l’écriture leclézienne. Après les “bâtons” excédentaires de la première époque, nous constatons que les “bâtons” sont déficitaires à partir de la dernière moitié des années 70 jusqu’à La quarantaine. Dans les deux derniers ouvrages du corpus, Poisson d’or et Hasard, nous pouvons toutefois observer un retour de ce mode dans l’écriture romanesque.

Le conditionnel est surtout exploité dans le premier roman, Le procès-verbal, qui contient 12,4% des formes au conditionnel du corpus purement romanesque. Ce mode semble très bien convenir aux rêves, parfois délirants, du jeune Adam Pollo [25] :

“Voici à quoi je passerais mes journées : j’aurais un bout de terrain plein de cailloux, exposé au soleil du matin jusqu’au soir. Au milieu du terrain, je ferais des feux. Je brûlerais des planches, du verre, de la fonte, du caoutchouc, tout ce que je trouverais. Je ferais des sortes de sculptures, comme ça, directement avec le feu. Des objets tout en noir, calcinés dans le vent et dans la poussière. Je jetterais des troncs d’arbres et je les ferais brûler ; je tordrais tout, je noircirais tout, j’enduirais tout d’une poudre crissante, je ferais monter haut les flammes, j’épaissirais la fumée en volutes lourdaudes. Les langues orange hérisseraient la terre, secoueraient le ciel jusqu’aux nuages. Le soleil livide lutterait avec elles pendant des heures.”

Le conditionnel serait pour Le Clézio le mode du rêve. Ruth Holzberg remarque intuitivement ce phénomène dans son étude psychocritique de l’œuvre [26] :

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

“Du rêve traduit par le conditionnel, écrit-elle, Le Clézio passe au futur des prophéties, prédisant qu’un jour il n’y aura qu’un seul langage né du vent, de l’ombre et de la lumière magique créé par le regard libérateur des enfants.”

En effet, le style “dépouillé” qu’adopte Le Clézio après la rupture du style “nouveau roman”, dans sa deuxième période, semble tout à fait hostile à l’usage du conditionnel, ce que confirme la citation suivante, tirée de L’extase matérielle, à propos de la création et de l’art [27] :

“L’art, présent dans la vie, simple relation des événements réels, ignoble ou beau à la mesure de ce qui est faste ou néfaste. Le champ des possibles, mais il est réalisable. Effet qui n’est pas détaché de sa cause, sudation du physique, pensée de l’acte, pensée du lieu précis, du temps précis, des individus déterminés, des forces multiples qui livrent le grand combat. Journal de la guerre dans le monde. Pensée concrète. Tout ce qui ne va pas dans le sens de l’adhésion au réel n’est que remâchonnement de théories usées, abstraction, décollement. Il y a mille façons d’exprimer ce qui est, mais il n’y a qu’une raison de ne pas fuir.”

Un tel principe esthétique explique bien le très faible emploi, et du subjonctif, et du conditionnel, modes qui l’un et l’autre ouvrent un monde fictif, donnent à voir une réalité virtuelle, une construction mentale du sujet énonciateur.

Tandis que l’indicatif exprime des faits réels, la sphère du subjonctif est celle des faits envisagés par l’esprit. L’analyse quantitative et le repérage de ces formes permettent d’étudier ce mode stylistiquement significatif chez un écrivain.

“Avec le subjonctif nous arrivons au mode le plus mystérieux ou du moins le plus gros de secrets, le plus délicat d’emploi mais aussi le plus riche en nuances fines, des langues parvenues, comme le français, à un haut développement. Et l’on peut penser qu’à ces titres, le subjonctif est peut-être, pour qui le connaît bien et en joue juste, la marque la plus sûre d’une connaissance approfondie de notre langue. [28]”

L’étude statistique montre que Clézio n’a pas souvent recours au subjonctif. Le logiciel Hyperbase a repéré seuls que 0,7% des verbes (2189 occurrences) du corpus sont conjugués au subjonctif. La comparaison avec d’autres corpus lemmatisés avec l’outil Cordial 7 révèle un usage plus bien plus restreint que dans les autres corpus examinés (corpus Francil [29] 1,1%, corpus Hugo 1,8%).

De fait, l’usage du subjonctif est limité à quelques œuvres du corpus. C’est uniquement dans le premier roman Le procès-verbal et dans le premier essai L’extase matérielle ainsi que dans Poisson d’or de la fin de l’œuvre que Le Clézio exploite le mode du subjonctif de façon significative. Tous les autres ouvrages sont, soit très peu excédentaires, soit déficitaires.

Dans Le procès-verbal ce mode virtuel, semble - tout comme le conditionnel – convenir à ce récit qui est construit à partir d’un délire ou d’un rêve. Adam Pollo s’abandonne en fait continuellement dans son propre univers [30] :

“Lentement, doucement, insensiblement, Adam oublia qu’il était Adam, qu’il avait des tas de choses à lui, en bas, dans la chambre, au soleil ; des tas de chaises longues, des journaux,

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

des gribouillis de toutes sortes, et des couvertures imprégnées de son odeur, et des bouts de papier, sur lesquels il avait écrit, comme pour des lettres, “ma chère Michèle”.”

Dans ces moments, comme celui-ci où Adam se transforme en rat blanc, l’auteur a souvent recours aux modes du virtuel et met ainsi en exergue le côté irréaliste, ou bien fou, des métamorphoses et des délires, comme dans l’exemple suivant [31] :

“Un homme comme lui suffirait à jamais ; il n’aurait qu’à vouloir faire quelques pas, élever son pied un peu en l’air, pour que le rat soit tué, écrasé, les côtes brisées, la tête oblongue traînant sur le bois du parquet, dans une minuscule mare d’humeur et de lymphe. Et soudain, devenu la peur, métamorphosé en le danger-pour-les-rats-blancs, il se leva ; ce qu’il avait plein la tête, ce n’était plus de la colère, ni du dégoût, ni quoi que ce soit de cruel.”

Dans L’extase matérielle la situation est différente. Il ne s’agit pas de fiction dans cet essai littéraire mais d’un discours hautement intellectuel, favorable à l’usage du subjonctif dans les phrases complexes à nombreuses subordonnées, comme dans l’exemple suivant [32] :

“L’art reste sur la lancée du transcendantalisme. Peu importe ce que soit cet ailleurs, mais il leur faut un “ailleurs”. En détruisant le langage, en voulant assassiner la littérature, ils ne font que souscrire à la construction de l’édifice abstrait d’un “autre” langage, d’une “autre” littérature, vain idéal de beauté et de pureté qui leur permet d’oublier avec mépris le domaine de la communication réelle. […] Ils ne veulent pas admettre que cette contradiction ne soit qu’une apparence, et que le passage de la réalité à l’imaginaire soit simplement transhumance d’un réel vers un autre réel.”

Par ailleurs, l’écriture leclézienne n’est pas favorable à ce mode. Le style qui ne manque ni de mystère ni de secrets, encore moins de nuances fines semble puiser ces richesses ailleurs que dans l’usage itératif du subjonctif.

Ce sont peut-être les formules à l’infinitif qui constituent le mode qui frappe le lecteur. L’usage de l’infinitif serait-il une caractéristique de J.M.G. Le Clézio ? Il semble que ce mode impersonnel et “distant” convienne parfaitement à l’écriture leclézienne.

Le mode impersonnel de l’infinitif représente 14,4% des verbes avec ses 46.114 occurrences dans notre corpus. A la comparaison avec d’autres corpus littéraires il s’avère que son usage n’est pas significativement plus important et que l’originalité réside plutôt dans son usage.

La dépersonnalisation des phrases est en effet une constante de l’écriture leclézienne, visible aussi, comme nous l’avons vu, dans son affinité pour le pronom on. Les phrases à l’infinitif, permettent la création d’un espace intemporel, alors que les phrases nominales donnent une valorisation nouvelle des images à travers une fixation contemplative sur une situation. Surtout dans les livres de la première période, à rythme saccadé, le récit de l’éternelle fuite des personnages est régulièrement ponctué par de courtes phrases interrogatives à l’infinitif référant à l’acte de fuir et exprimant la quête ou le désarroi du personnage [33] :

“Où aller ? Où plonger, dans quel vide, où enfouir sa tête entre les oreillers de pierre ? Qu’écrire sur la feuille de papier blanc, noire déjà de toutes les écritures possibles ? Choisir,

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

pourquoi choisir ? Laisser tous les bruits courir, laisser les mouvements rouler leurs trains fous vers des destinations inconnues.”

L’utilisation de l’infinitif contribue aussi à donner à certains passages des romans lecléziens un ton onirique. Hervé Lambert a d’ailleurs souligné “une obsédante rêverie de l’infinitif” chez Le Clézio [34] :

“L’infinitif est le monde idéal pour la rhétorique d’un inconscient en pulsion de fuite”, dit-il “hors du nombre, du genre, hors du temps, il est l‘expression idéale d’une présence pure, transparente, tout en exprimant un souhait, un désir : Partir et devenir autre. Infinitif du souhait, désir d’infinitif.”

L’infinitif, mode de l’action non encore actualisé [35], assure en effet l’expression simultanée du rêve et de l’intemporel. L’intemporalité des actes est soulignée à travers l’absence de la personne évoquant une rêverie universelle qui incite le lecteur à prendre part à la pensée associative [36] :

“Fuir, toujours fuir. Partir, quitter ce lieu, ce temps, cette peau, cette pensée. M’extraire du monde, abandonner mes propriétés, rejeter mes mots et mes idées, et m’en aller. Quitter, pour quoi, pour qui ? Trouver un autre monde, habiter une autre ville, connaître d’autres femmes, d’autres hommes, vivre sous un autre ciel ? […] Fuir : fuir la fuite même, nier jusqu’à l’ultime plaisir de la négation. Entrer en soi, se dissoudre, s’évaporer sous le feu de la conscience, se résoudre en cendres, vivement, sans répit.”

Ces phrases courtes, constituées presque uniquement du verbe à l’infinitif, expriment souvent le surgissement d’un désir. L’infinitif constitue ainsi un élément de base dans une écriture poétique fondée sur l’association libre d’idées, où l’absence de sujet peut être comblée par un lecteur invité à participer à la même création d’associations.

Comment l’infinitif est-il reparti dans notre corpus ? Peut-on distinguer les différentes périodes et les genres divers que nous avons pu si souvent constater ? Pour mieux saisir ces variations dans l’œuvre romanesque de Le Clézio, nous nous intéressons encore une fois au corpus romanesque (corpus B) dont l’histogramme ci-dessous illustre la distribution relative d’infinitifs :

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

dans l’étude stylistique d’un texte littéraire ? Figure n°14 : La distribution relative du mode de

Figure n°14 : La distribution relative du mode de l’infinitif à travers le corpus romanesque (écarts réduits).

Il est difficile dans ce graphique hétérogène de dégager des structures ou des caractéristiques relatives à une période précise de l’œuvre : il n’y a en effet pas de tendance significative à relever dans cet histogramme. Le procès-verbal est le plus riche d’infinitifs bien que l’écart réduit ne soit que de 8. Les livres qui suivent sont plutôt déficitaires avec le point inférieur dans Voyages de l’autre côté (écart réduit -7). Il semble que les livres qui privilégient le dialogue sont plus riches en infinitifs que les ouvrages privilégiant le récit à la troisième personne.

Cette constatation semble assez paradoxale car l’on aurait pu s’attendre à une richesse relative de formes conjuguées dans les dialogues et les monologues, dans des livres comme Le procès-verbal, Printemps et autres saisons, Etoile errante, Poisson d’or et Hasard. Ces livres ne semblent pas, au lecteur, appartenir à la catégorie d’ouvrages qui exploite la technique d’écriture que nous venons d’exposer, contribuant à donner au récit le climat particulier d’universalité précédemment décrit, bien au contraire.

Pourquoi trouvons-nous donc cette richesse d’infinitifs dans ces ouvrages qui abondent de dialogue et d’oralité ? Il semble que l’explication soit l’usage fréquent du futur proche et du passé récent dans les dialogues et les pensées des jeunes personnages, périphrases verbales qui font obligatoirement appel à l’infinitif [37] :

“Dans la chambre sans fenêtre, je vois la lueur du jour qui arrive, qui emplit la pièce où dort ma mère. Je suis fatiguée d’attendre. Bientôt le réveil va sonner, ma mère va se lever pour préparer du café. Je vais devoir me lever à mon tour, je vais sortir, commencer une nouvelle journée. C’est ça qui me fait peur, et pourtant je voudrais que ça soit déjà là, que ce qui doit

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

arriver arrive.”

Le dernier mode verbal est celui des participes [38], qui ne sont pas sans intérêt dans le corpus Le Clézio. Les participes occupent 19,2% de la catégorie verbale ce qui, rappelons-le, les place en deuxième position dans la hiérarchie des modes chez notre auteur.

L’évolution de l’emploi de participes dans le corpus est nettement positive (coefficient de corrélation de +0,545) : Le Clézio, après un début déficitaire, fait de plus en plus usage des participes, au fur et à mesure que l’œuvre progresse et notamment dans les romans.

C’est encore une fois l’histogramme de la distribution dans le corpus romanesque qui rend le mieux compte de cette évolution, le coefficient de corrélation chronologique atteignant ici une valeur remarquablement haute :

atteignant ici une valeur remarquablement haute : Figure n°15 : La distribution relative des participes dans

Figure n°15 : La distribution relative des participes dans le corpus B (écarts réduits).

Dans cette figure la rupture est nette, toutefois située plus tard que dans les histogrammes précédents des autres modes verbaux. Les participes sont significativement déficitaires dans le début de l’œuvre et ce n’est qu’à partir de Voyage à Rodrigues que nous pouvons relever des valeurs positives. Les valeurs les plus excédentaires sont à trouver dans La quarantaine qui partout ailleurs nous a montré des valeurs déficitaires.

Pour quelle raison ce mode est-il associé à la dernière moitié de l’œuvre romanesque ? Si nous regardons de plus près ce mode en isolant les participes passés, nous pouvons observer une courbe encore plus nette que la précédente (coefficient de corrélation chronologique de + 0,824) :

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

dans l’étude stylistique d’un texte littéraire ? Figure n°16 : La distribution relative des participes

Figure n°16 : La distribution relative des participes passés dans le corpus B (écarts réduits).

Les participes passés sont en fait le témoin observable des temps composés que Le Clézio exploite surtout dans la dernière moitié de l’œuvre. Le passé composé est une forme ambiguë, expression de l’accompli souvent, de l’inachevé parfois, de l’immédiatement antérieur au présent ou, au contraire, employé pour le passé simple à partir des ouvrages de la fin des années 1980. Ce denier phénomène témoigne de l’abandon d’une certaine recherche stylistique caractéristique du début de l’œuvre pour une écriture plus “simple” ayant recours aux temps composés, souvent considérés comme plus familiers et moins littéraires.

Le roman La quarantaine, largement excédentaire en participes passés (écart réduit de +29) est en grande partie écrit au passé composé [39] :

“Tout le jour, je suis allé et venu entre la Quarantaine et la pointe rocheuse, pour attendre Surya, sans y croire. J’ai découvert que les plants de batatrans et les buissons portent maintenant la marque de mes pas, une sorte de sente que j’ai tracée à force de circuler, comme la trace d’une bête. C’est cette découverte qui m’a fait ressentir le temps écoulé plus que ne l’aurait fait aucun calendrier.”

L’étude des différents modes verbaux de notre corpus montre bien que l’usage qu’en fait notre écrivain n’est pas entièrement stable. Leur emploi reflète les changements dans l’écriture leclézienne et met une fois de plus en évidence les périodes distinctes de l’œuvre. Toutefois, par delà ces fluctuations chronologiques, la méfiance à l’égard des modes explicitant la subjectivité du

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

locuteur ou construisant une image virtuelle du monde semble constituer une caractéristique fondamentale de l’écriture leclézienne.

6. Conclusion

fondamentale de l’écriture leclézienne. 6. Conclusion Cette étude n’a pas la prétention de traiter tous les

Cette étude n’a pas la prétention de traiter tous les aspects sous lesquels on pourrait étudier les parties du discours et les éléments syntaxiques. Notamment au-delà des modes du verbe, la temporalité et la façon dont elle est exploitée dans le récit peuvent être très révélatrice d’un écrivain et de son style, d’une époque ou bien d’une mode. L’étude de temps verbaux et de l’usage très personnel qu’en fait Le Clézio permet de mieux cerner une technique qui consiste à donner au récit cette valeur universelle tant appréciée par ses lecteurs.

Bien qu’il faille admettre une certaine marge d’erreur ou d’incertitude sur les chiffres due à l’opacité relative de l’analyseur morpho-syntaxique ces doutes ne mettent pas en cause les grandes tendances qu’au contraire seule l’analyse statistique d’un grand corpus lemmatisé peut mettre en évidence. Le graphique ci-dessous, qui mesure la distance intertextuelle s’appuyant sur l’ensemble de tous les codes grammaticaux [40] affectés par l’étiqueteur, confirme également les résultats de notre analyse, mettant en exergue les mêmes liens et les mêmes oppositions entre les différents textes que ceux déjà observés à plusieurs reprises :

textes que ceux déjà observés à plusieurs reprises : Figure n°17 : Distance entre les codes

Figure n°17 : Distance entre les codes grammaticaux du corpus A : calcul établi sur les fréquences de catégories.

En effet, le profil grammatical de J.M.G. Le Clézio qui émerge de nos différentes analyses est celui d’une écriture qui change, qui évolue dans le temps et dont la richesse s’exprime dans plusieurs

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

genres littéraires. Quant à l’œuvre romanesque, elle se déploie en trois périodes, que l’on étudie sa structure lexicale, l’usage de la ponctuation ou bien ses structures grammaticales.

La première période “nouveau roman” se démarque grammaticalement toujours du reste par son usage important du substantif et de l’adjectif, mais aussi par l’emploi de l’impératif et, paradoxalement pour une écriture expérimentale, par l’usage de formes temporelles très traditionnelles comme le passé simple. La rupture de l’œuvre entraîne un changement vers une écriture qui privilégie l’action et par conséquent les catégories verbales, notamment les formes conjuguées à l’imparfait et les temps composés.

L’analyse statistique permet ici, par des étapes diverses, d’une part à confirmer de façon formelle et impartiale les études antérieures “classiques”, plus subjectives, d’un corpus littéraire ; d’autre part à apporter des éclaircissements nouveaux, avec l’aide de ces outils informatiques qui permettent de prendre en considération simultanément l’intégralité de l’œuvre littéraire.

L’étude lexicométrique et “grammatico-métrique” permet ainsi de mettre à jour ces procédés peu conscients que l’on a parfois comparé aux empreintes digitales d’un écrivain. Les empreintes digitales pourtant ne changent pas avec le temps, au contraire, elles demeurent à jamais les mêmes. Notre étude a montré que les procédés langagiers peuvent changer, même de façon significative, à l’intérieur d’une œuvre. Le jeune écrivain débutant ne fait pas forcement le même emploi des catégories grammaticales qu’il fera au sommet de sa production ou bien vers la fin de sa carrière et ce phénomène semble très accentué dans le cas de Le Clézio.

Une écriture qui change est une des caractéristiques fondamentales de notre corpus. En effet, il n’y a pas de “stabilisation” du style mais, au contraire, des écarts grandissants chez le Clézio. Dans l’œuvre de Le Clézio, les procédés morphosyntaxiques ne sont pas statiques, les techniques d’expression changent, évoluent et sont constamment mises en question. Au fil des années, l’auteur dit ‘intellectuel’ qui, jeune, s’est voué à une écriture expérimentale, est devenu un auteur grand public. La forme de ses ouvrages s’est modifiée : plus simple, plus “classique”. Le Clézio lui-même en convient : “Jeune, on aime étonner, après, on va à l’essentiel.”

Rappelons que J.M.G. Le Clézio, très conscient des procédés langagiers, notamment des fonctions grammaticales, a consacré beaucoup de temps à les étudier et y attache une grande importance. “La seule de façon changer le monde ce serait de supprimer les adjectifs [41] ou bien que les gens renoncent à s’exprimer” dit-il, déjà en 1971, à Pierre Lhoste [42] :

J’ai essayé de supprimer les adjectifs. Je dois avouer que ça n’est pas facile du tout, on a le sentiment de quelque chose de très artificiel, mais c’est une tentation qui doit survenir dans l’esprit d’un écrivain, c’est une tentation qui n’est pas à rejeter, c’est découvrir combien la nécessité de s’exprimer est inférieure à la nécessité d’être au milieu des autres. Je veux dire qu’un écrivain par son expression se détache des autres et il découvre combien le langage l’a mis artificiellement en dehors et comme le véritable langage c’est celui du langage parlé, celui de la quotidienneté. Tout ce qui donne de la qualification comme les adjectifs entre autres devient odieux mensonger. Il s’agit de retourner au langage quotidien par le verbe, par le mot et non pas par ce qui se veut différent. Il n’y a pas de différence foncière entre les hommes, ils sont tous semblables.

foncière entre les hommes, ils sont tous semblables.

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

NOTES

[1] P. Guiraud (1954).

[2] , Cf. D. Malrieu et F. Rastier (2002), M. Kastberg Sjöblom (2002) et (2003).

[3] P. Guiraud (1954): p 104, É. Brunet (1988) : p. 171-172.

[4] La norme utilisée dans ces études est celle de la fréquence des catégories grammaticales dans le corpus du T.L.F.

[5] L’inconnu sur la terre, p. 314.

[6] J. Onimus (1994) : p. 15-20.

[7] Haï, p. 34.

[8] Voyages de l’autre côté, p. 99.

[9] Cf. figure n°3.

[10] Le livre des fuites, p. 54.

[11] J. Onimus (1994) : p. 183-184.

[12] J.-X. Ridon (1995) : p. 82.

[13] Le livre des fuites, p. 48.

[14] Cf. figure n°1, p. 3.

[15] É. Brunet (1981) : p. 203.

[16] Cela n’est pas vrai pour une période plus longue, car si on remonte jusqu’au XVI ème siècle le substantif augmente.

[17] Poisson d’or, p. 166.

[18] Il convient encore de souligner la difficulté des ambiguïtés et la relative opacité d’une analyse automatique qui ne permet pas à l’utilisateur de faire son choix et de trancher selon son propre jugement dans les cas ambigus [18]. La distinction ne va pas de soi, notamment dans la première sous-catégorie. En effet, pour distinguer entre les emplois auxiliaires et les emplois pleins parmi toutes les formes du verbeêtre, peut-on se fier au tri automatique des temps composés ?

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

[19] Dans certaines études contemporaines le conditionnel est placé à l’intérieur de l’indicatif, nous le considérons toutefois comme un mode distinct dans notre étude.

[20] Cf. M. Kastberg Sjöblom (2002, p. 225.)

[21] Nous y reviendrons à l’étude des participes.

[22] Voyage à Rodrigues, p. 49.

[23] Cf. M. Kastberg Sjöblom (2002 : 224-226)

[24] Le quotient est le rapport entre les deux séries. Il permet de voir comment se séparent les parallèles quand deux séries sont liées et en partie parallèles. Comme les deux séries peuvent avoir un poids très inégal, la seconde est d’abord ramenée à la dimension de la première, proportionnellement, pour que le total des deux séries soit le même. Le quotient est calculé ensuite terme à terme, et s’équilibre nécessairement autour de la valeur 1.

[25] Le procès-verbal, p. 210.

[26] R. Holzberg (1981) : p. 159.

[27] L’extase matérielle, p. 199-200.

[28] M. Tenchea (1999) : p .7.

[29] EXPLICATION de Francil

[30] Le procès-verbal, p. 118.

[31] Le procès-verbal, p. 119.

[32] L’extase matérielle, p. 198.

[33] Le livre des fuites, p. 12.

[34] H. Lambert (1989) : p.86-87.

[35] Ou, comme dirait Gustave Guillaume (1970), de l’action in posse.

[36] Le livre des fuites, p. 88.

[37] Printemps et autres saisons, p. 68.

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

[38] Nous avons déjà évoqué les difficultés de désambiguïsation de cette catégorie et l’opération délicate consistant à trancher entre les participes et les adjectifs.

[39] La quarantaine, p. 142.

[40] Cf. M. Kastberg Sjöblom (2003) où la distance lexicale dans l’œuvre leclézienne est traitée en détail.

[41] Paradoxalement, d’après les statistiques c’est dans cette période qu’il en fait l’usage le plus important. Cf. figure 101, p. 335.

[42] P. Lhoste (1971) : p. 74.

BIBLIOGRAPHIE

BRUNET Etienne, Le vocabulaire de Victor Hugo, Paris-Genève, Champion-Slatkine, 1988.

GUILLAUME Gustave, Temps et verbe, suivi de l’Architectonique du temps dans les langues classiques, Paris, Champion, 1970.

GUIRAUD Pierre, Les caractères statistique du vocabulaire, Paris,P.U.F., 1954.

KASTBERG SJÖBLOM M., L’écriture de J.M.G. Le Clézio, une approche lexicométrique, Nice, Université de Nice–Sophia Antipolis, 2002.

KASTBERG SJÖBLOM M., “Analyse lexicométrique de l’opposition générique dans une perspective endogène” in Actes des IIIèmes Journées de la linguistique de corpus, septembre 2003, Lorient, Williams G. (éd.), Presses Universitaires de Rennes, en cours de publication.

KASTBERG SJÖBLOM M., “La distance lexicale dans l’œuvre de J.M.G. Le Clézio, proximité et éloignement”, in Corpus n° 2, Mellet S. (éd.), CNRS, Bases, Corpus et Langage, Nice, Université de Nice–Sophia Antipolis 2003.

LAMBERT Hervé, “Fuite et nostalgie des origines.” in “J.M.G. Le Clézio : Le Malheur vient dans la nuit” (n° consacrés à Le Clézio), Revue Sud, Althen G. (éd.), n° 85-86, 1989.

LHOSTE Pierre, Conversations avec J.M.G. Le Clézio Paris,, Mercure de France, 1971.

MALRIEU D. et RASTIER F. “Genres et variations morphosyntaxiques”, in Actas del segundo seminario de la escuela interlatina de altos estudios en lingüística aplicada, Matemáticas y tratamiento de corpus, San Millán de la Cogolla, 19-23 septiembre de 2000, Martin Municio A.(éd.), Logrono, Fundación San Millán de la Cogolla, 2002.

ONIMUS Jean, Pour lire Le Clézio, Paris, Collection Écrivains, Presse Universitaire de France 1994.

Kastberg : Comment l’ordinateur peut-il servir dans l’étude stylistique d’un texte littéraire ?

RIDON Jean-Xavier, Henri Michaux J.M.G. Le Clézio, L’exil des mots, Paris, Éditions Kimé, 1995.

TENCHEA Maria, Le subjonctif dans les phrases indépendantes. Syntaxe et pragmatique, Oradea, Roumanie, Editura Hestia, collection Langue & Civilisation, 1999.

Vous pouvez adresser vos commentaires et suggestions à :kastberg@unice.fr

©

© décembre 2003 pour l'édition électronique. Référence bibliographique : KASTBERG SJÖBLOM, Margareta. Comment

décembre 2003 pour l'édition électronique.

Référence bibliographique : KASTBERG SJÖBLOM, Margareta. Comment l'ordinateur paut-il

servir dans l'étude stylistique d'un texte littéraire ? Texto ! décembre 2003 [en ligne]. Disponible sur : <http://www.revue-texto.net/Corpus/Publications/Kastberg/Kastberg.html>. (Consultée

le

).