Vous êtes sur la page 1sur 22

Langages

Typologie génétique des dictionnaires


Alain Rey

Citer ce document / Cite this document :

Rey Alain. Typologie génétique des dictionnaires . In: Langages, 5ᵉ année, n°19, 1970. La lexicographie. pp. 48-68;

doi : 10.3406/lgge.1970.2591

http://www.persee.fr/doc/lgge_0458-726x_1970_num_5_19_2591

Document généré le 31/05/2016


ALAIN REY
Paris

TYPOLOGIE GÉNÉTIQUE DES DICTIONNAIRES

1. Les produits de l'activité* lexicographique, essai de description


ordonnée des ensembles et des sous-ensembles lexicaux, sont d'une variété
et d'une abondance étonnantes. Chaque époque présente néanmoins un
type dominant : l'analyse de quelques unités-signes devenues
incompréhensibles occupe l'antiquité et le moyen âge, temps des glossaires. Le xvie siècle
en Occident tente la mise en communication de systèmes lexicaux
différents, créant le dictionnaire bilingue; l'époque classique applique une
notion élaborée de la norme sociale à la composante lexicale : le
dictionnaire unilingue moderne est né. Mais il porte en lui, selon les conceptions
du signe et de la synonymie, sa propre perversion : déviation
encyclopédique, qui instaure au xvme siècle le règne de la Raison et tend à se passer
des signes, puis déviation philologique, qui remplace les connaissances
fonctionnelles par une description systématique des contingences de
l'histoire.
Le lexicographe, même s'il est au courant de l'évolution des sciences
du langage, est l'héritier de ces pratiques et des présupposés qui les ont
rendus possibles. Chez Littré, chez les frères Grimm, dans Y Oxford
Dictionary, la linguistique formelle, historique et comparative est mise au
service d'autres fins implicites, de nature universalistes et conceptuelles.
De nos jours, les effets de la révolution saussurienne et bloomfieldienne
sur la lexicographie sont visibles, mais tout aussi visiblement contrariés.
Une description synchronique et fonctionnelle du lexique peut par
exemple s'instaurer lorsque les ethnologues veulent décrire une langue
amérindienne ou sibérienne, sans se soucier des contingences de la
diffusion; mais la lexicographie « commerciale » résiste, car ses modèles
d'utilisation, tout à fait indépendants des modèles scientifiques récents, sont
plus que contraignants : ils déterminent les projets et leur exécution. En
outre, et pour des raisons théoriques, la lexicographie n'est pas, ne peut
pas être seulement une « application » de la linguistique (Rey-Debove,
1 970 B ; Rey, 1 970 A). Les sévères critiques adressées par U. Weinreich (1954,
1960), par B. Pottier (1965) aux dictionnaires sont justifiées pour élaborer
une théorie normative lexicographique, mais n'atteignent pas leur objet
concrètement, faute d'y voir autre chose qu'une variante maladroite
d'analyse sémio-fonctionnelle du lexique, selon d'ailleurs une théorie
lexicologique embryonnaire.
49

Le fait lexicographique peut être considéré sous bien des angles, mais
c'est en tant que texte qu'il réalise son unité essentielle. Ce texte se
distingue des autres par sa nature linguistique (analyse synonymique d'unités
appartenant au code de la langue), sémiologique (il est articulé en signes
dont les signifiés sont eux-mêmes des signes) et socio-culturelle (il définit
un univers d'unités signifiantes en tant qu'instrument d'expression et
d'information; il l'articule selon l'ordre que l'écriture permet d'instituer).
Ces traits fondamentaux ne suffisent pas à définir un objet univoque. Il
faut envisager la lecture et la production du texte de dictionnaire pour que
certains processus idiosyncrasiques se dégagent. Pour la lecture, ou plutôt
le décodage, car il ne s'agit pas d'une véritable lecture, c'est une forme
particulière de consultation, c'est-à-dire de confrontation entre une
connaissance partielle et une information prévisible destinée à la
compléter, à la détruire, à la remplacer. Cette information est articulée selon
une double structure (nomenclature et contenu des « articles ») et doit se
plier à cette forme de message. De son côté, le message doit respecter un
certain nombre de règles de lisibilité. Tout ceci, et la relation concrète
entre le consulteur et le texte consulté, est fort mal connu et peut faire
l'objet de recherches systématiques. Quant à la production du
dictionnaire, elle provient d'un certain nombre d'options conscientes ou
implicites, qui dépendent en surface de structures sémio-culturelles, mais aussi
et plus profondément des relations fondamentales entre textes sources
et texte à élaborer (si l'on veut, entre somme de discours-témoins et texte
à propos de la langue), entre créativité et activité classificatrice (car tout
dictionnaire réconcilie naïvement Z. Harris et N. Chomsky) ou encore
entre niveaux sémiologiques (discours sur le signe, sur le « monde »).
2. Est-il nécessaire, ou seulement utile, de définir l'objet
lexicographique, et l'ayant défini, de tenter une typologie des dictionnaires? D'un
point de vue pragmatique et empirique, ce n'est pas évident. Mais la
théorie et la connaissance systématique des normes exige qu'on distingue,
dans tout ensemble à décrire, des types, c'est-à-dire des ensembles de
caractères structurés permettant non seulement de distinguer des
catégories d'objets mais fournissant en même temps des « abstractions
rationnelles » (Cournot) pour l'analyse de l'ensemble en question. Devant un
ensemble complexe, la construction des catégories en quoi il peut être divisé
rétroagit sur toute définition globale. En outre, la réflexion sur la valeur
des traits pertinents donne à toute catégorisation — même insuffisante,
ambiguë ou redondante — un pouvoir vérificateur sur le concept analysé.
Or, il s'agit ici de délimiter un concept bien plutôt que d'analyser un
signifié. En effet, la désignation de dictionnaire, dictionary, wôrterbuch,
slovaf, n'est pas pertinente linguistiquement, comme les bibliographes
l'ont souvent remarqué. Besterman (1943) cite des exemples de «
dictionnaires » camouflés derrière des titres improbables et indéchiffrables, et
nous connaissons tous des ouvrages intitulés dictionnaires et qu'aucun
linguiste ne voudrait inclure dans le concept de « texte lexicographique ».
Les mots dictionnaire, wôrterbuch, etc., sont employés pour signaler dans
un livre la présence d'un trait socio-culturel dépendant étroitement d'un
modèle d'utilisation. Ils servent surtout à désigner une suite de signes
linguistiques ordonnée alphabétiquement, suivis d'informations
quelconques. De nombreuses encyclopédies alphabétiques sans définitions
50

s'appellent dictionnaires, et aussi le Dictionnaire philosophique de Voltaire,


ou le Dictionnaire des Idées reçues, de Flaubert; or, les premières
n'apportent aucune information sur l'unité lexicale en tant que signe, et les autres
sont des textes littéraires, relevant d'une structure sémiotique inverse 1.
2.1. Quant aux définitions existantes, la plupart pèchent par excès,
donnant du dictionnaire une caractérisation trop limitative. G. Matoré
(1968, p. 21) cite en exemple celle de l'Oxford Dictionary dont on peut
penser qu'elle ne décrit que VOxford lui-même ou peu s'en faut. Qu'on en
juge : le dictionnaire serait « un livre qui traite des mots isolés d!une langue
(ou de catégories particulières de ces mots) afin démontrer leur orthographe,
leur prononciation, leur dérivation et leur histoire, ou du moins certains
de ces faits (...); les mots sont placés dans un ordre déterminé (...); dans
les grands dictionnaires, les informations fournies sont illustrées par des
exemples littéraires. » On trouve là une accumulation de traits
indéfinissables et non pertinents (les mots ne sont pas les seules unités possibles,
les mots isolés éliminent indûment les syntagmes codés, la définition est
restreinte aux ouvrages unilingues, la dérivation et l'histoire ne
définissent qu'un type très particulier de dictionnaire), de redondances
(l'orthographe est décrite de par la nature graphique des objets traités),
de fausses relations (la « grandeur » du dictionnaire n'a rien à voir
théoriquement avec la présence de citations littéraires). Par contre, manquent
des traits plus fondamentaux (structure d'éléments linguistiques, et non
pas catégorie particulière de « mots »; informations sur des signes,
notamment par la caractérisation fonctionnelle et la synonymie définitionnelle).
En fait, ce qui est décrit, plutôt que défini, c'est un modèle socio-culturel
de dictionnaire, inexistant avant 1860 et périmé un siècle plus tard.
2.2. Les traits pertinents employés pour définir l'objet lexicogra-
phique ne devraient pas être identiques aux concepts complexes de
« mot », de « définition », ni inclure des traits socio-culturels non universels
et aisément transgressés, comme « ordre alphabétique ». Selon une analyse
récente (Rey-Debove, 1968), le dictionnaire se caractérise par (a) le
.

didactisme, (b) le caractère separable des messages qui le composent,


(c) leur lisibilité indépendante, (d) le caractère structuré de l'ensemble
d'unités décrites, (e) la présence d'informations sur les unités en tant que
signes [signifiants et signifiés].

1. Le cas du Dictionnaire de Pierre Larousse, évoqué dans ce numéro par Jean


Dubois, me paraît différent de celui que les ouvrages de Voltaire ou Flaubert illustrent.
L'énonciation de Larousse reste de bout en bout pédagogique, même si l'énoncé
résultant est fréquemment polémique. C'est que la polémique s'y inscrit dans une structure
didactique, et que la transmission des connaissances y est partiellement motivée et
véhiculée par le dynamisme polémique. Par ailleurs, il est vrai que le Dictionnaire
philosophique de Voltaire, comme L'Encyclopédie, résulte d'un modèle d'énonciation
pédagogique (voir l'analyse de J. Dubois : 1.3); mais cette énonciation correspond parfois
aux structures du discours littéraire. L'opposition entre discours didactique et discours
polémique est ici subordonnée à l'opposition (de nature sémiotique) entre structure méta-
linguistique et structure de connotations (littéraire), laquelle permet d'exclure de cette
typologie les textes voltairien ou flaubertien et non l'ouvrage de P. Larousse. La nature
socio-culturelle distincte de ces œuvres vient appuyer ce clivage. Enfin, il faut noter
qu'on peut découvrir des aspects non didactiques dans la plupart des dictionnaires, au
moins quand on se réfère aux modèles d'utilisation (cf. la « guerre » des Bescherellisants
et des Poitevinards, dans Vallès, ou les attaques conservatrices contre les énoncés
positivistes dans le Dictionnaire de Littré).
51

2.3. Les classifications d'ouvrages intitulés dictionnaires, ou des


textes correspondant à une définition de ce concept, sont surtout le fait
des bibliographes. Elles portent sur les traits qui fondent les modèles
d'utilisation et classent leur objet selon un fonctionnement social. Leur
utilité est incontestable, mais elles restent insuffisantes pour le linguiste.
En outre, plusieurs spécialistes (Scerba, 1940; Malkiel, 1960; Quemada,
1968) ont proposé des typologies plus linguistiques. L'un d'eux, Yakov
Malkiel, pose d'emblée le problème : « (Est)-il légitime de considérer un
ouvrage de référence comme un faisceau de traits caractéristiques qui
pourraient être rassemblés de telle manière qu'une simple formule en
exprimerait l'arrangement? » Cette simple formule, Malkiel renonce
d'ailleurs à la proposer, mais il pense que son travail donne au lecteur les
moyens de la construire. Trois axes lui paraissent capables de classer son
corpus, selon (a) l'extension, (b) la perspective, (c) la présentation. Sous
« extension », l'auteur comprend « la densité de la nomenclature », le
« nombre de langues » et « la concentration sur les données purement
lexicales ». Le goût du quantitatif le conduit à mêler des oppositions
qualitativement très différentes, telles que synchronie et diachronie (p. 8), unités
codées et unités de discours (p. 9), unités appartenant à plusieurs niveaux
fonctionnels (id.), et d'y joindre des éléments anecdotiques, comme les
« mots fantômes », résultant de coquilles d'imprimerie, pour rendre compte
de la nomenclature. Le nombre de langues (p. 12-14), à son tour, n'offre
guère d'intérêt typologique : ce sont les relations entre éléments
appartenant à des systèmes différents, . qui importent. Par contre, l'opposition
entre « données purement lexicales », concernant les signes, et
encyclopédie est sémiotiquement primordiale. La classification selon les «
perspectives » est en réalité triple. La « dimension fondamentale » synchronie-
diachronie semble relever d'une relation beaucoup plus générale (caractère
fonctionnel vs non fonctionnel). L'opposition (p. 17-18) entre «. modèles
d'arrangement », alphabétique (il faudrait dire formel) vs sémantique, est
à retenir; celle des « tons » me paraît au contraire inutilisable. Classer les
dictionnaires en « détaché », « pédagogique », « facétieux » est tout à fait
irréalisable; mais il est légitime de chercher dans les dictionnaires les
traces d'une énonciation non didactique, le didactisme faisant partie des
caractérisations fondamentales du texte lexicographique, dans la
perspective adoptée ici. Un « dictionnaire » entièrement facétieux (ou polémique)
n'est simplement plus un dictionnaire : aucun utilisateur de la partie du
Jacassin de P. Daninos qui affecte l'apparence du dictionnaire ne s'y
trompe : il lit ce livre, ne le consulte pas. Les types « référentiel » (reflétant
objectivement un corpus) et « normatif-systématique » distingués par
Sôerba seraient mieux adaptés à une classification socio-culturelle, sans
toutefois correspondre à une opposition théorique (Sebeok, 1962, p. 364-
365). Enfin, la classification « par la présentation » (Malkiel, p. 20-22)
concerne l'apparition des fragments de discours observés (citations) et des
illustrations non linguistiques, ce qui revient à mêler deux problèmes très
différents.
Bernard Quemada (1968) reconnaît avec raison que la classification
proposée par Malkiel constitue une contribution importante à l'inventaire
des critères d'analyse. L'échec relatif de cette tentative lui paraît
démontrer « la difficulté de réduire les dictionnaires à la manière des phonèmes
52

d'un système linguistique, à quelques traits pertinents » (p. 23). Dans


l'optique historique où se place Quemada la difficulté pourrait bien être
insurmontable. En effet, considérer concrètement un vaste ensemble de
dictionnaires, objets aussi variés que les situations concrètes de leur
élaboration, manifestant sans cesse des tendances contradictoires, ne peut
donner lieu qu'à la constitution de types concrets d'utilisation,
indéfinissables par des traits simples à valeur générale, donc théorique. Ainsi, la
typologie historique présentée par B. Quemada, basée sur un corpus très
considérable d'ouvrages (dictionnaires français ou à partie française)
éclaire bien la complexité du problème. Après avoir récusé la possibilité
d'un classement en traits pertinents, après avoir adopté une « démarche
plus historique [c'est-à-dire phénoménologique] et méthodologique [c'est-
à-dire une systématisation des normes pratiques] que typologique [c'est-
à-dire abstraite et généralisante] », B. Quemada a sélectionné ses critères
d'après leur valeur pragmatique (« apporter les informations les plus utiles
à l'analyse des méthodes », p. 23). En fait, ses schémas typologiques sont
construits sur des oppositions moins nombreuses et plus pertinentes que
celles de Malkiel, parce qu'elles sont plus abstraites, plus théoriques. Ceci,
parce que la théorie est partout, et qu'il y a évidemment une théorie de la
pratique, seule capable de fonder une typologie du concret. Celle de
B. Quemada utilise, comme chez Malkiel, trois axes. L'un concerne la
nature du texte selon qu'il provient d'un ou de plusieurs systèmes
linguistiques (langues naturelles); le second correspond au niveau d'analyse
sémique et à la nature des informations (formelles ou sémantiques); le
troisième, on va le voir, est essentiellement différent.
C'est celui de l'extension, opposé à la « sélection ». Cet axe n'oppose
plus des types qualitativement différents, mais deux tendances à l'intérieur
de chaque type; il concerne presque tous les aspects de la lexicographie et
de ses textes : corpus de données, définition de l'unité de traitement (le
traitement homonymique des polysémies, celui des syntagmes lexicalisés
comme entrées conduit à une extension sans modification du contenu
d'informations du dictionnaire), structuration de la nomenclature, choix
des types d'informations, explicitation de chaque type. L'extension dépend
assez étroitement du choix d'un modèle socio-culturel d'utilisation, alors
que les deux autres axes structurent le texte même du dictionnaire.
La typologie de B. Quemada (qui est aussi celle qu'utilise
R. L. Wagner, 1967, p. 120-128) répond à son objet, qui est l'analyse
d'un vaste corpus historique de dictionnaires français. Elle respecte la
réalité observable et sa confusion, son intention étant de décrire des
faits concrets, des objets liés à des situations historiques.
2.4. La démarche suivie ici est inverse. C'est dire que notre typologie
génétique ne concurrence pas les classements évoqués jusqu'ici, et qu'elle
serait bien incapable de rendre les mêmes services, d'articuler aussi
précisément la masse des textes réels. Il s'agissait au contraire d'extraire d'un
nombre assez réduits d'ouvrages, confrontés à l'expérience productive de
l'un d'eux — et ceci a été déterminant — une analyse aussi générale que
possible. Cette tentative n'a pas grand mérite de nouveauté. Elle s'inspire
d'indications typologiques fournies notamment par T. A. Sebeok (1962)
et par J. Rey-Debove (1968), elles aussi élaborées sur un corpus limité de
dictionnaires (une douzaine de dictionnaires de la langue Tchérémisse
53

pour Sebeok, quelques dictionnaires français contemporains chez Rey-


Debove).
Ces indications visent à dégager des traits fondamentaux, aussi
simples et généraux que possible. L'opposition entre corpus observé et
données produites (generated) [Sebeok] et celle qui oppose l'analyse du
contenu à celle des formes (du contenu et de l'expression) [Rey-Debove]
ont été largement utilisées ici : la première est génétique, la seconde porte
sur le texte constitué, mais en tant qu'il résulte d'un choix dans la
dynamique des rapports sémantiques.
Les typologies existantes tentent de répartir les textes de
dictionnaires selon une « classification croisée », représentable par une matrice
de traits différentiels; leurs difficultés viennent en partie du fait que tous
les traits se trouvent sur le même plan, puisqu'ils sont réalisés sans être
hiérarchisés dans les textes qu'on analyse. On est alors tenté de mettre en
vedette les caractères les plus visibles du texte (une vs plusieurs langues;
absence ou présence d'illustrations iconiques, brièveté vs extension). Cette
attitude est justifiée dans un classement de nature historique ou
sociologique; là, une taxinomie hiérarchique des textes est à exclure a priori,
parce que la hiérarchisation des traits dépend de modèles d'utilisation ne
relevant pas du même type d'analyse. Mais si l'on considère le texte de
dictionnaire en général comme un énoncé (très complexe) résultant de
processus d'énonciation (non moins variés), on pourra mettre en œuvre des
critères partiellement ordonnés. Le texte de tout dictionnaire, celui de
tout ouvrage didactique correspondant à un modèle relativement stable,
résulte d'une suite de procédures impliquant des choix explicites ou
implicites. Le modèle proposé ici est abstrait : dans la réalité, le choix d'un
type (socio-culturel, prédéterminé) de dictionnaire est antérieur aux
options linguistiques fondamentales et implicites qui rendent ce type
possible et le déterminent. Par exemple, on décide d'abord de faire un
dictionnaire anglais-français (type socio-culturel), et ce faisant, on définit
implicitement un niveau d'analyse sémantique (on élimine, par exemple,
toute possibilité d'une analyse de la substance du contenu, «
encyclopédique »); par contre, on ne préjuge pas du caractère ou de la structuration
du lexique à traiter, les décisions à ce sujet pouvant venir après coup, et
indépendamment. Il ne s'agit donc pas d'un modèle d'élaboration
pratique valable pour un dictionnaire concret, mais d'un modèle génétique
théorique conçu pour décrire toute activité lexicographique. Ceci conduit
à considérer en premier lieu des options qui peuvent n'être prises dans la
réalité qu'après le choix d'un type global, ou bien rester implicites : en
effet les types concrets de dictionnaires ne peuvent être que des produits
de sortie, et la plupart ne sont définis et dégagés qu'à la fin du modèle.
Celui-ci comprend un nombre raisonnable de choix « digitaux » théoriques,
alors que les options réelles sont en général continues, « analogiques »;
pour binariser certains choix, on a eu recours à des types « mixtes », de
beaucoup plus fréquents dans la réalité.
3. Ce modèle, délibérément simplifié, comprend 7 parties (ce chiffre
biblique ne répond à aucun a priori 2).
3. [1] La première partie du modèle correspond aux données utilisées

2. Voir le tableau schématique, p. 59-62.


54

et traitées par le lexicographe, telles qu'elles se présentent en discours.


Ces données peuvent être (a) observées, extraites d'un corpus ou (b)
produites, soit par le lexicographe lui-même, soit par des informateurs
sollicités ad hoc. Les dictionnaires d'auteurs et les index linguistiques sont du
type (a) pur (caractérisé dans le modèle par les chiffres 1 . 1.); les
dictionnaires bilingues élaborés par les ethnologues peuvent être de l'un ou
l'autre type : enregistrements et notations de discours par le linguiste ou
informateurs sollicités. La plupart des dictionnaires sont mixtes (type 1 .2.
du modèle) : leurs données proviennent d'un corpus d'énoncés, le plus
souvent de discours écrits, complété par des données produites ou
suscitées à l'occasion de l'élaboration du dictionnaire. Parmi les textes du
corpus utilisé figurent éventuellement des dictionnaires : ceci est
important, car, dans la mesure où les dictionnaires constituent le produit de
sortie du modèle, celui-ci est circularise.
Les données observées ou produites peuvent être utilisées
intégralement ou sélectionnées; s'il y a choix, celui-ci peut être intuitif ou objectif
(par exemple fréquentiel). En fait, la sélection est double : un corpus est
extrait du « discours infini » qui actualise le système linguistique à décrire
ou délimité dans les capacités génératrices illimitées des locuteurs; puis
un second choix s'exerce sur les éléments de ce corpus.
3 . [2] Les données en discours sont généralement traitées de manière
à fournir du matériel en langue. On constitue alors un modèle lexical.
Sinon, on se contente de mettre en ordre les occurrences extraites du
discours observés : c'est ce qu'on appelle un index. Ces index d'occurrences,
s'ils ne comportent que la suite ordonnée des formes extraites des énoncés,
constituent un premier produit de sortie. Dans les autres cas, le modèle
élabore un ensemble d'unités de langue par neutralisation des variantes.
Le traitement des occurrences ainsi pratiqué est le plus souvent intuitif
et reproduit l'analyse traditionnelle conduisant au mot graphique et
polysémique. Dans la lexicographie linguistique actuelle, ce traitement peut
devenir plus formel, par l'élaboration de types (unités de langue) distri-
butionnels et transformationnels (par exemple, dans les dictionnaires
d'ethnolinguistes, ou dans le Dictionnaire du français contemporain de
J. Dubois et al). Alors les unités peuvent s'écarter des « mots »
traditionnels, selon les principes d'analyse mis en œuvre.
3. [3] Le lexique du dictionnaire étant constitué, il résulte des
procédures antérieures qu'il correspond (1) à un ensemble fonctionnel, ou (2) à
un ensemble non fonctionnel. Seul (1) contient un matériel capable de
constituer la composante lexicale d'une grammaire, de former un code
apte à la production de messages en nombre illimité. Dans le cas contraire,
il ne s'agit pas de lexique au sens linguistique, mais d'un sous-ensemble
du lexique. Ce sous-ensemble peut être sémio-culturel ou définir un type
de relations.
Ainsi, le projet lexicographique peut sélectionner dans le lexique
d'une langue un ou plusieurs vocabulaires caractérisés par un trait
sémantique et/ou pragmatique (c'est-à-dire socio-culturel). C'est le cas de tous
les dictionnaires et vocabulaires techniques ou consacrés à une spécialité.
Ici, la sélection sémantique et pragmatique ne saurait être rigoureusement
distinguée. Un dictionnaire de marine répond à un critère pragmatique
dans la mesure où il veut décrire les unités lexicales employées par un
55

type de locuteurs — les gens de mer — ou celles qui leur sont nécessaires.
Mais ce critère ne définit pas une langue fonctionnelle, puisqu'il élimine
les éléments communs aux marins et à d'autres locuteurs, et non seulement
les mots athématiques, par exemple les mots grammaticaux, mais aussi
les mots thématiques courants (mer, nuage, vent...) sauf à y voir les entrées
de syntagmes « techniques ». D'autre part, la définition d'un vocabulaire
thématique (critère purement sémantique) dépend des options précédentes
du modèle, et notamment de la constitution d'un corpus (voir [1]); mais
elle y ajoute ses propres critères sélectifs : le Vocabulaire de la psychanalyse
de Laplanche et Pontalis (Presses universitaires, 1967) extrait du corpus
freudien les seules unités qui appartiennent en propre au discours «
psychanalytique » et correspondent à ce que les auteurs considèrent comme
les mots clés de ce discours. Quant au critère socio-culturel, exclusivement
pragmatique, son application correspond à la définition d'un sous-
ensemble lexical selon le fonctionnement dans le groupe social. Un
dictionnaire d'argot (ou un dictionnaire de la langue recherchée, parfaitement
imaginable) décrit aussi un ensemble non fonctionnel : le locuteur argotier
n'y trouvera évidemment pas les éléments de plus grande fréquence de
son discours, qui appartiennent à la zone non marquée de son lexique.
Un autre cas de sous-ensemble lexical non fonctionnel est celui qui
sélectionne les unités liées par un type de relations. Ces relations sont
définies métalinguistiquement, elles peuvent être formelles ou sémantiques,
mais dans l'un et l'autre cas, le dictionnaire définit un ensemble dont les
éléments sont définis par le type de relation qu'ils entretiennent entre eux
(homophonie des éléments terminaux des unités, dans un dictionnaire de
rimes; éléments sémiques communs à plusieurs formes, dans un
dictionnaire de synonymes).
L'opposition essentielle entre (1) lexique fonctionnel et (2) vocabulaire
non fonctionnel est indépendante du caractère extensif ou sélectif de
l'ensemble défini. Un dictionnaire du type (1) peut être très sélectif, à
condition d'être bien structuré : c'est le cas des dictionnaires fondamentaux
basés sur la fréquence et la disponibilité ou la probabilité. Au contraire,
un dictionnaire du type (2) peut être très extensif, comme le montrent
assez certains vastes dictionnaires techniques. L'extension dépend en fait
d'éléments antérieurs du modèle, comme la constitution du corpus, les
procédures d'extraction. En fait, une sélection intervient toujours, et
l'opposition extensif-sélectif ne peut être conçue que comme continue.
La tendance à la sélection peut s'appuyer sur des procédures intuitives
ou quantitatives : dans tous les cas, elle dépend du modèle d'utilisation
prévue et de facteurs économiques contraignants.
3 . [4] Le lexique ou le vocabulaire ainsi défini peut être appelé
nomenclature; il peut être mis en ordre formellement, par l'ordre
alphabétique direct, inverse, par les systèmes de clés propres aux écritures
idéographiques, etc., ou au contraire sémantiquement, comme dans les
dictionnaires « conceptuels », qui regroupent en fait les unités lexicales sous
des entrées métalinguistiques, selon une approche onomasiologique. A ce
stade, l'ensemble lexicologique ordonné (« nomenclature » ou « macro-
structure ») est typologisable selon la comminatoire des traits mentionnés
ci-dessus.
Malgré des interrelations entre ces quatre premiers stades du modèle
56

et les suivants, cette partie forme un tout, puisqu'elle aboutit à la


définition d'une des deux structures qui articulent le texte lexicographique.
Tous les dictionnaires doivent y trouver leur place, et même les recueils
les plus aberrants, comme ce Dictionnaire français-français au titre
ingénieux (Seghers, éd. 1965) qui prétend décrire sélectivement les mots
« rares et précieux » (?). Ainsi, en [1], cet ouvrage n'utilise que des
données observées, extraites sans doute d'autres recueils lexicographiques et
utilisées quasi-intégralement (hypothèse maligne, mais vraisemblable,
quand il s'agit de rentabiliser un texte); [2], les unités y sont du type
traditionnel, sans qu'aucune typologie ne soit intervenue si, comme je
le suppose, le corpus initial est lexicographique; [3], l'ensemble défini est
évidemment non fonctionnel et socio-culturel, le critère étant la rareté et
la difficulté d'interprétation sémantique, ce que souligne le titre : le
français-cible est inconnu; la langue source est le français courant; l'extension
de ce dictionnaire est faible — un médiocre volume — sans qu'on puisse
parler de sélection; enfin [4], l'ordre de cette nomenclature est
classiquement et intégralement alphabétique.
Autre exemple, tout opposé par l'attitude scientifique, le travail
philologique (modèle d'énonciation) et l'utilisation prévue : le Dictionnaire de
la langue du XVIe siècle, d'E. Huguet. On pourra le caractériser ainsi :
[1] données exclusivement observées (corpus littéraire entre deux dates
limites) et utilisées sélectivement; [2] type lexical traditionnel (mots
graphiques polysémiques); [3] ensemble non fonctionnel, provenant du même
critère que le dictionnaire précédent (difficulté d'interprétation des unités
par un locuteur du français contemporain); [4] ordre alphabétique. Si
Huguet avait traité toutes les unités lexicales de son corpus, ou les plus
fréquentes, ou un sous-ensemble thématique, socio-culturel, le modèle
différerait en [3]. La seule opposition théorique entre le Huguet et le
Dictionnaire français-français (les oppositions socio-culturelles sont trop
évidentes pour qu'on y insiste) se situe en [1] : le corpus de Huguet est
formé d'un ensemble de discours défini par une coupe synchronique et un
niveau d'énonciation (langue « littéraire »); il fournit un ensemble
fonctionnel d'où un sous-ensemble non fonctionnel est extrait pour des raisons
pragmatiques. Frédéric Godefroy, après avoir effectué une opération
comparable, l'a corrigée en éditant le sous-ensemble complémentaire
(justement baptisé Complément) pour son Dictionnaire d'ancien français.
Enfin, le Huguet, comme le Dictionnaire français-français, est un
dictionnaire bilingue « homoglosse » (caractère défini dans la suite de notre
modèle, en [5]).
L'ensemble lexical défini ci-dessus doit être soumis à une suite
d'opérations complexes. Chacun de ses éléments ordonnés (en fait, la mise en
ordre [4] peut fort bien intervenir ultérieurement dans la genèse concrète
d'un dictionnaire) est l'occasion de la production d'un texte. La nature
interne de ce texte correspond à une structuration d'informations émises
à propos des unités de la « macrostructure » : cette qualification (J. Rey-
Debove, 1968) a l'avantage d'évoquer la complémentarité des deux
parties du modèle ([1] à [4] vs [5] à [7]).
3 . [5] Le noyau du texte lexicographique est une analyse par
équivalence entre l'unité à traiter et un énoncé. Ici, l'opposition primaire est
sémantique, car l'analyse peut concerner (1) essentiellement le signifié
57

(le signe étant éventuellement décrit par la définition) ou (2) globalement


le signe. Le Dictionnaire encyclopédique et le Dictionnaire de langue
s'opposent par les relations qu'ils établissent entre les niveaux sémantiques
des éléments du texte. En termes hjelmsleviens, (1) est une analyse du
contenu (forme et substance), (2) une analyse de la forme (de l'expression
et du contenu); seul (2) est « linguistique ».
On retrouve ici l'opposition classique du « dictionnaire de mots » et
du « dictionnaire de choses ». Mais cette terminologie est antilinguistique,
car les dictionnaires de mots (de signes) analysent évidemment les
signifiés, et les dictionnaires de choses ne peuvent parler du monde qu'au
moyen de concepts délimités par des signifiés. Le dictionnaire linguistique
pur n'existe pas plus que l'encyclopédie extra-linguistique : ou bien il se
rétracte jusqu'à ne comporter qu'une information formelle (dictionnaire
orthographique, de prononciation) négligeant ainsi la nature de signe des
unités linguistiques, ou bien son sémantisme déborde l'analyse sémique
en traits pertinents. J'ai noté ailleurs combien il était facile de repérer
des données conceptuelles (encyclopédiques, si l'on veut) dans les
définitions et les exemples des dictionnaires « de langue » (Rey, 1968). Pour
certains critiques puristes, ces échappées sont des faiblesses linguistiques,
des défauts, des impuretés. Pour moi, elles manifestent la nature double
du dictionnaire, texte à propos du code d'autres textes, qui, eux, parlent
du monde.
Ici, une remarque à propos de la métalangue. On note dans tous les
dictionnaires de langue un traitement particulier des unités de nature
métalinguistique, telles que nom, adjectif, transitif, etc.; en effet, les
développements encyclopédiques semblent ici tout naturels, puisque l'objet
visé en premier lieu est le fonctionnement de la langue. Si l'on se situe
dans cette langue, le fonctionnement sera décrit par un système de carac-
térisations, d'équivalences et d'exemples. Si l'on se place dans un système
englobant — métalangue constituée a priori, et non plus simple discours
métalinguistique — le traitement affectera l'objet langage par les mêmes
procédés textuels qui caractérisent l'encyclopédie. Rares sont les
lexicographes qui remarquent ce décrochement, et l'on saura gré à Gerhard
Wahrig d'avoir séparé de son Deustches Wôrterbuch (Bertelsmann Lexi-
con-Verlag, 1968) un Lexicon der Deutschen Sprachlehre rédigé pour des
raisons pédagogiques (par Walter Ludewig) et qui constitue une petite
encyclopédie de la métalangue à côté du dictionnaire de la langue. Bien
entendu, cette métalangue est imparfaite : elle n'a pas de syntaxe propre et
n'est pas construite de manière à former un code formalisé indépendant
de celui dont il doit rendre compte. Mais on ne peut refuser la
dénomination de métalangue aux éléments utilisables pour décrire le fonctionne^
ment de la langue, sous prétexte qu'ils en font eux-mêmes partie.
La nature formelle des éléments du texte produits aux fins de
l'analyse sémantique entraîne une opposition entre les types de langues
d'information qui doivent fonctionner au niveau métalinguistique, établissant
une synonymie entre eux-mêmes et une unité de la langue, isolée et rendue
autonyme. Pour les « encyclopédies », ce discours métalinguistique
provient soit de la langue naturelle seule, soit d'autres systèmes sémiotiques
(signes iconiques, images, cartes, schémas...). Pour les dictionnaires « de
langue » dont l'objet premier est le signe, l'opposition est entre (1) une
58

langue d'information appartenant au même système que la langue objet,


ou bien (2) à d'autres systèmes (une autre langue naturelle ou des systèmes
différents). Il peut y avoir aussi une ou plusieurs langue(s) objet(s).
L'opposition entre dictionnaires unilingues et plurilingues s'articule sur celle qui
existe entre plusieurs modèles d'utilisation, et entraîne ainsi d'autres
différences. Ainsi, les bilingues tendent à décrire un lexique fonctionnel, à
donner des informations formelles (morpho-syntaxiques), à limiter
l'analyse défmitionnelle, car ils recherchent l'équivalence au niveau lexical.
En outre, parmi les plurilingues, on doit distinguer entre « homoglosses »
et « hétéroglosses » ou vrais plurilingues (B. Quemada, 1968). Les ouvrages
« homoglosses », dictionnaires de dialectes, d'états de langue anciens d'un
même système, etc., sont bien des bilingues en théorie : mais ils en
diffèrent quant à l'utilisation; la proximité de la langue objet et de la langue
d'information n'est pas seulement formelle, résultant d'une affinité
historique, etc., elle entraîne des relations sémantiques internes qui diminuent
le besoin a" exploitation (il suffit de comparer le texte d'un dictionnaire
grec-français à celui d'un dictionnaire ancien français-français moderne).
Les dictionnaires homoglosses sont d'ailleurs souvent négligés par les
typologies documentaires, ou rangés parmi les dictionnaires spéciaux.
L'opposition entre ouvrages unilingues et bilingues (car les
plurilingues généraux sont devenus rares) est évidente pour le lecteur et
fondamentale pour le lexicographe. Mais il est clair que, pendant
l'élaboration d'un dictionnaire, la décision n'est pas de décrire le lexique d'une
langue X au moyen (a) de cette même langue, ou bien (b) d'une autre
langue Y, comme on l'envisage ici. Cette alternative est toute théorique.
Dans la réalité, ce sont les modèles socio-culturels dans leur complexité
qui organisent le choix; celui-ci est alors (a) ou de décrire un lexique, et les
moyens seront précisés a posteriori, (b) ou de mettre deux lexiques en
communication. L'auteur d'un dictionnaire bilingue pense d'abord au
modèle d'utilisation qui est la traduction : version ou thème. Les options
des modèles concrets sont en général interférentes et imbriquées : leur
typologie est donc extrêmement difficile; celle des types théoriques, qui
dépend de traits plus indépendants, est relativement aisée. Dans le cas
présent, un dictionnaire bilingue exclut pratiquement des définitions
élaborées; il est peu compatible avec un développement extrême. Mais
théoriquement, un dictionnaire français-anglais en 10 volumes, avec des données
étymologiques, des exemples littéraires nombreux, des définitions très
élaborées, est parfaitement envisageable. Il se trouve seulement que notre
culture n'en ressent pas le besoin, ou que ce besoin est trop faible pour
déclencher les investissements nécessaires. D'ailleurs, l'instabilité des
conditions concrètes conduit souvent à transgresser les habitudes, et donc
à compromettre les classements socio-historiques, construits sur
l'observation. Le Dictionnaire étymologique (F.E.W.) de von Wartburg, description
diachronique des formes lexicales du français ancien et moderne, central
et dialectal, aurait normalement dû utiliser le français central et moderne
comme langue d'information. Une pure contingence fait que cette langue
d'information est généralement l'allemand. Théoriquement, ce
dictionnaire correspond à l'option plurilingue en un point de notre modèle; mais
toutes les autres options seront différentes de celles qui mènent, par
exemple, au Harrap franco-anglais. Pratiquement, le F.E.W. n'est évi-
Tableau : MODÈLE TYPOLOG
1.1. Observées (provenant
d'un ou plusieurs lo-
[1] Données linguistiques/ cuteurs> . E*. Diet, d'aute
1 J \ Diet, de langue mor
\
1 . 2. Mixtes : observées et
produites (par le lexi-
cographe ou des in-
formateurs).
l.oc. Données fonctionnellement compatibles
/
\1 . p. Données contenant des éléments incom
2.1. Occurrences .... Ex. Index de tex
/
ro, Unîtes
[2] TT de traitement^
/
\ /
2.2. tralisation
Unités de langue
des variantes).
(élaborées par neu-\
2. 2. a. Typologie des occurrences (modèles d
\
2.2.6. Types traditionnels (unités graphique
3.1. Ensemble fonctionnel, correspondant à
/ au sens large, incluant les unités de rela
[3] Ensemble des données /
a traiter (lexique) \ /
\ 1. sémio-culturel \
3.2. Sous-ensemble /
\
2. relationnel
3 , a. Modèle extensi
►Modèle lexicologique <^
3 . b. Modèle sélectif
4.1. Ordre formel. . . . Ex. Diet, alpha
/ grammes).
[4] Ordre des éléments <^
\
4.2. Ordre sémantique métalinguistique, ,
5.a.l. Niveau subs
/ Ex. Enc
5 . a. Analyse explicite
f
\5. a. 2. Niveau form
[5] Analyse sémio -
niveau du si
fonctionnelle DES UNITÉS v Ex. Did
\
5.6. Analyse sémantique implicite (par 2.
Ex. Index de mots clés, vocabulair
1. Langue naturelle seule.
2. Autres systèmes Ex.
1. Langue d'information homologue (définit
/
5. a. 2. et
x
\ /
2. Langue d'information non homologue\
2
1. Langues non communicantes. Ex.. .
\
2. Sous-systèmes d'une même langue. Ex.
A. Extensif (définitions développées).
5. a.
B. Sélectif (ex. 5. a. 2. 2.1. : diet, plurilingu
♦ Pour 5. b., l'option s'applique à [6] : informations non sémantiques.
6.1. Informations fonctionnelles seules (in
/ ciation (niveaux de langue), etc.).
[6] Informations non se- /
mantiques \
6.2. Informations fonctionnelles et non fo
etymologies, définition d'une norme cu
7.1. Pas d'explicitation.
[7] Exploitation des don-/
nées [1] \ 7.2.1. Exemples observés
\ /
7.2. Exemples\ 7.2.2. Exemples produits
a Exemples reproduisant un fragmen
- 7.2./
p Exemples « traités » (formes neutr
63

demment pas un bilingue; seul son caractère scientifique permet cette


utilisation indifférente du code d'information. Théoriquement, on peut
très bien imaginer un dictionnaire de synonymes anglais rédigé en patois
auvergnat, un dictionnaire du français du xvne siècle glosé en eskimo.
Par contre, certaines oppositions concrètes, culturelles, correspondent
à des clivages théoriques. Ainsi, une encyclopédie bilingue, pratiquement
absurde, l'est aussi théoriquement. Une liste de mots chinois peut certes
donner lieu à des développements encyclopédiques en toutes langues :
mais ils concerneront toujours des signes chinois, des concepts chinois;
il ne s'agira pas de ce que nous avons jusqu'à présent appelé encyclopédie,
qui est discours sur les choses, hors langage, et où les signes ne sont
qu'instruments, jamais objets de connaissance. De même, il est absurde de
vouloir traduire un dictionnaire de langue; sa partie fonctionnelle est
théoriquement, c'est-à-dire essentiellement, intraduisible.
Au stade où nous sommes parvenus, les encyclopédies pures peuvent
donc être extraites, les traits ultérieurs du modèle ne concernant que
l'analyse du signe. Bien entendu, ce qu'on baptise « dictionnaire
encyclopédique », et qui correspond à un dictionnaire de langue volontairement
impur, est soumis aux options ultérieures. D'autre part, les dictionnaires
ne comportant que des noms propres appartiennent obligatoirement au
type encyclopédique, et n'ont pas été envisagés sérieusement ici. On dira
simplement que le nom propre, de par ses caractères lexicaux (identité du
type en langue et de l'occurrence, aptitude à constituer seul un SN [en
français], codage et démotivation maximum) et sémantiques (il désigne
et ne signifie pas), perturbe considérablement la description lexicogra-
phique normale : les dictionnaires qui « traitent » les noms propres le
font tout autrement que ceux qui analysent le reste du lexique.
En outre, il ne faut pas confondre les noms communs à referents
uniques avec les noms propres, bien que la frontière entre les deux soit
incertaine (soleil, dieu, sont incontestablement des noms communs, mais
Elysée, Unesco?). En fait, l'étude des dictionnaires de noms propres et des
encyclopédies pures n'appartient plus à la lexicographie; c'est le modèle
d'utilisation qui a rapproché les deux types d'ouvrages. Le statut du nom
propre dans le code de la langue pose des problèmes très ardus : cette
partie du lexique, sémantiquement apparentée aux pronoms mais
formellement opposée (elle forme l'ensemble le plus ouvert du lexique), ne
peut être décrite que selon une structure non linguistique, puisque les
fréquences n'y dépendent que de relations référentielles; de même, ce sont
des raisons extra-linguistiques qui font apparaître des noms propres aux
nomenclatures de dictionnaires (même à celles de certains dictionnaires
de langue).
3. [6] Les dictionnaires de signes, qu'ils soient unilingues ou pluri-
lingues, se différencient selon les informations non sémantiques 3 explicites
qu'ils comportent : (1) informations fonctionnelles seules (prononciations,
variantes formelles, données sur le fonctionnement syntagmatique des
unités, etc.) ou (2) informations mixtes, fonctionnelles et non
fonctionnelles (etymologies, datations, etc.). Les dictionnaires du type (1) seront
ipso facto synchroniques et descriptifs. Les informations non fonction-

3. Au sens étroit. On pourrait dire plus précisément, non synonymiques.


64

nelles dépendent de deux axes r la diachronie, s'opposant à la condition


première du fonctionnement, qui est la comptabilité chronologique, et
l'action volontaire sur la langue, dont la nature est de modifier le
fonctionnement observable (les remarques normatives, si elles veulent avoir la
moindre action, doivent contredire l'analyse fonctionnelle de l'usage).
On notera que la nature de ces informations dépend au premier chef de
celle des données initiales ([1]), lesquelles peuvent être fonctionnellement
compatibles (corpus synchronique et correspondant à un modèle
pragmatique acceptable) ou non compatibles (plusieurs dialectes, plusieurs
époques, plusieurs niveaux socio-culturels, etc.). Tous les types mixtes
sont possibles, et l'on trouve de nombreuses informations fonctionnelles
dans des dictionnaires unilingues à corpus hétérogène : c'est le cas de
presque tous les grands dictionnaires de langue, Johnson, Grimm, Littré,
Dahl, VOxford, Hatzfeld, le Robert, et, sans doute, le projet du Trésor de
la Langue française.
Le type mixte est de beaucoup le plus fréquent pour les dictionnaires
unilingues. Les dictionnaires bilingues, dont le corpus initial est souvent
plus homogène et que leur modèle d'utilisation incite à la brièveté,
comprennent moins de données non fonctionnelles; cependant la pédagogie y
fait souvent inclure des remarques normatives. Le dictionnaire
fonctionnel pur correspondra le plus souvent à un modèle socio-culturel
scientifique. Il en est ainsi des dictionnaires décrivant des langues non écrites,
qui présentent l'originalité d'échapper aux contraintes graphiques
absolues des autres descriptions lexicales, depuis la Chine et Sumer jusqu'aux
grands dictionnaires de langue européens. Une langue indienne ou
africaine transcrite par un linguiste, analysée en unités phonologiques,
morphologiques, décrite en règles syntactiques et sémantiques au moyen
d'une langue-instrument familière et prétendument indifférente (en fait,
on se doute qu'un dictionnaire papago rédigé en japonais ne serait pas
identique à ce qu'il est en anglais), donne lieu à une description vraiment
fonctionnelle. Point d'étymologie possible, pas d'autre norme que celle
des informateurs, et celle-ci n'est retenue que lorsque le descripteur
l'identifie à l'usage de la communauté.
Dans nos sociétés où l'acculturation est intense, très structurée et
exigeante, les modèles concrets de dictionnaires tendent toujours à
l'hétérogénéité, pour peu que le dictionnaire entre dans le jeu du marché
économique. Certes, on peut y trouver les principales informations sur le
fonctionnement du système linguistique : phonétiques et phonologiques
— ceci est d'ailleurs récent —, morphologiques et syntagmatiques,
morphosémantiques et distributionnelles, ainsi que les aspects pragmatiques
de renonciation (ce qu'on appelle et qu'on classe confusément en « niveaux
de langue »), enfin relations sémantiques paradigmatiques (synonymes,
contraires). Mais presque toujours, des éléments d'information extérieurs
au système sont requis : en particulier, le besoin de motivation des
éléments codés (mots complexes, syntagmes) conduit à gauchir l'analyse
par rapport à la description des fonctions. Les critiques linguistes voient
en cette hétérogénéité une impureté (par exemple R. L. Wagner, 1968,
à propos du Petit Robert), les lecteurs une richesse (par exemple M. Cour-
not chroniquant dithyrambiquement le même Petit Robert dans le Nouvel
Observateur), les éditeurs un facteur de vente favorable; il s'agit finale-
65

ment du produit normal d'une activité d'énonciation métalinguistique


complexe, ou, si l'on y tient, impure.
3. [7]. Sauf les encyclopédies, tous les types de dictionnaires, et
même les index, peuvent comporter une explicitation des données
initiales ([1]) sous forme d'exemples. Les index de textes deviennent alors
des concordances. Cette exemplification résulte d'une sélection qui
s'opère sur les éléments traités et opposés en [1] : discours observé et
énoncés générés. On distinguera, parmi les dictionnaires avec exemples
(éléments de discours non codés, à distinguer des syntagmes, proverbes,
formules, etc., qui sont ou peuvent être codés), les dictionnaires à exemples
produits, et ceux à « citations » reproduisant un énoncé observé. Exemple
produit ne veut pas dire exemple anonyme. En effet, on peut fort bien
utiliser un corpus non littéraire (phrases enregistrées, extraits de textes
considérés comme neutres) sans le distinguer d'énoncés produits par le
lexicographe. D'ailleurs, il n'y a aucune raison pragmatique de distinguer
ouvertement les exemples produits ad hoc des exemples extraits d'un
corpus. Ceci est assez évident dans la description lexicographique de
langues non écrites où le descripteur utilise son magnétophone (a) pour
constituer un corpus aussi pertinent que possible tiré d'une masse
d'observations, (b) pour enregistrer des énoncés sollicités, destinés à remplir une
fonction précise dans l'économie de la description. De même les énoncés
qu'on peut lire dans le Dictionnaire du français contemporain peuvent
aussi bien provenir d'énonciateurs externes (par exemple un speaker de
l'O.R.T.F.) que des lexicographes eux-mêmes. Mais cette provenance,
sans importance sur le plan pratique, en a beaucoup pour la définition
d'un modèle théorique. Le dictionnaire est un texte dont l'articulation
fragmentée et une partie des énoncés provient d'un « locuteur » ou plutôt
d'un scripteur en général collectif, mais dont le modèle d'énonciation est
défini (ce qui permet de parler d'un « auteur »); lorsque les exemples sont
produits par le lexicographe, ce modèle reste unique; lorsqu'ils sont
produits par d'autres énonciateurs — même sollicités ou sélectionnés — , il
ne l'est plus, et la seule unification vient de la pratique de la sollicitation
et du choix. Ainsi, les Académiciens français du xvne siècle expliquent
qu'ils n'ont pas eu besoin de citer les grands écrivains français, parce que
les « grands écrivains » ce sont eux, qui sont aussi les lexicographes...
Voilà un cas de dictionnaire à exemples sollicités, mais rendus anonymes;
si les rédacteurs des articles ont utilisé leurs propres phrases, le modèle
est unique, s'ils ont demandé des exemples à leurs collègues académiciens,
il n'est qu'unifié. Les énoncés sont alors produits pour le dictionnaire. Il
en est de même pour les phrases prononcées par l'informateur pour
l'ethnolinguiste : l'académicien français du xvne siècle et l'indien hopi
contribuent de la même façon à la fourniture d'énoncés-exemples qui
n'existeraient pas sans la description qu'ils illustrent.
Au contraire, et même citées sans guillemets, les phrases observées
dans le flux de renonciation, qui est en général assez indifférente aux
activités lexicographiques, sont extérieures au dictionnaire. Elles subissent
une extraction de leur milieu (le discours infini, ou S parole [Heger]),
sont triées, choisies, réparties, souvent traitées par neutralisation ou
fragmentation (c'est le fameux « style dictionnaire »), enfin insérées dans un
article où leur fonction sémantique est entièrement modifiée. Le cas le
66

plus évident et le plus fréquent dans les langues dites de culture est celui
des citations littéraires. Celles-ci sont isolées du reste du texte lexicogra-
phique par des guillemets, dont la fonction est de signaler que l'énoncé
qu'ils enferment est fidèlement reproduit, c'est-à-dire extrait d'un contexte
et transporté; elles sont en général suivies d'une référence qui indique au
parfois*
moins le nom de l'énonciateur originel, et le lieu textuel d'où
l'énoncé provient. En fait, la plupart des dictionnaires qui utilisent un
vaste corpus observé ([1]) le manifestent sous forme de citations.
L'apparition d'une citation sous une entrée résulte d'une suite complexe de choix :
choix d'un texte dans le corpus, choix d'un énoncé dans le texte, choix
d'une unité lexicale dans l'énoncé, choix d'une valeur (sens) pour l'unité
sélectionnée,
d' « intertextualité
et d'opérations
» (J. Kristeva).
sémantiques
L'énoncé,
qui mettent
qui représentait
en œuvre un
le concept
séman-
tisme et une forme expressive uniques — et impossibles à définir hors du
contexte textuel total — devient une suite syntagmatique indépendante,
ce qui change son sens, et, sinon sa forme, du moins la valeur de cette
forme, et une suite autonyme, c'est-à-dire signifiant le fonctionnement
du signe lexical : la même phrase, illustrant deux mots différents, n'a pas
le même sens lexicographique.
La typologie des exemples dépasse de loin le cadre de cet article;
notons cependant les cas principaux : syntagme généré puis neutralisé
par le lexicographe (Incliner le front, Petit Robert, s. v. Incliner), phrase
canonique, élémentaire, elle aussi produite (le vent incline les épis; inclinez
le flacon et versez doucement, ibid.) énoncé observé, extrait, transporté et
partiellement identifié i (« II joignait les talons, s'inclinait assez bas devant
les hommes » (J. Romains), ibid.).
4.1. Cette typologie des dictionnaires reste, on le voit, assez
grossière. Les données non pertinentes pour la catégorisation des dictionnaires
(mais essentielles en lexicographie), comme l'analyse sémantique et
fonctionnelle qui subdivise la microstructure en sous-entrées, y ont été
négligées volontairement, bien qu'on en retrouve les ' composantes dans le
i
modèle. Ceci, afin que ce modèle demeure assez simple pour, aboutir aux
formules souhaitées par Malkiel. Le tableau ci-joint (p. 59 sq) est destiné à
permettre l'établissement de ces formules. Chaque stade, de 1 à 7, comprend
des choix binaires (ou binarisés) symbolisés par un chiffre ou une lettre
(1 ou 2, a ou b) suivant le chiffre du stade concerné (ex. 1.1. vs 1.2.,
1 . a vs 1 . b, 1 . a vs 1 . (3, où les catégories 1 , 2; a, b; a, p sont indépendantes).
Si les classifications sont taxinomiques (dépendantes) les chiffres se
suivront : 2.2. se subdivise en 2.2.1. vs 2.2.2.
4.2. Comme les types théoriques sont rarement réalisés purs et que
les choix pragmatiques sont analogiques (progressifs) et non pas digitaux,
on a souvent opposé un type « pur » à un type « mixte ». Ainsi, les données
observées, pour l'élaboration d'un dictionnaire, se rencontrent assez
souvent pures, pour des raisons pratiques : le rédacteur d'un dictionnaire du
hittite ne va pas forger des phrases pour illustrer les unités lexicales qu'il
décrit; le type 1 . 1 « pur » constituera donc un pôle de choix. Mais le type
opposé du dictionnaire généré n'existe guère à l'état pur, puisque la pro-
4. En effet, la citation d'auteur comporte rarement la mention d'un énonciateur
différent de 1' « auteur », quand il y a lieu (discours rapporté des personnages de roman,
tous les énoncés de théâtre, etc.) :
duction de phrases nouvelles y est mêlé à la re-production d'énoncés déjà
formés, entendus ou lus. Les dictionnaires décrivant des langues parlées
au temps de la description sont presque toujours basées sur des phrases
observées et produites, soit par le lexicographe utilisant sa compétence
linguistique, soit par des informateurs. On opposera donc 1 . 1
(dictionnaire à données observées seules) à 1.2 (dictionnaire mixte). De même
l'opposition 6.1 (informations fonctionnelles seules) vs 6.2 (informations
fonctionnelles et non fonctionnelles) est destinée à dichotomiser le choix.
Le type mixte (6 . 2) est le plus fréquent, les deux types « purs » étant
extrêmement rares. Il en est de même pour les oppositions 2. 2. a vs
2.2.b (unités de traitement définies par des procédures d'analyse sur les
énoncés vs unités traditionnelles et reçues), ou 5.1 vs 5.2. Par contre,
les oppositions 2.1 vs2.2; 3.1 vs3.2; 4.1 vs4.2 peuvent être
considérées comme binaires et franches.
D'autre part, les oppositions extension vs sélection, appliquées en 3,
5 et aussi 6 et 7, sont évidemment graduelles, purement relatives au
modèle socio-culturel moyen, et sans valeur primaire dans notre modèle.
Il en serait de même de l'opposition descriptif vs normatif, qui peut être
introduite en 6.2.
4.3. Les types théoriques de ce modèle résultent donc d'une combi-
natoire de traits. En 1 et 2, ces traits sont très généraux, et les oppositions
qu'ils fondent sont peu apparentes dans les types réels (sauf cependant
2.1 (index d'occurrences) vs 2.2 (dictionnaire d'unités de langue). Ainsi
l'opposition entre 1 .a et 1 . (3, primordiale linguistiquement, n'a été
envisagée explicitement qu'au xxe siècle; auparavant, on peut seulement dire
que les dictionnaires d'usage, surtout bilingues, tendaient à n'enregistrer
et analyser seulement des données fonctionnellement compatibles, alors
que les dictionnaires « scientifiques », informés par la linguistique du
xixe siècle, mêlaient volontairement des éléments incompatibles. Par
contre, certaines oppositions sont très évidentes et reconnues par les
classificateurs, depuis qu'il y a des dictionnaires. C'est le cas de 3.1 vs 3.2
(dictionnaires « généraux » et « spéciaux ») de 4.1 vs 4.2 (dictionnaires
alphabétiques et formels vs dictionnaires « conceptuels ») de 5 . a . 2 . 1 vs
5. a. 2. 2 (unilingues et plurilingues). Ces oppositions sont reconnues parce
qu'elles correspondent à la fois à des oppositions de traits théoriques et de
modèles socio-culturels.
La prise en considération de toutes les oppositions de ce modèle
permet de construire une typologie assez complète et précise (mais qui
pourrait évidemment être précisée par des subdivisions ultérieures). Elle peut
correspondre à des types rares ou virtuels, mais toujours réalisables. Ainsi,
le dictionnaire « distributionnel » prévu en 2. 2. a n'était pas envisageable
avant la linguistique bloomfieldienne. Ou encore, l'analyse du signe
caractérisé en 5. a. 2. 2 permet de prévoir un type de dictionnaire explicité
sans recours à la langue naturelle, type encore virtuel, mais qui
correspond à des projets comme celui de Katz et Fodor. La totalité des options
de base étant envisagées, les types dégagés paraissent recouvrir la grande
majorité des cas réels, même si leur caractère hybride et les subdivisions
très nombreuses imposées par les besoins culturels et les hasards de
l'histoire rendent nécessaires des aménagements ultérieurs. * . "
4.4. Deux sortes de tests peuvent être appliqués au modèle :
68

1) La qualification d'une séquence symbolique quelconque respectant


les incompatibilités prévues dans le modèle (par exemple 5.1
[encyclopédies] élimine certaines options ultérieures).
Ainsi, au stade [1], la formule 1 . 1 .a. a correspondrait à un index ou
à un dictionnaire (selon 2.1 ou 2.2) décrivant exhaustivement un corpus
appartenant au même état de langue (ex. Index ou Dictionnaire d'auteur;
dictionnaire historique basé sur un corpus synchroniquement délimité).
La formule 1 .2. 6. p correspondrait à un index ou dictionnaire élaboré
d'après des énoncés produits ad hoc et des énoncés observés, utilisés
partiellement et appartenant à plusieurs systèmes fonctionnels différents
(ex. le Littré).
2) L'affectation d'une formule à un dictionnaire réel. Un grand
dictionnaire de langue du type Littré se trouve caractérisé par :
(a) : 1. 2. b. (3/2. 2. 1.6/3.1. a/4. 1/5. a. 2.1. A/6.2/7.2.1/.
Un « dictionnaire des difficultés grammaticales » correspondrait à la
formule :
(b) : 1.1. 6/2.2. a/3.2.1.2/4. 1/5. ô. 1/6.2/7.2/.
4.5. A supposer que cette classification soit insuffisante pour rendre
compte de l'extraordinaire variété des textes lexicographiques, elle aura
au moins dégagé quelques oppositions fondamentales et servi par là à
mieux définir les voies et les moyens d'une pratique métalinguistique
complexe et déconcertante. La complexité en est généralement reconnue.
Mais à trop imaginer le dictionnaire idéal, pur instrument scientifique
sans compromissions vulgaires, les linguistes ont en général sous-estimé
sa nature profonde, qui est de fabriquer un texte où la langue est
décomposée puis reconstruite selon un nombre limité d'options. Il n'appartenait
pas à une simple tentative de classification de dégager les présupposés
idéologiques et culturels qui président à cette opération, et qui articulent
une vision active du phénomène linguistique.

Nota. Les références bibliographiques renvoient à la Bibliographie finale.


On y ajoutera :
Scerba, L. V. (1940). «Opyt teorii leksicografii », Izvestija AN SSSR, Otde-
lenie literatury i jazyka, 3, p. 83-117.