Académique Documents
Professionnel Documents
Culture Documents
CULIOLI-CapLivro-La Formalization en Linguistique
CULIOLI-CapLivro-La Formalization en Linguistique
La formalisation en linguistique
1. Par machine, on entend ici une machine relle, et non une machine abstraite comme la machine de
Turing.
La formalisation en linguistique 107
quence, invitable, est une rduction du langage, pour des raisons techniques
dont on n'a le plus souvent pas conscience. En particulier, il apparat claire-
ment que la formalisation irresponsable - ou le refus aussi irresponsable
de poser le problme thorique de la formalisation en linguistique -
empche de bien marquer la relation dialectique entre le lallgage et les
langues. Le discours du linguiste se clt facilement dans des jeux de r-
criture qui, la diffrence des mathmatiques, ne sont ni rigoureux ni
fconds l, ou se bloque dans la description de langues particulires, dites
irrductiblement spcifiques. Dans ce dernier cas, une langue individuelle
est considre tantt comme un objet empirique intuitivement donn (on
regarde fonctionner l'anglais, le chinois, etc.), tantt comme une essence
(la langue au sens saussurien du terme, ou le langage) dont la puret aurait
t brouille.
Enfin, trop de linguistes ignorent que l'on peut, volont, construire des
systmes formels, et prennent pour une proprit de l'objet ce qui est une
proprit du modle ou mme un expdient phmre. Vieux problme,
mais qui a une importance singulire dans la linguistique contemporaine
(cette partie, du moins, qui consent sortir du cercle magi~ue de l'idologie
positiviste). Pour certains, la linguistique formelle, c'est d abord une arbo-
rescence (dichotomique) et puis un systme gnrateur syntaxique, radica-
lement spar de la smantique qui, comme dans tout systme formel, est
une interprtation des expressions bien formes (syntaxiquement). Le
problme n'est pas, ce stade, d'apprcier le degr de validit d'un tel
modle, mais de reconnatre tout d'abord qu'il est une caricature de la doc-
trine de Chomsky; ensuite, la diffrence de Chomsky, qui connat (et
nonce) ses postulats, trop de linguistes pris de formalisme ne savent pas
ce qu'ils font, pourquoi ils le font, et cdent tout simplement la fascination
du bidule, de l'objet technique dont on sait qu'il a un mode d'existence
privilgi. Faut-il rappeler que le problme mthodologique de la linguis-
tique (parmi les autres sciences humaines) est de trouver, c'est--dire se
fabriquer, les outils logico-mathmatiques qui permettront de donner une
description adquate de l'activit langagire saisie travers les langues?
Rien ne nous permet de penser que les mathmatiques actuelles sont forc-
ment appropries, que les tres grammaticaux, mme mathmatiss, avec
lesquels le linguiste opre, ont une valeur autre que traditionnelle.
Que la linguistique doive tre systmatique, rigoureuse, explicite, ouverte
la vrification, tout le monde est prt accepter d'enthousiasme un tel
programme, supposer que les bonnes intentions constituent un pro-
gramme. Mais les rsistances ameurent trs vite, ds qu'on veut se donner des
1. Afin d'viter toute quivoque, il importe de dire en clair que ceci n'est pas une critique de
N. Chomsky (ou de la majorit des linguistes qui travaillent avec Chomsky). Le rle de Chomsky a
t, et reste, capital sur le plan tant pistmologique que strictement linguistique, et l'on souhaiterait
partout aussi peu de dogmatisme et autant de prudence. Mais cette attitude ouverte se ferme vite dans
le discours pseudo-scientifique et caricatural de certains pigones.
108 Antoine Culio/i
1. On ~vitera ici toute assimilation de comptence langue et de performanct parolel Chomsky lui-
mme est fort circonspect sur ce point.
La .formalisation en linguistique 109
d) On ne saurait ramener les problmes de catgorisation de simples
gnralisations fondes sur la frquence. Ceci a t clairement montr dans
une tude de D. McNeill sur l'apprentissage du japonais par une enfant de
deux ans : il existe en japonais deux particules postposes, wa etga, la premire
correspondant en gros quant x, il... ou encore il y a x, et il... , la
seconde c'est x qui ... ou simplement x est l'origine de tel procs .
La mre utilise deux fois plus de wa que de ga, mais l'enfant emploie cent
foisga pour six wa (sur huit heures d'enregistrement), et montre qu'elle sait
utiliser ga avec ses deux valeurs (<< C'est x qui, c'est x que, d'lm ct, etx
sujet , de l'autre). Ainsi, l'enfant a compris le systme, a repr celle des deux
particules qui correspondait la fonction centrale de prdication, bien qu'elle
soit la moins frquente, et en a a~pris l'usage correct. De mme, aucune
tude de frquence ne permettra d expliquer le statut du masculin par rap-
port au fminin dans tant de langues, ou de l'anim par rapport l'inanim.
La conclusion de cette numration est que l'on ne peut poser le problme
des observables sans se donner une thorie de l'observation, en particulier,
sans se demander o l'on poste les observateurs. C'est ce que marque bien la
distinction entre surface structure et deep structure chez Chomsky : la configu-
ration de surface est la trace d'oprations sous-jacentes. Or, tudier le pro-
cessus de production, cela signifie que l'on quitte le domaine de l'observa-
tion illusoirement immdiate pour oprer abstraitement. (Il ne saurait y avoir
de formalisation de la surface 1; on ne peut dcider a priori qu'il n'existera
que deux niveaux, superficiel et profond, sauf pour poser une distinction
rudimentaire; il est peu probable que l'on puisse se donner comme objets
(termes et relations) primitifs ceux que l'on trouve en surface, simplement
transports l'tage au-dessous). Ensuite, il faudra retrouver ,Ear le calcul
les noncs possibles, et ceci jusque dans le dtail, puisque la linguistique
formelle ne se donne pas pour tkhe de survoler les langues dans leurs gn-
ralits, mais de rendre compte de ce que l'on trouve, dans toute sa diversit,
sans aucune exception (des exceptions elles-mmes, on doitpouvoirjustifier
le caractre exceptionnel). .
Se construire une thorie de l'observation, cela implique en outre que l'on
classe les modles selon les questions auxquelles ils rpondent, exigence
fondamentale ds que la recherche s'articule sur plusieurs champs, par
exemple en psycho-linguistique ou dans l'analyse littraire. Il sera indispen-
sable en outre d'avoir une thorie des reprsentations (au sens des procds
graphiques : toute formalisation est une criture) : les modles sont-ils qui-
valents, compatibles? Les reprsentations sont-elles isomorphes? Tel mode
de reprsentation est-il opratoire, c'est--dire, sait-on l'utiliser pour cal-
culer? Ici devrait se greffer une thorie de l'approximation qui permettrait
d'valuer la force et la rgionalit d'un modle. Mais longtemps, la linguis-
tique n'a pas prouv le besoin d'une telle thorie, car son empirisme pis-
poser que l'on puisse le rendre univoque, il reste que, dans toute langue o
existe la passivation, cette transformation introduit (ou, plutt, peut intro-
duire) une modulation smantique qui interdit de considrer le passif, sauf
au plan d'une syntaxe stricte, c'est--dire vide, comme le simple dual de
l'actif. Or, ceci vient, par rtroaction, introduire nouveau dans le mot une
surcharge incontrle.
En fait, tout systme algbrique d' oprateurs (et de mta-oprateurs) vient
s'imbriquer dans un systme de variables sur lesquelles il porte. Ce second
systme a ses structures propres, et ces variables sont, leur tour, insres dans
un rseau rfrentiel qui est en correspondance avec les situations vcues,
l'organisation de nos conduites perceptives et pragmatiques, voire nos labo-
rations fantasmatiques.
Que l'on n'oublie pas, en outre, que nous apprhendons les universaux
seulement travers les variations de surface de chaque langue : d'o un ris-
que accru de donner un statut scientifique des conceptualisations faussement
objectives, o se mleraient les thorisations explicites et implicites. En
consquence, on ne saurait partir, sauf pour des raisons videntes de com-
modit, d'une seule langue, o l'on ferait la description de tel phnomne
(ainsi, on dresserait en franais l'inventaire raisonn des emplois de tre et
avoir), en sprant qu'ensuite on pourrait transporter dans une autre langue
ce qu'on a dcouvert dans la premire.
C'est croire que l'on trouve des structures (au sens fort) fleur de langue
et que l'on peut chapper, par une simple intention de rationalit, au leurre
terminologique; c'est sous-estimer la surcharge parasite qu'entrane toute
conceptualisation sur le langage. Pour pouvoir itrer avec une stabilit rai-
sonnable (donc avoir un noyau d'invariants qui, seul, permet la prvision),
il faut munir les tres linguistiques d'une structure, cette structure provient
d'une thorie de l'analyse qui, elle-mme, doit tre relie une thorie du
langage. On devra donc, partir des langues (c'est--dire, en pratique,
partir de langues) se donner une mtalangue, avec ses rgles, puis revenir
aux langues. Au lieu de cela (mme s'il ne s'agit que d'un projet, lentement
ralisable), on trouve un mlange de catgories mal dfinies, le plus souvent
hrites, de relations considres comme allant de soi, ou une utilisation
schmatique de classements binaires qui dmarquent la phonologie l,
humam
du genre clibataire ( mle
. ++ 1 ou branche
f ~g:~l
anim
tf: t-
+
)
' etc.,
adulte + d'enomb rable +
prend ses justes fonctions. A ce concept. on donne srement trop de sens puisque jamais on ne le pcose-
formellement. Mais si on lui donne trop de $COS, il est craindre que deux esprits diffrents ne lui donnent
pas le mme sens. (G. Bachelard, la Philosophie du Non, Paris, p. 134.)
1. On trouve d'autres reprsentations (chemin, arbre), mais les problmes thoriques restent.
112 Antoine Culioli
sans que les prsupposs thoriques de telles procdures soient vus claire-
ment!.
3. Syntaxe et smantique : rassemblons ici quelques problmes entrevus
plus haut, en les nonant sous forme de propositions :
a) rien ne permet de ramener la smantique des langues naturelles la
smantique interprtative des systmes formels;
b) tout signe peut tre utilis comme symbole et les oprateurs syntaxiques
n'chappent pas cette rgle : tout changement syntaxique entrane un clian-
gement smantique (quelle que soit l'acception de cet adjectif: rgulation
inter-individuelle par une communaut, pragmatique, rhtorique, etc.).
Dire. qu'une phrase et sa transforme sont quivalentes ne change rien au
problme : tout rside dans la force de l'quivalence; certes, en termes de
voisinage, on pourra tablir une distance croissante, de la transforme iden-
tique une phrase profondment remanie, mais il est difficile, hormis dans
une thorie ( expliciter) du bon sens et de la conservation du sens, de soutenir
que, seule, la structure profonde reoit une interprtation smantique et
que les transformations ne changent rien. Ou plutt, un tel degr d' a~pro
ximation, pareille proposition peut avoir une valeur heuristique, mais n a pas
de validit thorique;
c) il est permis, au contraire, de poser, en tayant la thse sur des argu-
ments thoriques, qu'il existe un niveau trs profond (vraisemblablement
prlexical) une grammaire des relations primitives o la distinction entre
syntaxe et smantique n'a aucun sens. On aura ensuite un filtre lexical, avec
un certain nombre de rgles et syntaxiques et smantiques, y compris la
modulation rhtorique (mtaphores, glissements de sens), qui ne saurait tre
ramene de la synt:p. Nous sommes ici, en effet, dans le continu, et non
dans le discontinu, et aucune reprsentation de type syntaxique (contraintes
distributionnelles sur la co-occurrence; ordre partiel) ne suffit rendre
compte du langage potique par exemple, moins que l'on ait recours au
pitre argument de la dviance et de l'anomalie qui, de toute faon, ne rgle
rien.
Aprs un autre filtrage Il on obtient une lexis, o les termes sont compati-
bles avec un ordre, mais ne sont pas encore ordonns; en outre, la lexis est
pr-assertive et le passage l'assertion (au sens de nonciation par un sujet )
implique une modalisation. Modaliser signifie affecter d'une modalit et
modalit sera entendu ici au quadruple sens de (1) affirmatif ou ngatif, in-
jonctif, etc. (2) certain, probable, ncessaire, etc. (3) apprciatif: il est triste
que... ; heureusement (4) pragmatique, en particulier, mode allocutoire,
causatif, bref, ce qui implique une relation entre sujets. Outre la modalisation,
I. Passons sur les emplois reIachs du programmeur qui parle de formaliser un texte, alors qu'il s'agit
d'un codage utilisant un langage formel, du linguiste qui parle de formalisation ds qu'il emploie un
symbole ou un diagramme. A ce niveau-l, il n'est mme plus question de prsuppo~ tb&>riques im-
plicites ou diffus.
2. Le terme defiltre (ou aiblt) n'a d'autre fonction ici que mtaphorique.
La formalisation en linguistique I13
attirer rapidement l'attention sur quelques concepts importants, puis sur une
proprit caractristique du langage.
I. On ramnera toutes les oprations unaires de prdication ( l'exclusion
ici des transformations de composition sur des lexis) une application, ce
qui n'a rien que de trs banal, mais on ira jusqu'au bout de l'analyse, en y
adjoignant une thorie des prdicats. On obtiendra ainsi une typologie des
procs, une classification des oprations que l'on peut effectuer sur l'ensemble
de dpart et/ou sur l'ensemble d'arrive, sur la flche qui symbolise le foncteur.
On est alors en mesure d'analyser formellement les situations empirique-
ment rencontres dans les langues, ainsi que des transformations telles que
la passivation et autres phnomnes connexes. On est surtout mme
d'accroitre la complexit du modle, en introduisant par exemple la compo-
sition de deux applications.
2. On peut donner des valeurs d'un systme verbal (un systme tant dfini
comme un rseau de valeurs) une reprsentation topologique qui permet
de mieux poser certains problmes concernant les systmes de modalits, et
singulirement de relier les systmes modaux, aspectuels et temporels.
3. On peut ramener les oprations sur les units dans l'ensemble de dpart
et dans 1 ensemble d'arrive une liste finie d'oprateurs que l'on pourra
ensuite combiner (par exemple, oprateur de classe : le chat est tm flin domes-
tique, pour ne prendre que le cas le plus trivial; flcheur, qui distingue un
lment, soit un individu, soit une portion: le (dans certains de ses emplois),
ce, mon,etc.; extracteur, par exemple dans il y a un chien qui aboie; curseur,
qui parcourt, ou balaie, la classe: par exemple, tout, quiconque, anglais any;
oprateur qui fait que l'on considre la classe comme renvoyant une
notion : un bruit de machine, une odeur de rose).
4. On recherchera les relations de dualit qui existent entre des expressions
(au sens formel du terme), mais il importe de noter que dans le langage, o
tout est orient, il se trouve des secteurs oit le principe de dualit joue de
faon stricte et d'autres o les phnomnes sont plus complexes. De toute
faon, il importe ici de distinguer avec un soin particulier ce qui est langagier
de ce qui est linguistique, pour ne s'en tenir qu' cette dichotomie simple.
5. On reprsentera certaines catgories par des vecteurs de proprits, de
telle sorte que l'on pourra avoir des vecteurs de vecteurs. Ainsi, on notera
Sujet (d'une phrase) = (Co, Agent, Thme). Co se lit Complment de rang
zro dans une thorie des complments, impliquant que le sujet (de surface),
dans les langues o sa prsence est obligatoire, est ncessaire comme lment
de l'ensemble de dpart, pour que l'nonc soit canoniquement bien form;
Agent implique que trs souvent (la formulation est volontairement approxi-
mative) le Sujet est Agent, soit un niveau de surface soit, en inversant la
proposition, que l'Agent tait Sujet (Co) un niveau profond. En outre,
cette notation indique que, mme quand le Co n'est pas Agent, on tend lui
attribuer des proprits d'Agent; Thme ne demande gure d'explication
premire vue, puisque l'acception du terme est ici proche de l'acception
La formalisation en linguistique Ils
traditionnelle. Une analyse plus fine rvlerait cependant des problmes
complexes.
Ce vecteur est coulissant , c'est--dire que chaque terme, l'exception
de Co, peut prendre une valeur nulle. On peut donc avoir: (Co, Ag., Th.),
(Co, Ag.), (Co, Th.), (Co). De son ct, Agent est reprsent dans un autre
vecteur (Agent, Anim, Dtermin), lui aussi coulissant 1.
Une telle notation permet d'liminer bien des ambiguts et maladresses
dans la mtalangue, de mener certaines analyses linguistiques et psycholo-
giques qui, sinon, tourneraient court; d'une faon gnrale, il s'agit ici d'une
combinatoire beaucoup plus complexe que dans l'analyse dite structurale,
o l'on a affaire des structures pauvres.
6. On construira des systmes logiques particuliers, du type 0,1 (o 0 peut
tre un absorbant 2 selon les systmes), * (terme neutre, ce qui signifie:
qui n'est ni 0 ni I ou bien est 0 ou I ), (0 (terme qui est en dehors de
(0, I, *) 3. On retrouve ici, mais sous une forme plus fconde, le concept
de marque (non-marqu: -1 marqu +), et cela a quelque rapport (mal-
gr de profondes diffrences) avec le systme de Brondal. L'important est
de bien comprendre que, seule, une dcision thorique (thorie du langage)
permet d'attribuer telle unit le statut du 0 ou origine (par exemple dans
masculin Ifminin, actuel Inon-actuel) , puis le statut de successeur, etc.
7. De trs nombreux systmes sont munis d'une structure en came',
sur laquelle nous reviendrons dans un autre article, de la forme suivante :
'.Y"
(prP)O(k)
~t
(Loc)O(prp.)
L'intrt d'une telle reprsentation est qu'elle force prendre des dci-
sions, donc poser un problme : ainsi, quel sera le point de dpart? Pour-
quoi analyser de la sorte le systme des pronoms? En outre, il importe de
1. Le choix de ces deux pronoms est didactique; il aurait t trop long d'exposer la question dam
sa totalit.
2. nfaudrait expliciter ce qu'on entend ici par ditermlni et justifier la place de a (on voit que la dter-
mination d&:rott de Ul a, que /li est non-dtermin, c'cst--direen dchondel'opposition dterminl
indtermin) ; il faudrait rattacher ccci au point (s) ci-dessus; enfin, il serait ncessaire d'expliquer
pourquoi /li qui n'est rf"rcnticllcntent ni un masculin ni un fminin CIt, morphologiquement, au
masculin. Ces dmonstrations ne IOnt pu faites ici pour de simples raisons de place.
La formalisation en linguistique II7
)
Ici encore, de tels modles permettent de rsoudre des problmes qui
se posent propos des langues ou du langage. Parmi ces problmes, signa-
lons l'ambigut de la lexis [mon pre, mourir] (a) la mort de mon pre (simple
vnement : je considre que mon pre meure , si mon pre meurt "
l'ide, le fait que mon pre meure ) (b) dsir (<< je souhaite que mon pre
meure ; que mon pre meure! ) (c) rejet (<< je ne veux pas que mon
pre meure , je ne veux pas envisager l'ide que mon pre meure )
(d) retour la lexis, etc. On a, naturellement, reconnu ici la discussion par
Freud du cas de l'Homme aux Rats : ce qui est important, c'est que, comme
l'indique le diagramme ci-dessus, on a un chemin qui est en gros le suivant :
[pre, mourir ou pas mourir] -+ l'ide que... -+ le souhait que -+ le
souhait que ne ... pas, ou le rejet du souhait que -+ finalement le souhait
que , par l'intermdiaire de [pre, mourir ou pas mourir].