Vous êtes sur la page 1sur 10

TALN 2003, Batz-sur-Mer, 1114 juin 2003

arXiv:0810.1199v1 [cs.CL] 7 Oct 2008

Une grammaire formelle du crole martiniquais pour la


gnration automatique
Pascal Vaillant
Universit des Antilles-Guyane UFR de Lettres et Sciences Humaines
B.P. 7207 97275 S CHOELCHER CEDEX Martinique, France
Ml : pascal.vaillant@martinique.univ-ag.fr

Mots-clefs Keywords
Crole, Martiniquais, Grammaire, TAG, Gnration
Creole, Martiniquese, Grammar, TAG, Generation

Rsum - Abstract
Nous prsenterons dans cette communication les premiers travaux de modlisation informatique dune grammaire de la langue crole martiniquaise, en nous inspirant des descriptions
fonctionnelles de Damoiseau (1984) ainsi que du manuel de Pinalie & Bernab (1999). Prenant appui sur des travaux antrieurs en gnration de texte (Vaillant, 1997), nous utilisons un
formalisme de grammaires dunification, les grammaires dadjonction darbres (TAG daprs
lacronyme anglais), ainsi quune modlisation de catgories lexicales fonctionnelles base
syntaxico-smantique, pour mettre en uvre une grammaire du crole martiniquais utilisable
dans une maquette de systme de gnration automatique. Lun des intrts principaux de ce
systme pourrait tre son utilisation comme logiciel outil pour laide lapprentissage du crole
en tant que langue seconde.
In this article, some first elements of a computational modelling of the grammar of the Martiniquese French Creole dialect are presented. The sources of inspiration for the modelling is the
functional description given by Damoiseau (1984), and Pinalies & Bernabs (1999) grammar
manual. Based on earlier works in text generation (Vaillant, 1997), a unification grammar formalism, namely Tree Adjoining Grammars (TAG), and a modelling of lexical functional categories
based on syntactic and semantic properties, are used to implement a grammar of Martiniquese
Creole which is used in a prototype of text generation system. One of the main applications of
the system could be its use as a tool software supporting the task of learning Creole as a second
language.

Pascal Vaillant

1 Introduction

Le crole martiniquais est lun des reprsentants de la famille des langues croles base lexicale
franaise de la zone Amrique-Carabes ( CRELFACS ). Ces langues peuvent tre dcrites trs
gnralement parmi celles qui se sont formes dans une situation de contact ; mais lexpression relve ici dun euphmisme considrable, le contact consistant en loccurrence en la
dportation massive de peuples de langues diffrentes, obligs dadopter en peu de temps un
vhiculaire comme nouveau moyen dexpression. La situation historique voque est celle de
la colonisation du Nouveau Monde par les puissances europennes entre le XVIIe et le XIXe
sicle, et de limportation massive et force de main duvre africaine engendre par le systme
conomique esclavagiste.
Les croles ont ainsi subi simultanment, en lespace d peine quelques gnrations, plusieurs
processus dvolution diachronique rapides (Alleyne, 1996). Certains sont assez faciles se
reprsenter et sont lobjet dune description relativement classique : ce sont par exemple les
dveloppements de tournures analytiques, du mme type que ceux qui ont conduit du latin au
langues romanes modernes, et qui sont encore luvre dans le franais actuel (plus dveloppes dans les varits de franais populaire qui taient parles par les colons que dans la langue
standard, ces tournures auraient ainsi pu selon Chaudenson (1995) contribuer directement influencer le lexique et la grammaire crole). Dautres, beaucoup plus spcifiques la situation
et beaucoup moins la porte de linvestigation linguistique historique, ont pu provoquer des
amalgames de structures lexicales et syntaxiques franaises dune part, et de structures provenant de plusieurs langues africaines dautre part, la propagation de modles linguistiques variant
dans certains cas avec linfluence de certains groupes de peuplement, qui jouissaient certaines
poques de situations de domination dmographique ou culturelle relative (Alleyne, 1996). Les
croles ont en fin de compte dvelopp un systme smantique et un systme syntaxique tout
fait original, tout en gardant incontestablement une base lexicale majoritairement franaise.
Ces considrations historiques ne sont pas lobjet du travail prsent ici, mais leur rappel permet
de resituer dans leur perspective les caractres originaux des crelfacs.
Dans une perspective synchronique, quoi quil en soit, nous nous sommes attachs mettre
sur pied une modlisation adquate et conomique des descriptions linguistiques du systme
actuel de la langue. Nous nous sommes appuys, pour le cur de la description des noncs,
sur lapproche fonctionnelle de Damoiseau (1984), tout en ayant recours pour des descriptions
plus fines certains exemples de (Bernab, 1983) et de (Pinalie & Bernab, 1999).
Le crole martiniquais est lun des reprsentants de la famille des crelfacs, avec le guyanais,
le trinidadien (en voie dextinction, au profit de langlais), le saint-lucien, les dialectes dominicais, les dialectes guadeloupens, les dialectes hatiens, et le louisianais. Il a la particularit
dtre lun des plus unifis, et partage par ailleurs avec le crole de Port-au-Prince (devenu
langue nationale dHati) une richesse en termes de production culturelle qui ne se retrouve
qu un degr moindre dans dautres pays crolophones. Lapproche prsente ici est cependant
aisment transposable dautres langues du mme groupe, notamment le guadeloupen et le
guyanais.

Une grammaire formelle du crole martiniquais

2 Description
Nous exposons ici quelques faits grammaticaux succints ; des descriptions plus compltes des
faits de grammaire du crole martiniquais se trouvent dans les ouvrages dj cits (Damoiseau,
1984; Bernab, 1983; Pinalie & Bernab, 1999).
Le crole est une langue isolante, dans laquelle les lments lexicaux sont invariables. Les
fonctions syntaxiques sont toutes manifestes par lordre des lments dans la phrase.
Groupes verbaux
Labsence de flexion nominale est dj familire un lecteur francophone. Comme le franais, et
contrairement aux langues flexion nominale comme le latin ou le russe, le crole ne dtermine
la fonction des actants et des circonstants des verbes que par deux procds : (a) leur position
dans la chane syntaxique, et (b) des prpositions introduisant des cas smantiques spcifiques.
Lordre des actants et des circonstants a tendance a tre plus rigide encore quen franais, le
procd (a) ayant un primtre demploi plus tendu encore. Ainsi, en crole, les verbes trivalents de type attributif (correspondant des verbes franais comme donner, prter, montrer,
etc.) forment des phrases laide dun cadre de distribution syntaxique des actants qui comporte
trois groupes nominaux directs, l o en franais seuls le sujet et lobjet sont des groupes directs
(le complment dattribution tant introduit par la prposition ). Ceci impose un ordre strict,
en loccurrence S V A O, pour dterminer les actants. Ainsi, en franais les phrases (1a) et (1b)
sont toutes deux recevables, alors quen crole seule la phrase (2b) est recevable.
(1a) Pierre a donn un beau livre Robert
(1b) Pierre a donn Robert un beau livre
(2a) *Py ba an bel liv Wob
(2b) Py ba Wob an bel liv
La flexion verbale est ici remplace par un systme dexpression des variations daspect et de
temps qui est purement analytique, comme celui que lon observe en chinois. Les diffrents
degrs sont exprims par des particules temporelles ou aspectuelles qui sont prposes au verbe
(contrairement au chinois, o elles sont postposes).
Le nombre de marques possibles du temps et de laspect est limit ; la gamme demplois de
chacune de ces marques est donc vaste. Cet tat de choses fait de leur description smasiologique une tche considrable, et il est difficile de caractriser le systme de manire simple. Un
panorama complet de cette question, ainsi quune description plus particulire des diffrences
entre crole guyanais et martiniquais, est prsent par (Pfnder, 2000).
Plusieurs descriptions systmiques ont t proposes ; nous retiendrons pour ltat actuel de
notre modlisation celle de Damoiseau (1984, p. 26). Si lon peut questionner la pertinence de
la frontire stricte quil trace entre marques temporelles et marques aspectuelles, notamment
au sujet de la classification de k comme marque strictement aspectuelle, son systme prsente
lavantage de recouper en assez grande partie la combinatoire syntagmatique de ces marques :
TEMPS

ASPECT

perfectif
(pas dindication)
pass

imperfectif
imperfectif
(duratif, gnral, itratif) (prospectif)
ka
k
t ka
t k

Pascal Vaillant
Les combinaisons , ka, k, t, t ka et t k sont en effet les plus frquemment attestes1 .
Pour donner une ide des valeurs de ces combinaisons de marques, on peut mentionner certaines
de leurs traductions les plus frquentes en franais : mwen dmi : jai dormi ; mwen ka dmi :
je dors ; mwen k dmi : je vais dormir ; mwen t dmi : javais dormi ; mwen t ka dmi :
je dormais ; mwen t k dmi : jaurais dormi. Il faut cependant bien entendu garder lesprit
quil ne sagit pas dquivalences systmatiques, puisque les systmes aspecto-temporels ne se
recoupent pas, et que la notion de mode est trangre au crole.
En premire approche, on peut schmatiser les domaines dapplication des systmes aspectuel
et temporel en disant que la caractrisation de laspect (, ka ou k ) ne porte que sur des verbes
exprimant un procs, alors que la caractrisation du temps ( ou t ) sapplique aussi bien aux
procs quaux tats. On a donc deux sries de verbes, celle qui peut suivre les marques , ka, k,
t, t ka et t k, et celle qui ne peut suivre que ou t. Cest en ces deux sries de verbes, par
exemple, que (Saint-Quentin, 1989), lune des premires grammaires croles, voulait distinguer
deux conjugaisons du crole guyanais.
Selon cette description, les phrases (3a) et (3b) sont donc possibles et leur diffrence traduit une
nuance daspect, alors que seule la phrase (4a) est recevable.
(3a) I dmi tout lajounen (il a dormi toute la journe)
(3b) I ka dmi tout lajounen (il passe ses journes dormir)
(4a) I ni anpil lajan (il a beaucoup dargent)
(4b) *I ka ni anpil lajan
Cette description est en ralit une simplification, puisquil existe bel et bien des contextes
dans lesquels lapplication de marques aspectuelles des verbes signifi non-processif
(Damoiseau, 1984) est atteste : ravt pa ka ni rzon douvan poul (le ravet na jamais raison
devant la poule) ; ou mme : l i ka sti kazino i ka ni anpil lajan : chaque fois quil sort du
casino, il a plein dargent. Nous nous en tiendrons cependant la premire approche dans le
cadre de ces premires tentatives de modlisation.
Groupes nominaux
Les groupes nominaux du crole ont un systme de degrs de dtermination qui comprend un
degr gnrique, exprim par (ainsi ravt et poul dans lexemple ci-dessus), un degr indtermin (an timanmay : un enfant), un degr dfini exprim par un dterminant postpos
(timanmay-la : lenfant), et un degr dmonstratif galement exprim par un dterminant postpos (timanmay-tala : cet enfant). Les dterminants postposs, en martiniquais, peuvent se combiner avec une marque prpose s- pour former un pluriel dfini (s-timanmay-tala : ces enfants) le pluriel gnrique du franais nayant pas dquivalent : on utilise le degr gnrique
du singulier.
Il nexiste pas de genre grammatical ; en revanche les noms dterminent une variation dans le
choix de larticle dfini, selon un principe dharmonie consonantique et nasale : les mots se
terminant par une voyelle ouverte prennent la marque -a comme dterminant dfini, les mots se
1

Les choses sont plus complexes en ralit, puisque la combinaison k ka est galement atteste avec une valeur
de futur duratif cf. (Pinalie & Bernab, 1999, p. 77) : l ou k riv, nou k ka dmi : quand vous arriverez, nous
serons en train de dormir. La combinaison t k ka est mme possible (comme dans la chanson de zouk : Kol
sr nou t k ka dans nous serions en train de danser lun contre lautre). Valdman (1978, p. 219) expose
un systme plus complet fond sur deux catgories daspect (continuatif, prospectif), et une catgorie de temps
(pass).

Une grammaire formelle du crole martiniquais


terminant par une consonne ou par une semi-voyelle (y ou w ) prennent la marque -la. Ceci ne
sapplique quaux mots dont la dernire syllabe est non-nasalise ; Pour les mots terminaison
nasale, les marques du dfini sont respectivement -an et -lan.
Parties du discours
Lun des faits les plus frappants du crole, enfin, est labsence de frontires nettes de catgories
grammaticale. La tentation de rapprocher les mots dorigine franaise de leurs tymons et de
leur attribuer la mme catgorie (nom, verbe, adjectif ...) est souvent grande, et elle a mme assez frquemment une certaine pertinence, mais cette analogie est trompeuse. Dans beaucoup de
cas en effet, si un mot peut tre utilis dans le mme emploi grammatical que son tymon franais, il possde galement dautres emplois, propres des catgories syntaxiques diffrentes.
Les adjectifs, par exemple, ont en franais besoin dun verbe copule pour figurer en fonction
dattribut : le gros arbre vs. larbre est gros. En crole, ladjectif seul peut jouer le rle de prdicat : gwo pybwa-a vs. pybwa-a gwo (cf. chinois d shm vs. shm d ). Ladjectif dans
cette position de prdicat-attribut peut galement recevoir les marques temporelles de la mme
manire que les verbes dtat : pybwa-tala t gwo : cet arbre tait gros ; voire des marques
aspectuelles dans certains contextes, comme les verbes dtat galement (exemple cit par Damoiseau (1984, p. 29) : i ka las vit : il se fatigue vite). Il est en fait trs difficile de fournir une
dfinition permettant de distinguer le verbe en tant que catgorie distincte de ladjectif autrement que par des critres ngatifs (blocage de la fonction pithte).
Au-del du cas des verbo-adjectivaux, des noms peuvent apparatre en position de prdicat (i
yich mwen : cest mon enfant), et des verbes en fonction nominale (mwen dmi an bel dmi :
jai sacrment dormi [litt. jai dormi un grand dormir] ; vin pran an bw : viens prendre un verre
[litt. viens prendre un boire]) ; et ces tournures sont loin dtre des exceptions ou des figures de
style, mais font partie du fonctionnement le plus banal de la langue. Certains verbes, en outre,
occupent des fonctions de prposition. Ainsi, le verbe ba (donner), qui construit gnralement
des phrases avec trois actants (i ba mwen an pen : il ma donn un pain), peut, accompagn du
seul actant destinataire, construire un syntagme qui joue le rle de circonstant pour les verbes
nayant pas le destinataire dans leur cadre valenciel de base. Ainsi dans i pt an bouty wonm
ba mwen : il ma apport une bouteille de rhum, ou mwen ka pal baw : je suis en train de
te parler (cf. chinois ta gei wo yi png jiu : il me donne une bouteille dalcool, vs. ta dili le
yi png jiu gei wo, il ma apport une bouteille dalcool). Certains verbes enfin peuvent tre
employs comme particules aspectuelles, enrichissant le systme fond sur {, ka, k et t} ;
ainsi sti (sortir) ou fini (finir) dans des tournures comme : es ou kompwann sa yo sti diw
la ? : est-ce que tu comprends ce quils viennent de te dire ? (Bernab, 1983, p. 1057), ou pwan
(prendre) dans : i pwan kouri : il sest mis courir (Bernab, 1983, p. 1043).

3 Modlisation
On pourrait donner encore dinnombrables exemples de cette plasticit grammaticale ; la leon
quil convient den tirer dans le cadre de ce travail (modlisation informatique), est quil faut
dvelopper un mcanisme pour la prendre en compte, car elle est tout sauf marginale.
Il serait peu pratique de multiplier les catgories grammaticales ad hoc en faisant un produit cartsien sur les catgories de la grammaire franaise pour obtenir des parties du discours sur-spcialises (adjectif-verbe-qui-ne-peut-jamais-tre-un-nom, ou nom-pouvant-servir-

Pascal Vaillant
parfois-de-verbe-dtat ...). Il nous parat galement quil serait assez artificiel de prvoir un
grand nombre de rgles de conversion ; il semble en dfinitive que la catgorie grammaticale
soit une notion moins essentielle en crole martiniquais quen franais, ou autrement dit car
il faut bien tout de mme des fonctions dans lnonc quelle soit plus quailleurs contextualisable. Le fait quun mot ait la possibilit de remplir une fonction de sujet (comme un groupe
nominal), dpithte (comme un adjectif), de prdicat (comme un verbe) ... semble pouvoir tre
dtermin de manire affrente aussi bien quinhrente, pour reprendre ici le vocabulaire de
Rastier (1987). Un mot peut avoir un emploi central de verbe, mais, plac dans un contexte de
groupe nominal (avec un article, par exemple), pouvoir tre interprt sans difficult comme
un nom. De mme, un nom, plac directement aprs le sujet, et ventuellement temporalis
par une particule comme t, peut jouer le rle dun verbe si son sens sy prte. Ces rflexions
sont dailleurs probablement valides en principe pour toutes les langues2 , quoiqu des degrs
variables.
Il a donc t choisi de ne retenir que deux grandes catgories grammaticales (N et Pred : nom et
prdicat), lesquelles peuvent tre dtermines plus spcifiquement par des ensembles de traits
caractrisant leurs emplois possibles :
Pred possde les attributs <type>=T, <cadre>=C, <epithete>. Le type T classe le
mot soit parmi les verbes exprimant un procs (dmi : dormir, manj : manger, ba : donner,
pt : porter, etc.), soit parmi les verbes ou les verbo-adjectivaux exprimant un tat (ni : avoir,
sav : savoir, gwo : gros/tre gros, las : fatigu/tre fatigu, etc.). Le cadre C correspond au
cadre dattribution de positions syntaxiques aux actants du verbe (sous-catgorisation verbale) :
intransitif pour dmi ou las, transitif pour manj, attributif pour ba, etc. Le trait pithte,
valeur binaire, dtermine si le mot peut oui ou non apparatre en position pithte, comme un
adjectif : il est positif pour gwo et ngatif pour manj, par exemple.
N possde lattribut <harm>=A, qui dtermine le type de marque de dtermination dfinie qui
doit apparatre selon la syllabe finale (A peut valoir a, la, an ou lan ). Les noms propres et les
pronoms personnels possdent galement le trait <det>=def, qui exprime le fait quils sont
dj dfinis (et ne se combinent donc plus avec un dterminant) le trait <det> napparaissant dans les autres cas quau niveau de barre 2, cest--dire au niveau du groupe nominal. Le
fait quun N puisse oui ou non apparatre galement en fonction verbale est dtermin par la prsence, ct de ces traits spcifiquement nominaux, du trait <cadre>=C signalant lexistence
dune valence interne.
Cette conception des catgories comme faisceaux de traits voque celle qui guide le formalisme
des grammaires syntagmatiques gnralises (GPSG) (Abeill, 1993, p. 101105). Nous avons
toutefois prfr utiliser pour ce travail le formalisme des grammaires darbres adjoints unification de structures de traits (FS-TAG) (Vijay-Shanker & Joshi, 1988), (Abeill, 1993, ch. 4),
qui se prte tout fait bien la gnration (bien quil ait dabord t conu pour lanalyse) grce
sa capacit reprsenter les tours de phrase sous la forme darbres lmentaires stendant sur
plus dun seul niveau. Lutilisation de modles darbres adjoints pour la gnration a t pour
cette raison adopte dans diffrents travaux de recherche, dautant quelle a pu tre tendue
au-del du niveau de la phrase, comme dans le modle G-TAG (Danlos, 1998).
Nous navons en revanche pas, pour cette application de gnration, une grammaire TAG entirement lexicalise ; les arbres sans ancre lexicale nous permettent en effet de donner une
2

Ainsi, un nonc comme je mre-poule mes enfants est tout fait comprhensible sinon recevable en
franais (exemple emprunt Jacques Coursil).

Une grammaire formelle du crole martiniquais


description formelle homogne des structures parallles, dont les unes sexpriment avec une
marque lexicale et les autres avec une marque zro (ex. imperfectif en ka vs. perfectif en ). En
outre, les arbres sans ancre lexicale permettent (a) de faire lconomie de quelques kilo-octets
de fichier, et de nombreuses oprations de copie-colle, en regroupant sous un mme arbre
schma toutes les structures verbales ayant le mme cadre de sous-catgorisation ; (b) de
rendre compte des phnomnes linguistiques de degr de complexit suprieur la phrase nuclaire (comme les subordonnes relatives) (Abeill, 1993, p. 230).
Construction du GN
Le N non encore dfini, mais qui peut avoir dj reu des complments (en termes de thorie de
se substitue la position adquate dans larbre lmentaire du dterminant pour
X-barre, le N),
former le GN (niveau de barre 2). Le cas du dterminant indfini est illustr fig. 1a (la valeur du
trait harm, A, est une variable), et un exemple de dterminant dfini est illustr fig. 1b3 .

gn
det

gn

<det> = ind

n
<harm> = A
<det> =

an

<det> = def

<harm> = la
<det> =

det
la

gn <det> = gen

gn <det> = Degr

<det> =

<det> = Degr

F IG . 1 Arbres lmentaires : (a) du dterminant indfini ; (b) dun dterminant dfini ; (c) du
degr de dtermination gnrique ; (d) du nom dj dfini.
Cette modlisation place le dterminant dfini postpos aprs les ventuels complments, comme
les complments de nom, ou les subordonnes relatives. Ceci est conforme avec lusage du
crole martiniquais, qui dit : kay-la (la maison) ; kay papa mwen an (la maison de mon pre) ;
kay mwen ja pal baw la (la maison dont je tai parl).
Le GN dtermin au degr gnrique se construit partir du nom non encore dtermin grce
larbre reprsent en fig. 1c ; tandis que le GN peut galement se constituer directement sur la
base dun N pr-dtermin au niveau lexical, comme un pronom personnel ou un nom propre,
comme illustr fig. 1d.
Construction du GPred
Le prdicat connat trois niveaux dexpansion, conformment au choix que nous avons fait de
nous conformer au modle simplifi du temps et de laspect prsent par Damoiseau (1984) (cf.
plus haut).
Au niveau lexical, le Pred nest marqu ni en temps ni en aspect. Au niveau 1, il est marqu en
aspect : soit avec une valeur daspect zro, dans le cas o il sagit dun tat ; soit avec une valeur
daspect perfectif, imperfectif ou prospectif, sil sagit dun procs. Les arbres correspondant
laspect zro (pour un tat), et laspect perfectif (pour un procs), sont montrs respectivement
en fig. 2a et fig. 2b. Les aspects imperfectif et prospectif sont forms laide des marques ka et
k. Larbre correspondant au cas de laspect imperfectif est montr en fig. 2c. Laspect prospectif
se construit de la mme manire.
3

N.B. Dans ces figures, comme dans les suivantes, conformment la tradition hrite du langage Prolog et du
formalisme des grammaires clauses dfinies (DCG), les termes commenant par une majuscule correspondent
des variables, alors que les termes commenant par des minuscules correspondent des valeurs instancies.

Pascal Vaillant
pred

pred

<asp> = zero
<cadre> = Cadre

pred

<asp> = perf
<cadre> = Cadre

ma
<type> = etat
<cadre> = Cadre
<asp> =

pred

pred

<asp> = imperf
<cadre> = Cadre

<type> = proc
<cadre> = Cadre
<asp> =

pred
<type> = proc
<cadre> = Cadre
<asp> =

ka

F IG . 2 Arbres de construction du prdicat : (a) aspect zro ; (b) aspect perfectif ; (c) aspect
imperfectif.

Au niveau 2, le prdicat est marqu en temps, soit avec la marque zro (), soit avec la marque
du pass (t ) ; les mcanismes utiliss correspondent respectivement, un niveau dexpansion
au-dessus, ceux utiliss pour marquer respectivement laspect perfectif ou laspect imperfec qui
tif sur les prdicats-procs. La marque de temps sapplique un terme de niveau 1 (Pred)
peut donc tre soit un tat (automatiquement laspect zro), soit un procs (dj marqu en
au praspect). Dans larbre lmentaire servant passer du prdicat marqu en aspect (Pred)

dicat marqu en temps et en aspect (Pred), le nud infrieur (nud de substitution) doit donc
spcifier la prsence du trait aspect et labsence du trait temps, puis reporter le trait aspect au
niveau suprieur, et y ajouter le trait temps le nud suprieur comportant donc en tout les
traits temps, aspect et cadre.
est entour
Enfin, au niveau suprieur, GPred, le prdicat marqu en temps et en aspect (Pred)
de ses actants, dans la disposition spcifique du cadre de sous-catgorisation concern. Le trait
cadre est supprim, et un trait satur est ajout. La phrase nuclaire (Ph) est constitue dun
sujet et dun GPred satur.
Les diffrents cadres de sous-catgorisation sont reprsents par des arbres-schma (fig. 3), qui
engendrent des familles darbre lorsque lon y greffe les arbres des diffrents prdicats marqus
en temps et en aspect.

ph
gn

<asp> = Aspect
<tem> = Temps
<sature> = +

gpred

[sujet]
<asp> = Aspect
<tem> = Temps
<cadre> = intrans

ph
gn

gpred

<asp> = Aspect
<tem> = Temps
<sature> = +

[sujet]
pred
[prdicat]

pred
[prdicat]

<asp> = Aspect
<tem> = Temps
<cadre> = attrib

gn

gn

[destinataire]

[objet]

F IG . 3 Arbres schma : (a) des verbes intransitifs ; (b) des verbes attributifs.
Les circonstants, cest--dire les rles smantiques qui nont pas pu tre exprims par les actants
du cadre valenciel de base du verbe, sont exprims par ladjonction de syntagmes prpositionnels. Comme dans le cas dj voqu des complments dattribution introduits par ba, le rle
des prpositions peut parfois tre jou par des verbes accompagns dun jeu restreint dactants. Ces types de syntagmes sont modliss comme des GPred, la diffrence que le verbe
y est utilis avec un autre cadre de sous-catgorisation ; le cas est donc trait comme une alter-

Une grammaire formelle du crole martiniquais


nance verbale. Ainsi, le verbe ba possde, ct de son cadre complet (attributif), un cadre
restreint (prep_datif) qui est utilis pour former les arbres auxiliaires pour ladjonction de
complments dattribution, grce larbre-schma reprsent fig. 4. Un trait satur, contraignant ladjonction sur le nud pied de ce type darbres, garantit que les circonstants ne peuvent
commencer sadjoindre au GPrep quaprs tous les actants (sujet except).
gpred
<cadre> = prep_datif
<sature> = +

gpred *

gpred

<sature> = +

pred
<cadre> = prep_datif

gn
[destinataire]

ba

F IG . 4 Arbre auxiliaire pour exprimer les complments dattribution.

4 Mcanisme de gnration
Le programme ralis implante informatiquement les arbres dcrits par des structures PROLOG.
Toutes les oprations lmentaires sur les structures de traits (unification, crasement) ont t
galement implantes sous la forme de buts PROLOG, ainsi que les oprations sur les arbres
spcifiques au modle TAG (substitution et adjonction).
La structure de dpart du processus de gnration est un graphe conceptuel contenant des nuds
lis entre eux par des rles smantiques. Les nuds peuvent porter des attributs smantiques qui
servent en prciser la valeur (temps, aspect, degr de dtermination ...) Le programme effectue la gnration en parcourant le graphe conceptuel en un parcours direct (arbre de couverture
du graphe), et en engendrant, pour chaque prdicat, un arbre correspondant la verbalisation
de ce prdicat et de ses actants fondamentaux sous la forme dune phrase nuclaire. Les rles
smantiques non-verbaliss dans la phrase nuclaire sont ensuite gnrs sous forme darbres
auxiliaires tte GPred, et adjoints la phrase nuclaire. Enfin, les relations smantiques incidentes lun des concepts de larbre de couverture direct, mais non encore exprimes dans la
phrase principale, sont soit adjointes lorsque cest possible par un procd syntaxique commun
(pithte, subordonne relative), soit gnres dans de nouvelles phrases juxtaposes celles
dj engendres. Ce mcanisme a t expos plus en dtail dans (Vaillant, 1997; Vaillant, 1998),
et reste fondamentalement le mme, indpendamment de la langue laquelle il est appliqu.

5 Conclusion
Dans ce travail, une grammaire adjonction darbres a t utilise pour passer dune structure
smantique limite au niveau phrastique une lexicalisation en langue crole. Nous navons
pas eu lambition en revanche dessayer de partir dune structure smantique interlangue ou
indpendante de la langue . Le systme des paramtres smantiques utiliss pour le temps et
laspect, par exemple, est ni plus ni moins celui de la langue crole martiniquaise (ou tout ou

Pascal Vaillant
moins du sous-ensemble que nous prtendons en modliser). La question de lexistence dune
tape encore antrieure la reprsentation lie la structure smantique de la langue-cible nest
pas aborde dans le cadre de cette tude, qui se borne raliser la gnration de la chane
syntagmatique partir dun modle du sens dans la mme langue, reprsent sous forme de
graphe. Tout au plus peut-on noter que le mme systme peut servir, quelques modifications de
la grammaire prs, pour des dialectes proches, qui ont peu prs le mme systme smantique
(ainsi le guadeloupen, ou le guyanais de la cte).
La question de ltape antrieure se pose en ralit dans deux contextes : soit dans les tentatives
de modlisation des processus cognitifs fondamentaux, qui postulent lexistence dune hypothtique reprsentation smantique profonde, ou universelle ; soit dans les applications de transfert
dun systme smiotique un autre, donc de gnration de phrases croles, par exemple,
partir dune entre qui pourrait aussi bien tre formule en franais, en allemand, en chinois,
ou en idogrammes Bliss. Nous viendrons lavenir nous pencher sur le second problme,
qui pourra tre le noyau dun futur systme daide lapprentissage, destin par exemple des
apprenants nayant pas le crole pour langue maternelle. Quant au premier problme, il nous
semble hors de notre porte. On pourra se consoler en voquant lhypothse du croliste inniste Bickerton (1981), selon lequel ressurgissent dans les langues croles les structures innes
du langage faisant partie du bioprogramme de lhumanit. Selon cette hypothse, donc, sil
existe une quelconque structure smantique universelle, cest prcisment celle que nous avons
sous la main avec le crole ...

Rfrences
A BEILL A. (1993). Les nouvelles syntaxes. Paris: Armand Colin.
A LLEYNE M. (1996). Syntaxe historique crole. Hommes et socits. Paris: Karthala.
B ERNAB J. (1983). Fondal-natal. Paris: LHarmattan. 3 vols.
B ICKERTON D. (1981). Roots of language. Ann Arbor (.-U.-A.): Karoma.
C HAUDENSON R. (1995). Les Croles. Que sais-je ? Paris: PUF.
DAMOISEAU R. (1984). lments de grammaire du crole martiniquais. Fort-de-France: Hatier Antilles.
DANLOS L. (1998). G-TAG : un formalisme lexicalis pour la gnration de textes inspir de TAG.
Traitement Automatique des Langues T.A.L., 39(2), 432.
P FNDER S. (2000). Aspekt und Tempus im Frankokreol. ScriptOralia. Tbingen: Gunter Narr.
P INALIE P. & B ERNAB J. (1999). Grammaire du crole martiniquais. Paris: LHarmattan.
R ASTIER F. (1987). Smantique Interprtative. Formes Smiotiques. Paris: PUF.
S AINT-Q UENTIN A. D . (1989). tude sur la grammaire crole. In Introduction lhistoire de Cayenne,
suivie dun recueil de contes, fables et chansons en crole, Cayenne: Comit de la Culture, de lducation
et de lEnvironnement de Guyane. Premire dition 1872.
VAILLANT P. (1997). Interaction entre modalits smiotiques. De licne la langue. Orsay: Universit
Paris-Sud. Thse de doctorat.
VAILLANT P. (1998). Interpretation of iconic utterances based on contents representation: Semantic
analysis in the PVI system. Natural Language Engineering, 4(1), 1740.
VALDMAN A. (1978). Le crole : structure, statut et origine. Paris: Klincksieck.
V IJAY-S HANKER K. & J OSHI A. (1988). Feature-structure based Tree Adjoining Grammars. In Proceedings of the 12th International Conference on Computational Linguistics (COLING 1988), p. 714719,
Budapest (Hongrie).

Vous aimerez peut-être aussi