Vous êtes sur la page 1sur 18

2010, paratre dans les Actes des Huitimes journes scientifiques du rseau Lexicologie, terminologie, traduction, 15-17 octobre

e 2009, Lisbonne.

Le Dico-FRAR : base de donnes lexicographiques bilingue franais-arabe


Samia Bouchaddakh
Centre danalyse et de traitement informatique du franais qubcois (Catifq), Universit de Sherbrooke Observatoire de linguistique Sens-Texte (OLST), Universit de Montral samia.bouchaddakh@usherbrooke.ca

Rsum
Cet article prsente le Dico-FRAR, une base de donnes lexicographiques bilingue franais-arabe. Cette base de donnes a t conue en vue de proposer lusager francophone qui dsire encoder en arabe, non seulement la traduction des units franaises, mais galement une description globale des units lexicales dans les deux langues mises en parallle. Les quivalents fournis, qui sont le rsultat de cette mise en parallle, sont dcrits de manire systmatique sous leurs diffrentes facettes : smantique, syntaxique et lexico-combinatoire. La finalit de la base DicoFRAR est multiple et offre, sur les plans de son contenu informationnel et de sa conception, un intrt pour lusager apprenant de la langue arabe, pour le traducteur et pour le lexicographe. Cet article comprend trois sections principales : problmatique gnrale de notre travail et mise en contexte, description de la base Dico-FRAR et exemple de traitement lexicographique bilingue tel quil est propos dans cette base.

Mots-cls
Base de donnes relationnelle; lexicographie bilingue; lexicologie explicative et combinatoire; traduction; divergences interlinguistiques; encodage

1. Introduction : problmatique et contexte


Le traitement des vocables propos dans les dictionnaires bilingues franais-arabe nest pas toujours satisfaisant, notamment pour les usagers francophones qui consultent ces ouvrages en vue de produire un texte dans la langue cible quils ne matrisent pas encore parfaitement. En effet, dans une perspective dencodage, les usagers recourent ces dictionnaires bilingues dits de thme pour connatre certes lquivalent traductif arabe une unit lexicale franaise, mais galement toutes les informations smantiques, syntaxiques ainsi que la combinatoire lexicale qui lui sont rattaches, afin de pouvoir

lemployer correctement dans la langue cible. Ces usagers ont aussi besoin davoir plus de donnes sur les divergences lexicales, smantiques, stylistiques, etc. qui existent entre les deux langues mises en prsence, afin de prvenir les ventuelles erreurs et de russir efficacement leurs tches dencodage et de traduction. Cependant, les nombreuses lacunes et faiblesses dont souffrent les dictionnaires bilingues franais-arabe reprsentent un handicap pour la russite de telles tches. Parmi ces faiblesses, citons la multiplicit des quivalents proposs, le manque de prcision dans les donnes smantiques et syntaxiques consignes, la non-identification des collocations, labsence dinformations sur les divergences interlinguistiques qui existent entre les deux langues, le manque de structure dans linformation contenue dans les articles, etc. Linsatisfaction des usagers de ces dictionnaires est fortement ressentie du fait que la langue arabe, trs diffrente du franais, leur est difficilement accessible. En effet, en cas dabsence ou manque dinformations, lusager ne peut facilement aller chercher un complment dinformation dans un dictionnaire unilingue. La consultation dun dictionnaire arabe nest pas une tche facile pour un locuteur non arabophone. Les entres sont trs souvent structures selon la racine et non la forme du lexme. Tous les lexmes, except quelques units grammaticales, sont ramens une racine gnralement trilitre reprsentant un contenu smantique commun. Les lexmes drivs partir de cette racine, dont la forme est purement consonantique, sont inclus au sein de cet article de dictionnaire1. Cette tradition lexicographique arabe, qui pose la drivation comme principe dorganisation des entres dans le dictionnaire, suppose un savoir pralable et pose problme pour les locuteurs non arabophones. Par ailleurs, lon assiste depuis plusieurs annes au dveloppement dune varit de base de donnes lexicales dans diffrentes langues, ce qui a permis de raliser des avances notables dans le domaine lexicographique unilingue (par exemple, WordNet [Fellbaum 1998], FrameNet [Baker et al. 1998, Fillmore et al. 2001], DiCo [Polgure 2000, 2003], Dafles [Selva et al. 2002, Verlinde et al. 2005]). En revanche, en lexicographie bilingue, cest au cours de la dernire dcennie que des travaux intressants ont commenc se multiplier (par exemple, Fontenelle 1997, Alonso Ramos 2001). Toutefois, la majorit de ces travaux sont concentrs, notamment, sur le traitement des langues indo-europennes, comme langlais et le franais. Dans la paire de langues franais-arabe, en particulier, il nexiste pas encore, notre connaissance, de ressource lexicographique satisfaisante susceptible dtre mise la disposition des traducteurs et des apprenants de larabe langue trangre. Dans ce contexte, nous avons examin les problmes qui se posent dans les dictionnaires bilingues franais-arabe et dvelopp une base de donnes lexicales visant amliorer les descriptions quon y trouve, particulirement dans ceux dits de thme ou

Nous pouvons citer pour illustration, lexemple canonique de la racine KTB qui donne par drivation le verbe [kataba] crire, [kitb] livre, [kuttb] cole islamique, [ktib] crivain, [maktb] crit ou lettre, etc. Toutes ces units sont dcrites sous lentre KTB

dencodage [Bouchaddakh 2009, en prparation]. Cette base de donnes (BD), que nous proposons de prsenter dans les pages qui suivent, est baptise Dico-FRAR . Notre expos est organis de la faon suivante. Nous prsentons dabord les proprits gnrales de notre BD (section 2.1). Ensuite, nous dfinissons le contenu informationnel que renferment nos articles de dictionnaire bilingues (section 2.2), avant dintroduire, dans ses grandes lignes, la structure gnrale de la BD ralise et de montrer son intrt, aussi bien pour lusager que pour le lexicographe (section 2.3). Finalement, dans la troisime et dernire section, nous donnons un exemple darticle bilingue franais-arabe, ce qui permet dillustrer, par le fait mme, le traitement que nous prconisons dans une base de donnes lexicographiques bilingue.

2. Dico-FRAR
2.1 Caractristiques gnrales La base de donnes lexicographiques Dico-FRAR repose sur les principes de la lexicologie explicative et combinatoire (LEC) [Meluk et al. 1995] dont le modle lexicographique permet de combler, plus dun gard, les lacunes et les faiblesses des dictionnaires bilingues traditionnels. Conue principalement pour lapprenant francophone de la langue arabe qui est de niveau intermdiaire ou avanc, ainsi que pour le traducteur et pour tous ceux qui sintressent la production dnoncs en arabe, la base Dico-FRAR est compose des trois parties suivantes. La premire est rserve la description unilingue des units franaises, la deuxime prend en charge la description des units lexicales arabes et la troisime a pour objet la mise en relation de ces units franaises et arabes dans une optique dencodage. Lunit de description dans cette base est la lexie2. Une fois que les diffrentes acceptions du vocable ont t distingues et ordonnes, chaque lexie est dcrite sur les plans smantique, syntaxique et lexico-combinatoire avec une illustration de son emploi dans diffrents exemples. Pour les units arabes, les articles de dictionnaire sont labors dans un mtalangage franais, ce qui rend laccs linformation plus aise pour un usager francophone et facilite aussi la mise en correspondance des deux langues (le franais et larabe), ainsi que la slection des meilleurs quivalents. Dans Bouchaddakh [2008], nous avons montr que la structuration explicite des dfinitions rdiges dans un mme mtalangage, selon les principes de la LEC, permettait de slectionner adquatement les quivalents proposer dans un dictionnaire bilingue. Larticle bilingue, qui rsulte de cette mise en correspondance, fournit lusager toutes les informations qui lui sont ncessaires dans sa tche dencodage ou de traduction. Il propose ainsi ce dernier des quivalents plus appropris, souligne les divergences interlinguistiques (smantiques, stylistiques, syntaxiques, etc.) entre deux lexies dites quivalentes et, enfin, prsente des solutions
2

Dans la terminologie de la LEC, une lexie est soit un lexme soit une locution associ(e) un sens donn. Un regroupement de lexies qui ont le mme signifiant et un lien smantique vident est appel un vocable.

en cas dabsence dquivalent et des mises en garde contre les ventuelles erreurs dencodage. Cela tant, passons maintenant la prsentation du contenu informationnel dun tel article bilingue. 2.2 Contenu informationnel de larticle bilingue Afin doffrir un traitement lexicographique rigoureux, larticle bilingue, qui est ainsi la synthse de la mise en parallle des descriptions des units lexicales franaises et arabes, doit renfermer un certain nombre dinformations que nous dfinissons comme suit. 2.2.1 Informations lies lidentification de la lexie-vedette - Lentre lexicale qui est le nom du vocable franais. - Le numro du vocable franais pour distinguer les homonymes sil y a lieu. - La partie du discours (dsormais PDD) du vocable franais. - Le numro dacception de la lexie traduire. Ce numro est identique celui qui a t propos dans larticle unilingue franais de la mme lexie. Par souci duniformit, nous gardons dans larticle bilingue le mme dgroupement des sens des vocables que celui propos dans nos articles unilingues. La consultation des diffrents articles nen sera que facilite pour lusager. - La forme propositionnelle (ou structure actantielle) de la lexie franaise qui permet dexpliciter le nombre de ses actants. Par exemple, pour la lexie chtierI (cf. section 3), la forme propositionnelle est X chtie Y pour Z par W. On pourrait galement caractriser (ou typer dans la terminologie de la LEC) les diffrentes variables X, Y, etc. dans la forme propositionnelle, ce qui nous donnerait quelque chose comme : lindividu X chtie lindividu Y pour lacte Z par le mal W. 2.2.2 Informations lies lidentification de lquivalent principal propos - Lquivalent traductif arabe qui est, bien entendu, une lexie et non un vocable. - La racine de lunit arabe, sil y a lieu. La notion de racine revt, en effet, une importance particulire dans lapprentissage de la langue arabe. - Un nota bene pour prciser la nature de lquivalent fourni (comme le montre larticle propos dans la section 3) ou pour renvoyer lusager une variante ou un autre quivalent possible, selon le contexte. Cest galement dans cette section quon attire lattention de lusager sur la forme du fminin ou du pluriel non rgulire pour les noms et les adjectifs. - La PDD de lquivalent. Gnralement cette PDD correspond celle de la lexie franaise, mais comme il ny a pas toujours une quivalence parfaite entre les PDD franaises et arabes, lquivalent peut parfois appartenir une PDD diffrente ou particulire la langue arabe. - La forme propositionnelle de la lexie arabe. 2.2.3 Informations smantiques Les informations dordre smantique sont dune grande utilit pour lusager, dautant plus que la majorit des quivalents traductifs proposs sont des quasiquivalents ou des quivalents partiels. Ces informations seront classes dans deux

sections spares. La premire reprend la dfinition de la lexie telle quelle apparat dans larticle unilingue arabe. La deuxime porte sur la ou les divergences smantiques entre les deux lexies franaise et arabe utiles pour que lusager prenne rellement conscience du sens vhicul par tel ou tel quivalent et puisse dcider, avec discernement, de sa pertinence ou non dans un contexte donn. 2.2.4 Informations lies la combinatoire syntaxique - Une description du rgime syntaxique de lquivalent. - Une mise en garde contre les ventuelles erreurs dues aux divergences, dans le comportement syntaxique, entre la lexie franaise et son quivalent arabe. Par exemple, les alternances syntaxiques peuvent tre diffrentes dune langue une autre. Cest le cas de chtierI et de son quivalent arabe (cf. section 3). 2.2.5 Informations lies la combinatoire lexicale Ces informations sont de deux types : - Le premier type concerne les lexies relies lquivalent par des liens paradigmatiques. Ces liens relvent de la drivation smantique comme les synonymes, les converses, les antonymes, ainsi que les diffrents noms actanciels typiques de la lexie, la contrepartie verbale dune lexie nominale ou, au contraire, la contrepartie nominale dun verbe ou dun adjectif, etc. - Le deuxime type porte sur les lexies relies lquivalent par des liens syntagmatiques. Il est ici question, bien entendu, des collocations (expressions semi-figes bipartites composes de deux lments : la base (la lexie-vedette) et le collocatif [Haussman 1979, Meluk 1996]). Contrairement au premier type dinformations lexicales, il ne sagit pas, dans ce cas-ci, de rpertorier simplement les lexies qui sont en lien syntagmatique privilgi avec la lexie arabe (les collocatifs), mais galement de prciser leur sens et leur emploi, et de proposer des quivalents traductifs aux collocations franaises, le tout illustr dexemples traduits en franais. Dans lapproche de la LEC, la modlisation de ces deux types de relations est ralise au moyen des Fonctions Lexicales (FL). Faute despace, nous ne nous attarderons pas, ici, la description du mcanisme qui les sous-tend; celui-ci est, notre avis, suffisamment connu (Meluk 1996, Meluk et al. 1995 et Meluk et Polgure 2007). Disons simplement que les FL spcifient lensemble des possibilits de combinatoire paradigmatiques (les drivations smantiques) et syntagmatiques (les collocations ou les cooccurrences lexicales restreintes) dune unit lexicale donne. Par exemple, pour remercier, la FL S0, qui renvoie la nominalisation du verbe, a comme valeur remerciement et la FL Magn, qui dnote lintensification, a comme valeur normment et infiniment. Notons que, dans nos articles de dictionnaire, les FL qui sont juges difficiles saisir pour un usager non familier avec ce type dencodage, sont vulgarises par des formules qui en explicitent le sens. Par exemple, la FL Magn est explicite par De faon svre dans notre description de la lexie chtierI (section 3).

2.2.6 Illustration par des exemples Les exemples, dans larticle bilingue, sont deux sortes : - Des exemples illustrant lemploi des quivalents proposs dans la langue cible. Ceux-ci sont traduits en franais, souvent littralement, pour mieux aider lusager saisir lemploi des units arabes. - Un ou deux exemples de traduction avec lquivalent propos. Contrairement aux premiers, il sagit ici dexemples franais traduits en arabe avec lemploi de lquivalent fourni. Les figures 2 et 4 prsentes dans la section 2.3.2 montrent de faon concrte comment est organis le contenu informationnel de notre article bilingue. Il est noter que celui-ci concerne surtout larticle bilingue avec quivalent direct en arabe, cest--dire avec un quivalent qui est une lexie arabe dcrite sur les plans smantique, syntaxique et lexical. Or comme certaines lexies franaises nont pas dquivalent direct en arabe, mais peuvent correspondre plutt des collocations ou des expressions libres dans la langue cible, nous avons prvu un deuxime type darticle bilingue, simplifi, qui contiendra les donnes suivantes : Les informations lies lidentification de la lexie-vedette franaise, cest-dire le nom du vocable, son numro en cas dhomonymie, sa PDD, le numro de lacception traduire et sa forme propositionnelle qui permet dexpliciter le nombre de ses actants. Lquivalent traductif arabe qui sera, si la langue en dispose, une collocation ou une expression libre donne comme solution au problme dabsence dquivalence directe entre les deux langues. Un nota bene pour prciser la nature de lquivalent fourni ou renvoyer lusager larticle unilingue des lexies qui composent la collocation ou lexpression propose comme quivalent. La forme propositionnelle de cet quivalent, lorsquil sagit dune collocation. Dans un article bilingue, il est en effet ncessaire dexpliciter la forme propositionnelle et le rgime des collocations, lorsquelles sont proposes comme quivalent traductif. Cette prcision est utile, non seulement parce que les collocations appartiennent la langue que lusager ne matrise pas, mais aussi parce que la structure actantielle de la collocation est rarement dductible du rgime de la base. Ainsi, les collocations verbales (Verbe + Nom), par exemple, ne prennent pas toujours les mmes actants que la base nominale et peuvent mme hriter des proprits syntaxiques du collocatif. Le tableau de rgime, sil y a lieu, avec une collocation verbale par exemple.3 Un ou deux exemples de traduction.

Dans ce deuxime type darticle bilingue, les champs rservs au tableau de rgime de lquivalent arabe, sa forme propositionnelle et, mme, lquivalent arabe peuvent rester vides. Dans un tel cas, on indiquera NA pour non applicable .

En rsum, notre BD comporte quatre types darticles : des articles unilingues franais, des articles unilingues arabes, des articles bilingues avec quivalent direct et des articles bilingues sans quivalent direct. Dans la section suivante, nous verrons comment cette BD est structure. 2.3 Structure du Dico-FRAR Le Dico-FRAR est une base de donnes dictionnairique. Chaque article quelle contient prsente les donnes sous forme de texte. Cela dit, le texte lexicographique na pas besoin dtre compil en un seul bloc. Avec loutil informatique, il est possible de structurer larticle de dictionnaire sous diffrents blocs plus ou moins indpendants, ce qui facilite la consultation pour lusager et la gestion des donnes pour le lexicographe. Loutil informatique permet, par exemple, dafficher plus aisment les relations smantiques et lexicales entre les diverses units dcrites et de rviser rigoureusement le contenu informationnel fourni. Ainsi, pour concevoir notre base de donnes franais-arabe, notre choix sest arrt sur une base relationnelle4 gre par le logiciel Access, qui fait partie de la suite bureautique de Microsoft Office. Pour chacun des quatre types darticles que renferme notre BD, nous avons conu des tables pour contenir les diverses donnes. Cette faon de faire, cest-dire de crer des tables spares, permet de grer facilement la base et de lenrichir, au besoin, en ajoutant des donnes ou des champs, sans avoir la ramnager chaque fois. Au total, notre BD est structure en seize tables distinctes dont certaines sont relies entre elles pour former nos quatre types darticles. Nous nous limitons, dans ce texte, la description de la structure de larticle bilingue avec quivalent direct. 2.3.1 Organisation des tables de larticle bilingue avec quivalent direct Pour cet article dictionnairique, nous avons cr quatre tables rserves chacune un type dinformation particulier, savoir : Entree_bilingue_ED5, Relations_pardigmatiques_ar, Collocations_fr_ar et Vulgarisations_fl. La premire, Entree_bilingue_ED, est la table principale de larticle bilingue avec quivalent direct. Les diffrents champs quelle renferme prsentent les donnes caractristiques essentielles de la lexie-vedette franaise traduire et de son quivalent arabe comme le nom du vocable, le numro de la lexie, la PDD, etc. Ces donnes sont directement importes des tables lies aux articles unilingues franais et arabes. La table contient galement les champs relatifs aux donnes smantiques et syntaxiques associs la lexie arabe, ainsi quaux exemples qui illustrent lemploi de cette lexie dans un contexte de la langue cible.

Une base de donnes relationnelle est une base dans laquelle les donnes sont stockes dans des tables distinctes, selon le type dinformation enregistrer, mais qui sont relies entre elles et peuvent tre regroupes selon les besoins. 5 Pour viter tout problme avec Access, les accents nont pas t utiliss dans les noms des tables et des champs crs.

La table Relations_paradigmatiques_ar renferme, comme son nom lindique, les informations lies aux relations lexicales paradigmatiques de lquivalent arabe fourni. Ces informations tant galement dj stockes dans une des tables de larticle unilingue arabe, nous les avons simplement slectionnes et importes directement depuis la table en question. La table Collocations_fr_ar est destine contenir les donnes relatives aux relations lexicales syntagmatiques de la lexie franaise et de son quivalent arabe. Enfin, la table Vulgarisations_fl a t cre pour nous permettre de regrouper diffrentes valeurs dune mme fonction lexicale donne. Pour mieux expliquer lutilit de cette dernire table, rappelons que lapplication dune seule fonction lexicale ou dune seule vulgarisation de fonction lexicale une lexie peut donner plusieurs valeurs qui sont plus ou moins diffrentes sur le plan smantique. titre dexemple, les collocations suivantes punition mrite/ juste/ quitable sont toutes encodes, dans le formalisme de la LEC, avec la mme fonction lexicale Ver(punition) ou sa vulgarisation Que lacte Z justifie, mais spares avec un point virgule. Toutefois, dans un article bilingue, il importe, selon nous, de distinguer plus clairement ces collocations pour proposer lusager les bons quivalents quil pourra employer sans quivoque. Cest pourquoi, bien quelles elles soient dcrites avec la mme fonction lexicale ou la mme vulgarisation de fonction lexicale, nous avons dpartag ces collocatifs en les citant comme des enregistrements distincts dans la table Collocations_fr_ar (voir figure 1). Avec la table Vulgarisations_fl, nous pouvons faire cette distinction sans perdre de vue le lien entre les diffrentes donnes.
Nom_vocable_fr Num_lexie_fr Nom_vocable_ar Num_lexie_ar Vulgarisation_fl Collocatifs_arabes Collocatifs_franais

PUNITION PUNITION

I I

c [ iqb] c [ iqb]

0 0

Que l'acte Z justifie Que l'acte Z justifie

c [ dil] [mustaaq]

quitable, juste mrite

Figure 1. Extrait de la table Collocations_fr_ar6 Les diverses tables prsentes ci-dessus sont relies entre elles via les champs communs quelles contiennent, ce qui permet de garder lunit de larticle dictionnairique et la cohrence des donnes quil renferme. 2.3.2 La mise en page Aprs avoir identifi le contenu informationnel de nos diffrents articles et structur partir de l notre BD en diverses tables relies entre elles, nous avons conu un formulaire de saisie pour chacun de nos quatre types darticle. Ce formulaire, ralis grce aux liens tablis entre les tables, permet denregistrer nos donnes de faon
6

Pour faciliter la lecture des units lexicales arabes au lecteur de cet article, nous utilisons le systme de translittration de larabe DIN-31635. Les lexmes translittrs sont mis en italique entre deux crochets.

conviviale, en ayant toujours sous les yeux les informations qui sont rparties de manire automatique dans les diffrentes tables sous-jacentes. Le formulaire permet aussi de corriger ou modifier efficacement, sil y a lieu, les donnes consignes sans avoir ouvrir ncessairement toutes les tables o des modifications doivent tre apportes, au risque den oublier quelques-unes. La figure 2 donne un aperu de ce formulaire pour larticle bilingue avec quivalent direct.

Figure 2. Formulaire de saisie de larticle bilingue avec quivalent direct

Comme nous lavons signal ci-dessus, certaines donnes de larticle bilingue sont directement importes des tables relatives aux articles unilingues et ce, aprs la mise en quivalence des lexies franaises et arabes. Pour procder cette mise en quivalence des units lexicales des deux langues, nous avons cr un deuxime type de formulaire que nous avons appel formulaire de mise en correspondance des lexies fr-ar. Celui-ci se prsente comme suit :

Figure 3. Formulaire de mise en correspondance des lexies fr-ar

Avec ce formulaire, qui comprend une partie rserve lentre franaise et une autre lentre arabe, nous avons accs de manire parallle aux diverses lexies dcrites dans les deux langues. Pour bien identifier les lexies en cause, le formulaire indique le nom du vocable, son numro, sa PDD, le numro de la lexie et sa forme propositionnelle. Pour obtenir de plus amples dtails sur la lexie franaise ou arabe choisies, le formulaire offre en outre un accs direct aux articles unilingues (par le biais des onglets Consultation

10

dictionnaire unilingue franais et Consultation dictionnaire unilingue arabe en haut du formulaire dans la figure 3). Le formulaire contient aussi dautres types dinformations dont nous avons besoin pour tablir la mise en correspondance entre les lexies franaises et arabes. Nous avons ainsi, ct du numro de la lexie, le champ Selection prsent ici sous forme de case dans laquelle on coche pour slectionner les lexies franaises et arabes quivalentes. Il y a aussi le champ Ajout (not Entre inscrite dans le dictionnaire bilingue dans la fig. 3), prsent galement sous forme de case, qui sera coche automatiquement lorsque la lexie franaise slectionne sera ajoute dans le dictionnaire bilingue, ce qui permet de distinguer les lexies traites et celles qui ne le sont pas encore7. Cette modification automatique dans le champ Ajout est effectue via une requte de Mise jour que lon excute avec un des deux boutons de commande nomms Mettre jour le dictionnaire bilingue (selon que le type darticle bilingue choisi est avec ou sans quivalent direct). Une fois que nos deux lexies quivalentes ont t slectionnes et ajoutes la table Entree_bilingue correspondante, deux autres boutons de commande permettent daccder au formulaire de saisie de larticle bilingue li cette nouvelle entre pour complter la rdaction de larticle (voir en bas du formulaire dans la figure 3).

Les formulaires prsents plus haut sont, comme leur nom lindique, des formulaires de saisie et de mise en correspondance. Ils sont donc destins au lexicographe/rdacteur et non lusager (lapprenant ou le traducteur) de la BD. Par consquent, pour une consultation des articles sans risque de modification des donnes enregistres, des pages web ont t cres. Ces pages permettent davoir accs aux fiches lexicographiques contenues dans la base, via le web ou lintranet. Pour chaque type darticle de dictionnaire (unilingue arabe, unilingue franais, bilingue franais-arabe), nous avons conu diverses pages daccs aux donnes, savoir une page daccs pour larticle unilingue arabe, une autre pour larticle unilingue franais, deux pages pour larticle bilingue avec quivalent direct (version complte et version abrge) et, finalement, une page pour larticle bilingue sans quivalent direct. Toutes ces pages peuvent tre consultes partir dune page daccueil qui sert de point dentre DicoFRAR. Lusager peut ainsi choisir, selon ses besoins, lun ou lautre des types darticle de dictionnaire auquel il veut accder, ainsi que le niveau de dtail souhait pour laffichage des donnes. Celles-ci, classes en diverses rubriques, ne saffichent que si lusager le dsire. Les figures suivantes prsentent un exemple de la page daccs de larticle bilingue avec quivalent direct dans sa version complte (fig. 4) et sa version abrge (fig. 5). Le contenu de cet article est prsent en dtail la section 3.

Rappelons que notre traitement lexicographique bilingue est unidirectionnel du franais vers larabe. Donc, une lexie franaise doit tre traite une seule fois. Par contre, une lexie arabe peut tre propose comme quivalent possible plusieurs lexies franaises.

11

Figure 4. Page daccs larticle bilingue avec quivalent direct. Version complte

12

La version dtaille prsente larticle bilingue complet avec toutes les informations smantiques, syntaxiques et lexicales. La version abrge prsente en gros lquivalent arabe, sa PDD, sa forme propositionnelle, les collocations arabes de lquivalent, ainsi que les quivalents des collocations franaises et lexemple de traduction.

Figure 5. Page daccs larticle bilingue avec quivalent direct. Version abrge

3. Exemple darticle de dictionnaire bilingue dans le Dico-FRAR


Lexemple darticle de dictionnaire bilingue avec quivalent direct qui va suivre permettra au lecteur de se faire une ide concrte du traitement lexicographique que nous proposons dans le Dico-FRAR et la pertinence des informations qui y sont donnes8. La lexie-vedette slectionne pour cet exemple est chtierI.

Comme il a t mentionn la note 6, le recours la translittration de larabe dans notre exemple darticle de dictionnaire na pour objectif que daider le lecteur lire le prsent travail.

13

ChtierI Verbe
Forme propositionnelle X chtie Y pour Z par W

2 ['addaba]

'Verbe'
Racine

'[ db]
Forme propositionnelle W Z Y X

NB L'quivalent propos n'est pas un quivalent parfait. Voir la dfinition et la mise en garde ci-dessous.

Informations smantiques
Dfinition Lindividu X tenant lindividu Y responsable de lacte Z qui va lencontre de certains principes auxquels X se rfre || X, qui a une autorit sur Y, fait subir un mal W Y afin que Y ne refasse pas Z et amliore sa conduite en respectant les principes de X. Mise en garde Prendre note que la composante smantique lie 'l'amlioration de la conduite de Y' est plus forte avec la lexie arabe qu'avec la lexie franaise. De plus, le mal W ou la . punition inflige avec "chtierI" est svre, ce qui n'est pas forcment le cas avec 2 C'est pourquoi, dans les contextes o "chtierI" est employ pour punir un coupable, un criminel pour un mfait grave, il est prfrable d'employer le verbe a, qui a un sens plus gnral et qui ne vise pas l'amlioration de la conduite de Y. Voir l'exemple de traduction 2.

Informations syntaxiques
Tableau de rgime X = I = N nominatif Y = II = N accusatif oblig. c Z = III = N [al] ,N [li] W = IV = N [bi] Mise en garde a un seul rgime syntaxique. La prsence de l'actant Y Contrairement "chtierI", 2 (1er complment) est obligatoire dans un nonc.

14

Exemples
. ['addaba-hu al-mucallimu cal taarrufi-hi assayyi' ta'dban riman.] . ['addaba-h li-hurji-h al-mutakarrir dna 'idn.] . ['addaba al-'abu 'awlda-hu bi-a-arbi.] 'L'instituteur l'a svrement chti pour son mauvais comportement.

'Il l'a chti pour ses frquentes sorties sans permission.

'Le pre a chti ses enfants avec une punition corporelle.'

Informations lexicales
Drivs smantiques
Nom_Fl QSyn Vulgarisation_Fl Valeur_Fl punir a [cqaba] 'infliger qqn un mal identique ou gal celui caus' [Y=N ] ['iqtaa min N=Y] Lit. 'donner ce qu'une personne mrite, donner son d qqn. [Y=N] [jaz] ,[Y=N ], c [smaa, afaa an] pardonner [Y=N ] ,[Y=N ] c c [ af an, afara li] rcompenser , ['atba, kfa'a] [ta'db] 2 [danb] mal, mfait ,[haa'] faute [muhlafa] infraction c c [ iqb, uqba] peine, punition , [ta'db] [tata at-ta'db] [yu'addab]

QAnti

S0 S3 S4/Sinstr A0 A2 Able2

Nom de Z Nom de W [Y] que X ~ [Y] que l'on pourrait ~

15

Qual2

[Y] que l'on est susceptible de ~

[muhi'] 'fautif' ; [muhlif]contrevenant' [jn, mudnib] coupable ,

Collocations
Vulgarisation_Fl De faon svre Collocatifs franais durement, lourdement, rigoureusement, svrement Collocatifs arabes 0 Remarques et commentaires Ces collocatifs adverbiaux n'ont pas d'quivalents directs ['addaba] soit en arabe. On peut employer le verbe 2 avec une expression libre compose de la prposition [idda/arma/qaswa], [bi]+ le masdar / / soit avec une collocation compose du masdar 2 [ta'dban] (mis l'accusatif indfini parce qu'il fonctionne en tant qu'objet interne) + l'un des adjectifs suivants (mis galement l'accusatif indfini) : / / [addan/ariman/qsiyan]. Pour plus d'informations, consulter le dictionnaire unilingue arabe. De faon justifie bien, justement 0 Ces collocatifs adverbiaux n'ont pas d'quivalents directs avec une en arabe. On peut employer le verbe 2 collocation compose de l'adjectif comparatif ['asana] (mis l'accusatif) + le masdar 2[ ta'db]. avec une On peut aussi employer le verbe 2 expression libre comme, par exemple, "[ " kam yajib] qui signifie 'comme il se doit'. . ['addaba-hu al-mu allimu 'asana ta'db.] Lit. Linstituteur l'a chti dun meilleur chtiment.
c

Exemples . ['addaba-hu al-mucallimu cal taarrufi -hi as-sayyi' ta'dban riman.] Lit. Linstituteur l'a chti dun chtiment svre pour son mauvais comportement.

Exemple de traduction
1- On ne doit pas chtier les enfants avant quils puissent connatre leurs fautes. [min al-mafr 'an l nu'addib al-'atfl qabla 'an nubayyin lahum 'ah'ahum] . 2- Linceste est universellement prohib et mme svrement chti dans toutes les socits.

c c c c [iynu al-mahim mar wa jarma yu qib alayha bi-idda f jam al-mujtama t.] .

16

4. Conclusion
Dans cet article, nous avons prsent la BD lexicographiques bilingue Dico-FRAR qui peut tre propose comme modle pour le dveloppement dun dictionnaire informatis franais-arabe dencodage. La finalit de cette base de donnes est multiple. Elle offre lusager un traitement lexicographique qui rpond, autant que faire se peut, ses attentes en matire dencodage ou de traduction. Elle propose galement celui-ci la possibilit de consulter non seulement les articles bilingues franais-arabe, mais aussi les articles unilingues franais et les articles unilingues arabes rdigs dans un mtalangage franais. De plus, le Dico-FRAR offre au lexicographe un environnement de travail agrable et convivial pour quil arrive consulter ces articles unilingues, comparer et trier les donnes afin de rdiger des articles bilingues satisfaisants. Enfin, avec la varit et la richesse des donnes smantiques, syntaxiques et lexicales des vocables qui seront dcrits de faon complte dans les deux langues mises en parallle, cette base de donnes, une fois enrichie avec un nombre lev de vocables, pourra, en outre, tre exploite des fins de recherche dans divers domaines. Nous pensons particulirement aux domaines de la lexicographie, de la linguistique compare, voire de lenseignement et lapprentissage dune langue trangre.

Remerciements Je tiens remercier Gatane Dostie et Alain Polgure pour avoir lu et comment une premire version de cet article. Rfrences Alonso Ramos, M. (2001) Construction dune base de donnes des collocations bilingue franais-espagnol , Langages, 143, pp. 5-27. Baker, C. F., et al. (1988) The Berkeley FrameNet Project , in : Proceedings of COLING-ACL98, Montral, pp. 86-90. Bouchaddakh, S. (2009, en prparation) Application des principes de la lexicologie explicative et combinatoire la construction dun dictionnaire bilingue informatis franais-arabe, thse de doctorat dirige par G. Dostie et A. Polgure, Universit de Sherbrooke. Bouchaddakh, S. (2008) La dfinition dans les dictionnaires bilingues : problmes de polysmie et dquivalence interlangues , in : Proceedings of the XIII EURALEX International Congress : EURALEX2008, Barcelone, pp. 807-812. Fellbaum, C. (ed.) (1998) WordNet : An Electronic Lexical Database, Cambridge (MA), MIT Press. Fillmore, C. et al. (2001) Building a Large Lexical Databank Which Provides Deep Semantics , in : Proceedings of the Pacific Asian Conference on Language, Information and Computation, Hong Kong, pp. 3-26. Fontenelle, T. (1997) Turning a Bilingual Dictionary into a Lexical Semantic Database, Tbingen, Max Niemeyer Verlag. 17

Haussmann, F. J. (1979) Un dictionnaire des collocations est-il possible? , Travaux de linguistique et de littrature, 17(1), pp.197-195. Meluk, I. A. et al. (1995) Introduction la lexicologie explicative et combinatoire, Louvain-la-Neuve, Duculot. Meluk, I. A. (1996) Lexical Functions : A Tool for the Description of Lexical Relations in the Lexicon , in : Wanner L. (ed.), Lexical Functions in The Lexicography and Naturel Language Processings, Amesterdam/ Philadelphia, Benjamins, pp. 37-102. Meluk, I. A. et Polgure (2007) Lexique actif du franais : Lapprentissage du vocabulaire fond sur 20 000 drivations smantiques et collocations du franais, coll. Champs linguistiques, Bruxelles, De Boeck & Larcier. Selva, T. et al. (2002) Le DAFLES, un nouveau dictionnaire pour apprenants du franais , Proceedings of the Tenth EURALEX International Congress : EURALEX'2002, Copenhague, Vol.1, pp. 199-208. Polgure, A. (2000) Towards a theoretically-motivated general public dictionary of semantic derivations and collocations for French , Proceedings of the Ninth EURALEX International Congress : EURALEX2000, Stuttgart, pp. 517-527. Polgure, A. (2003) tiquetage smantique des lexies dans la base de donnes DiCo , Traitement Automatique des Langues (T.A.L.), vol. 44, no 2. pp. 39-68. Verlinde, S. et al. (2005) Dictionnaires lectroniques et environnement dapprentissage du lexique , Revue de linguistique applique, vol.10, no 2, pp. 19-30. Dictionnaires consults Al-Manhal : dictionnaire franais-arabe (2001) par S. Idris, Beirut, Dar al-Adab. Al-Mawrid : a modern English-Arabic dictionary (1982) par M. Al-Baalbaki, Beirut, Dar al-ilm lil-malayin. Dictionnaire arabe-franais (1860) par Kasimirski, Beyrouth, Librairie du Liban. Dictionnaire arabe-franais, franais-arabe : As-Sabil (1983) par D. Reig, Paris, Larousse. Dictionnaire franais-arabe (1970) par M. Al-Najjari Bek, Beirut, Librairie du Liban. Dictionnaire arabe-franais, franais-arabe (1999) par D. Reig, Paris, Larousse. Dictionnaire arabe-franais-anglais : langue classique et moderne (1967) par R. Blachre, M. Chouemi, et C. Denizeau, Paris, G.-P. Maisonneuve et Larose. Nouveau dictionnaire franais-arabe (1952) par E. Torkia, Caire, Bureau de la Publicit.

18