Vous êtes sur la page 1sur 15

Enguehard, C., Mbodj, C., "Recueillir et diffuser les noms des plantes dans les langues africaines".

Les cahiers du RIFAL


n23 LE TRAITEMENT INFORMATIQUE DES LANGUES AFRICAINES, pp.47-54, novembre 2003.

Flore : un site coopratif pour recueillir et diffuser les


noms des plantes dans les langues africaines

RSUM
Les travaux que nous prsentons sinscrivent dans une problmatique de sauvegarde des langues
pour lesquelles il existe peu de ressources linguistiques comme les dictionnaires ou les lexiques. La raret
de ces ouvrages de rfrence fragilise ces langues car elle favorise la multiplication dcrits incorrects,
cest--dire non conformes aux dcrets de transcription officiels en vigueur. Nous considrons que la
constitution de ressources lexicales lectroniques via le rseau internet reprsente une solution viable.
Dune part elle permet de fdrer les travaux de chercheurs gographiquement loigns. Dautre part elle
facilite la diffusion des connaissances puisque celles-ci sont visibles par nimporte quel internaute.

Le site Flore sinscrit dans ce cadre. Il est spcialis dans les noms des plantes. La dfinition prcise
des informations stockes sur ce site par les partenaires du projet (informaticiens, linguistes et
ethnobotanistes) nous a amen dpasser lobjectif initial et ajouter la description botanique des plantes
ainsi que leurs utilisations. Cette extension a abouti la dfinition de stratgies de coopration entre les
personnes de diffrentes comptences susceptibles de fournir de nouvelles informations au site (linguistes,
botanistes, nutritionistes, etc.). Nous prsentons les problmes techniques rencontrs lors du
dveloppement qui font obstacle linformatisation des langues africaines : il sagit des caractres
spciaux spcifiques ces langues et inexistants sur les claviers courants et dans les polices de caractres
courantes. Enfin nous explorons les multiples extensions envisageables, telles la mise en service dun
forum de discussion rserv aux contributeurs du site ou ldition de son contenu dans un format facilitant
le partage des donnes : XML.

Mots cls : langue africaine ; nom de plante ; flore ;site web ; site coopratif ; transcription ; dcret de
transcription.

INTRODUCTION
Les noms des plantes dans les langues africaines sont gnralement prsents la fin des ouvrages
de botanique, mais ces noms sont souvent errons. Nous prsentons le site lectronique Flore qui est
destin recueillir ces noms, les faire corriger par des linguistes, puis prsenter les versions correctes afin
quelles soient diffuses et employes.

Nous montrons que cette dmarche sinscrit dans un contexte plus gnral de sauvegarde des
langues, et nous passons en revue les motivations pour dvelopper ce site lectronique. Ensuite, nous
dtaillons les informations quil contient et son mode de fonctionnement pour lapport de nouvelles
informations et leur validation. Nous insistons sur la ncessaire collaboration entre spcialistes de
comptences diffrentes (linguistes et botanistes) et prsentons les modes de coopration que nous avons
mis en place. Enfin, nous ouvrons la liste des dveloppements futurs qui feront voluer le site Flore.
Enguehard, C., Mbodj, C., "Recueillir et diffuser les noms des plantes dans les langues africaines". Les cahiers du RIFAL
n23 LE TRAITEMENT INFORMATIQUE DES LANGUES AFRICAINES, pp.47-54, novembre 2003.

1 MOTIVATION
Dans de nombreux domaines (sant, ducation, conomie) l'Afrique est dans une situation
catastrophique, le domaine linguistique n'chappe pas cette situation. Bien que ce continent soit riche
d'un millier de langues, celles-ci sont en grande majorit peu valorises, voire abandonnes. La
transmission de connaissances est ralise dans des langues que les populations ne matrisent pas, ce qui
accrot encore les difficults. Cet abandon des langues utilises par les populations a une seconde
consquence difficilement perceptible a priori : une diminution de la capacit globale de lespce humaine
innover. En effet, chaque langue est plus quun simple code mais reflte une conceptualisation
particulire de la ralit. Edward Sapir ((Sapir, 1921) cit par (Durand, 2002 : chapitre2)) souligne ainsi
que le langage est une traduction symbolique de la ralit mais que la ralit, telle que nous la percevons,
est pour une large part inconsciemment fonde sur nos habitudes linguistiques. Chaque langue prsente des
rapprochements smantiques, des collisions phontiques, qui lui sont propres et peuvent donner lieu des
dcouvertes qui ne seraient pas concevables dans une autre langue. En permettant la construction de
perceptions diffrentes de la ralit, la diversit des langues entrane le progrs car elle favorise la
multiplicit des langues et du vcu.

Cet abandon des langues est favoris par le faible nombre de cadres qui sont forms en Afrique, y
compris dans le domaine trs particulier de la linguistique. Dans une langue donne il est trs difficile
dobtenir des comptences langagires du niveau dun locuteur maternel si lon a grandi dans une autre
langue, or le nombre de linguistes travaillant sur leurs langues maternelles est extrmement faible (si lon
compare, par exemple, avec le nombre de linguistes franais travaillant sur la langue franaise). A cause,
prcisment, de ce manque de linguistes forms de nombreuses questions linguistiques ne sont pas
rsolues.

Souvent il n'existe aucune ressource lexicale, en loccurrence des dictionnaires, qui permette de
fixer la graphie, la phontique et les diffrents sens des lexmes. Ainsi le premier dictionnaire
monolingue en zarma a vu le jour en 2000 (Oumarou, 2000)2 alors qu'il existait auparavant un
dictionnaire bilingue zarma-franais (Bernard 1994). Des ressources bilingues zarma-anglais sont
galement apparues sur la toile (http://www.bisharat.net/Zarma/).

Les ouvrages rassemblant les rgles syntaxiques sont trs rares, peu connus et peu utiliss.

Ce manque chronique de ressources lexicales freine largement la production de textes crits alors
que ces langues de tradition orale sont largement pratiques par les populations. Lorsque des transcriptions
voient le jour, c'est souvent le fait de sociologues ou d'ethnologues sans les comptences linguistiques
ncessaires pour les raliser dans les rgles de l'art. La multiplication de ces textes mal transcrits contribue

1
Nous remercions le Fonds Francophone des Inforoutes de l'Agence de la Francophonie qui a
financ la conception de ce site (aot 1999 juin 2001)
2
Signalons, cependant, les projets dimo-lexis (dictionnaires monolingues et lexiques spcialiss)
financs par lAgence de coopration culturelle et technique (ACCT) de 1984 1989 dans le cadre
de ses programmes de coopration linguistique.
Enguehard, C., Mbodj, C., "Recueillir et diffuser les noms des plantes dans les langues africaines". Les cahiers du RIFAL
n23 LE TRAITEMENT INFORMATIQUE DES LANGUES AFRICAINES, pp.47-54, novembre 2003.

dgrader encore davantage les capacits des populations de lire et d'crire ces langues. Cette
mconnaissance de leurs propres langues les pnalise dautant plus quil leur interdit laccs aux nouvelles
technologies, et en particulier Internet, dans leur langue. Pourtant Internet pourrait contribuer relier ces
populations la diaspora, encourager la production et la diffusion dcrits, stimuler lactivit conomique.
Le fait que ces activits doivent toutes tre ralises dans une langue trangre (gnralement le franais
en Afrique de lOuest) aggrave encore la situation linguistique.

Cette pauvret linguistique a des rpercussions sur le dveloppement conomique des populations
car la transmission des connaissances techniques et scientifiques est souvent porte par une langue
occidentale (gnralement celle d'un des pays anciens colonisateurs). Non seulement les populations
doivent acqurir de nouveaux savoirs, mais elles doivent le faire ( supposer quelles en aient la possibilit
et lopportunit) dans une langue trangre pas ou peu matrise, ce qui ne facilite pas l'apprentissage.

Il apparat donc que la production et la diffusion d'informations linguistiques concernant les


dnominations scientifiques et techniques constituent une condition ncessaire (mais non suffisante) au
dveloppement conomique, et un facteur essentiel de la renaissance africaine.

Et comme le font remarquer les experts runis Mons loccasion du sminaire3 sur le thme
Respect de la diversit linguistique et accs universel au cyberespace : Nul doute () qu court
terme, un nombre substantiel dactivits humaines ne pourront plus tre envisages sans moyens de
tlcommunications informatiss 4

2 CHOIX DU MEDIUM

La diffusion des connaissances a t longtemps monopolise par les ouvrages imprims (revue ou
livres). Mais les ouvrages imprims restent chers et, de ce fait, peu diffuss. On peut voquer ici les
nombreuses collectes de terminologies (vocabulaires ou lexiques) effectues par des institutions du Sud et
qui dorment, pour ainsi dire, dans les tiroirs des chercheurs, faute de moyens financiers pour en assurer
ldition. Et en tout tat de cause, celles qui parviennent tre publies natteignent pas forcment tous les
publics viss qui, de toute manire, ne bnficieraient pas de linteractivit quoffre une base de donnes
sur la Toile double dun forum de discussions.

Internet a donc boulevers ce schma (non seulement en donnant la possibilit de mettre fin cette
discrimination et cette injustice dont lAfrique est la principale victime mais galement) par l'apport
d'une srie de fonctionnalits indites : il est possible de stocker, manipuler et diffuser les donnes sous
forme lectronique.

Le stockage dans des bases de donnes exige une dfinition conceptuelle des donnes et
systmatise le recueil des informations.

3
Sminaire tenu Mons en Belgique, du 16 au 22 mars 2002. Ce sminaire a t organis par la
chaire Unesco en amnagement linguistique et didactique des langues dans les systmes ducatifs
et lInstitut de linguistique de lUniversit de Mons-Hainaut.
4
Voir B. Harmegnies et R. Renard, 2002, Rapport dvaluation du Sminaire sur le respect de la
diversit linguistique et laccs au cyberespace, p.2.
Enguehard, C., Mbodj, C., "Recueillir et diffuser les noms des plantes dans les langues africaines". Les cahiers du RIFAL
n23 LE TRAITEMENT INFORMATIQUE DES LANGUES AFRICAINES, pp.47-54, novembre 2003.

Le partage de grandes quantits de donnes lectroniques est facilit par l'utilisation de formats
comme XML.

Les donnes peuvent tre accessibles via un site Internet partir de n'importe quel ordinateur
connect la toile.

L'ajout de donnes est ais, et ces nouvelles donnes sont immdiatement accessibles en
consultation.

Cette technologie prsente par ailleurs quelques inconvnients facilement matrisables :

il faut tre quip d'un ordinateur connect la toile pour accder aux informations ;

les donnes lectroniques sont trs volatiles et peuvent tre irrmdiablement perdues en cas de
panne ou d'erreur de manipulation. Toutefois le stockage des informations dans des bases de
donnes garantit la sauvegarde des donnes.

Plusieurs stratgies permettent de minimiser ces inconvnients. Tout d'abord, la production rgulire
d'ouvrages imprims constitue une diffusion supplmentaire des connaissances qu'il ne faut pas oublier :
elle touche les populations rurales qui ne sont pas connectes, et elle permet une consultation frquente des
informations. Par ailleurs, ces ouvrages imprims constituent une forme de prennisation et de sauvegarde
des informations qu'il ne faut pas ngliger. Toutefois, la sauvegarde rgulire des informations sur support
lectronique doit videmment tre ralise scrupuleusement.

L'ancien vecteur de diffusion des connaissances qu'est le livre rapparat donc comme un
complment primordial de la technologie Internet.

3 LES NOMS DE PLANTES

Les objets rpertoris dans les ontologies naturalistes (zoologie ou botanique) sont dsigns par un
unique nom savant de forme latinisante, indpendant de la langue. Il s'agit d'une dnomination dun
concept.

Dans chacune des langues, ces objets peuvent avoir une ou plusieurs dnominations, ou parfois n'en
avoir aucune. Ces dnominations sont les tiquettes linguistiques des objets qui constituent les ontologies
naturelles, il sagit donc de termes (Sager, 1990).

Les ouvrages de botanique et de zoologie prsentent (gnralement en fin d'ouvrage) des listes des
noms de ces objets dans les langues locales mais ces noms recueillis par des naturalistes dmunis des
comptences linguistiques ncessaires sont entachs d'erreurs.

Voici quelques exemples :

Le nom du Cassia Occidentalis L. en wolof cit dans (Fortin, 1997 : 92) est bentemar alors que
dans (Von Maydell, 1983 : 447) est nonc bantamare. En ralit ces deux dnominations coexistent
effectivement mais dans des dialectes diffrents.
Enguehard, C., Mbodj, C., "Recueillir et diffuser les noms des plantes dans les langues africaines". Les cahiers du RIFAL
n23 LE TRAITEMENT INFORMATIQUE DES LANGUES AFRICAINES, pp.47-54, novembre 2003.

Deux noms en wolof sont cits dans (Fortin, 1997 : 92) pour le Moringa oleifera Lam : nevday et
nbday alors que dans (Von Maydell, 1983 : 447) est nonc benaile. Ces trois dnominations sont
grossirement errones : les caractres et v nexistent pas dans la langue wolof, tandis que benaile
est une transcription dfectueuse du franais ben ail ! En fait, le nom wolof devrait tre transcrit
nebedaay (ce nom serait issu de lexpression anglaise never die).

Le nom du Tamarindus Indica L. en wolof cit dans (Fortin, 1997 : 219) est dakkar alors que
dans (Von Maydell, 1983 : 447) sont noncs dakak et dakkar : dakak est erron tandis que dakkar
est mal transcrit. La dnomination correcte en wolof tablie en respectant lalphabet et les rgles de
transcription officiels est : daqaar.

Dune manire gnrale, nous constatons que les rgles de transcription ne sont pas respectes.
Ainsi, bien que de nombreuses langues africaines s'crivent l'aide de caractres non compris dans
l'alphabet latin (comme le b cross : ; ou le n palatal : ), nous n'en avons trouv aucune trace dans ces
listes.

Les ouvrages dans lesquels nous avons relev de nombreux noms mal transcrits sont largement
diffuss, et mme admis comme des rfrences dans le domaine de la botanique. Comme ils sont souvent
cits, ils prsentent linconvnient majeur de propager des informations linguistiques fausses allant par
exemple jusqu implicitement remettre en cause les caractres alphabtiques adquats pour une langue
comme dans le cas du nevday. Ils constituent de vritables virus linguistiques (par analogie avec les
virus informatiques) susceptibles de pervertir la langue.

Il existe peu de sites rpertoriant les noms savants dans les langues nationales. Ecoport, un site
amricain, prsente des listes de noms dans diffrentes langues. Mais, en franais les noms prsentent des
erreurs dues l'utilisation exclusive des caractres latins non accentus (arbre a beurre au lieu de arbre
beurre). En fait, ce site prsente l'inconvnient majeur de ne pas identifier les contributeurs du site qui
ajoutent de nouvelles informations. Celles-ci sont alors prsentes sans vrification d'aucune sorte.

Les noms fournis au site Flore sont transcrits ou retranscrits par des linguistes locuteurs des langues
concernes conformment aux dcrets de transcription officiels en vigueur dans les pays o ces langues
sont parles. Il serait dailleurs souhaitable que les ministres chargs des langues nationales rendent
accessibles ces dcrets en les mettant disposition sur la Toile.

Au Sngal, plusieurs dcrets ont t promulgus. Concernant le wolof, on peut citer le dcret n 72-
702 du 16 juin 1972 modifiant le dcret n 71-566 du 21 mai 1971 relatif la transcription des langues
nationales et le dcret n 85-1232 du 20 novembre 1985 modifiant le dcret n 75-1026 du 10 octobre 1975
relatif lorthographe et la sparation des mots. Le dcret n 75-1025 du 10 octobre 1975 vise le sereer.
Lorthographe du pulaar est rgie par le dcret n 1049 du 14 octobre 1980, celle du sonink, du manding
et du jola repose sur des textes de 1980 non encore promulgus. Rcemment, la Direction de la
Promotion des Langues nationales (D.P.L.N.) a procd la codification de lcriture de plusieurs langues
parles au Sngal dont le balante, le manka et le noon.
Enguehard, C., Mbodj, C., "Recueillir et diffuser les noms des plantes dans les langues africaines". Les cahiers du RIFAL
n23 LE TRAITEMENT INFORMATIQUE DES LANGUES AFRICAINES, pp.47-54, novembre 2003.

4 RALISATION : LE SITE FLORE


L'objectif principal du site Flore est de collecter et de diffuser les noms des plantes dans les langues
du Sahel, tous ces noms ayant t au pralable tablis par des linguistes en respectant les dcrets de
transcription. Ce sont la qualit et la fiabilit de ces informations qui font la valeur de ce site.

Le nombre de langues concernes n'est pas limit. Pour l'instant, il comprend le bambara, le
haoussa, le jola, le peul5, le sereer, le wolof et le zarma, auxquels nous avons joint le franais et l'anglais.

Toutefois, nommer les plantes suppose de savoir les reconnatre, il nous est donc apparu
indispensable de prsenter la description botanique des plantes. Enfin, de nombreuses plantes offrent des
possibilits dutilisation qui peuvent tre vitales dans des pays dmunis, quil sagisse dutilisations
culinaires (on peut se nourrir de certains fruits, de certaines racines), domestiques (comme la confection de
cltures), ou mdicales. Nous avons donc dcid de rpertorier galement ces utilisations.

La langue pivot, utilise pour l'interface du site et pour renseigner les informations autres que les
noms des plantes, est le franais.

4.1 Modle de donnes


Le modle de donnes comprend trois parties, chacune pouvant tre identifie un domaine des
savoirs que nous avons choisi de modliser. Ainsi, il y a une partie linguistique, une partie botanique, et
une partie utilisation. Chacune de ces parties a t conue en troite collaboration avec des professionnels
du domaine concern : deux linguistes, Boureima Oumarou (docteur en linguistique) et Chrif Mbodj
(docteur en linguistique) ont contribu la conceptualisation de la partie linguistique, tandis quAnne
Luxereau (docteur en ethnobotanique) intervenait sur les parties botanique et utilisations.

Le modle de donnes ralis est centr sur la notion d'espce (celle-ci est repre par son nom latin
et son inventeur). Pour chaque espce, il existe une partie linguistique et une partie utilisations.

4.1.1Partie linguistique
Chaque espce peut avoir un ou plusieurs noms dans chaque langue.

Chaque nom est assorti de sa graphie, de sa phontique, d'informations linguistiques et dun


commentaire libre.

Les informations linguistiques diffrent selon les langues. En franais, par exemple, il s'agit de fixer
le genre du nom (masculin ou fminin) alors qu'en wolof il faut prciser sa classe nominale (les suffixes de
classe les plus frquents tant g- ou b- dans le domaine de la flore). Les informations linguistiques sont
primordiales pour lventuelle intgration de ces donnes au sein de ressources linguistiques utilisables en
traitement automatique des langues.

5
Appel galement pula(a)r, ful ou fulfulde.
Enguehard, C., Mbodj, C., "Recueillir et diffuser les noms des plantes dans les langues africaines". Les cahiers du RIFAL
n23 LE TRAITEMENT INFORMATIQUE DES LANGUES AFRICAINES, pp.47-54, novembre 2003.

Des exemples d'usage accompagnent cette description. Chaque exemple comprend :

son nonc dans la langue locale,

sa transcription en franais (la langue pivot),

un ventuel commentaire,

un ou plusieurs enregistrements audio de l'nonc prononcs par un locuteur natif de la langue.

Table ESPECE
Table TYPE_BOTANIQUE
Id_espece
Id_type_botanique
Nom_scientifique Table FAMILLE Nom_type_botanique
Inventeur Id_famille Description
Id_famille Nom_famille
Id_type_botanique Table ILLUSTRATIONS Description
Description Id_image
Origine Titre
Statut Fichier_image
Propriete Auteur
Reproduction Description
Station
Calendrier
Table COMPOSANT Table UTILISE_PAR Table UTILISATION
Id_composant Id_utilisation Id_utilisation
Id_espece Id_composant Nom_utilisation
Description Description

Table SE_NOMME Table LANGUE


Id_denomination Id_langue
Id_espece Nom
Id_langue Iso
Recommandation

Table SON
Table DENOMINATION Id_son
Id_denomination Table EXEMPLE Auteur
Graphie Id_exemple Date
Phonetique Enonce
Linguistique Table VARIANTE Transcription
Commentaire Id_variante Commentaire
Graphie
Phonetique
Linguistique
Commentaire

Modlisation des informations (extrait)

Certains noms peuvent prsenter de lgres variations (appele variantes) selon la rgion. Ainsi, le
fruit du Solanum aethiopicum se nomme jaxatu en wolof, mais dans la rgion de Saint-Louis, au nord du
Sngal, il est appel xulue.

Une variante est attache un nom. Elle est dcrite par sa graphie, sa phontique, les informations
linguistiques et un commentaire libre qui prcise notamment la rgion gographique concerne. Des
exemples d'usage compltent cette description.
Enguehard, C., Mbodj, C., "Recueillir et diffuser les noms des plantes dans les langues africaines". Les cahiers du RIFAL
n23 LE TRAITEMENT INFORMATIQUE DES LANGUES AFRICAINES, pp.47-54, novembre 2003.

4.1.2 Partie botanique


Chaque espce est repre par son nom scientifique, sa famille botanique et son inventeur. Elle est
dcrite par :

son type botanique (arbre, arbuste, gramine, etc.),

sa description botanique,

son origine, mentionne si lespce a t importe dune autre partie du monde,

son statut mentionne le caractre spontan ou cultiv de lespce, et, dans ce dernier cas, prcise
le mode de culture (bouturable, transplantable, etc.),

ses proprits (exemple : fixation de l'azote dans le sol)

son mode de reproduction (rhizome ou graine ou clonage, etc.)

son calendrier (exemple : priode de floraisons),

sa station dcrit les lieux o peuvent se rencontrer des individus de lespce.

Les composants de l'espce6 sont galement dcrits et illustrs de photographies ou de dessins.

Les ventuels synonymes du nom latin sont signals : il s'agit d'anciens noms que des rvisions de
la classification ont vincs.

4.1.3 Partie utilisation


Enfin, la connaissance des plantes en Afrique tant souvent lie leurs utilisations, nous avons
ajout cette description botanique une partie utilisation. Nous distinguons une liste de plusieurs
catgories d'utilisations (artisanale, cosmtique, culinaire, mystique, domestique, fourragre, phyto-
sanitaire, autre) qui peut tre tendue.

L'utilisation mdicale est traite spcialement puisqu'il faut distinguer les diffrentes affections
vises par les traitements. Cette partie a t conue en collaboration avec Marcelle Talbot (directrice de la
cooprative Banituri) et Anne Luxereau.

Ici encore, il s'agit de ne rpertorier que des utilisations effectivement attestes, ou des soins
scientifiquement fonds.

4.2 Fonctionnalits du site


Le site prsente plusieurs caractristiques qui conditionnent son mode de fonctionnement.

1 - les informations sont visibles par tous sur la toile.

6
bourgeon, branche, cendre, corce, feuille, fleur, fruit, gomme, pine, graine, inflorescence, racine, tronc.
Enguehard, C., Mbodj, C., "Recueillir et diffuser les noms des plantes dans les langues africaines". Les cahiers du RIFAL
n23 LE TRAITEMENT INFORMATIQUE DES LANGUES AFRICAINES, pp.47-54, novembre 2003.

Le site est donc librement accessible en consultation tout internaute

2 - les informations prsentes dans le site sont de grande qualit.

Cette condition exige la collaboration de diffrents contributeurs responsables de la qualit des


informations selon leur domaine de comptence. Ainsi, les informations linguistiques sont contrles par
des linguistes (chacun tant qualifi pour une langue), tandis que des botanistes se chargent des
informations botaniques. Les utilisations, du fait de leur diversit, peuvent tre issues de diffrents
mtiers : ethnologues, nutritionnistes, mdecins, personnels de sant, etc. Techniquement, cette exigence de
qualit demande donc la dfinition de diffrents types de contributeurs et leur identification laide dun
nom dutilisateur et dun mot de passe.

3 des contributeurs de diffrentes comptences renseignent le site

Enoncer le nom dune espce dans une langue particulire suppose des comptences dans plusieurs
domaines : il faut connatre cette langue (et donc avoir des comptences linguistiques pour tablir
correctement sa graphie), et savoir identifier lespce (et donc disposer des comptences botaniques
ncessaires). Il est illusoire de penser trouver des contributeurs qualifis la fois en linguistique et en
botanique, il faut donc dfinir un mode de fonctionnement permettant la collaboration entre les diffrentes
comptences.

Cet objectif peut tre rempli en dfinissant une procdure en deux passes (saisie, puis validation)
classique en terminologie. Tout contributeur peut saisir des informations dans tous les domaines. Ainsi, un
linguiste peut entrer une nouvelle espce, un botaniste peut proposer un nom dans une langue ou une
utilisation, etc. Les informations seront ensuite corriges lors de ltape de validation, celle-ci tant
strictement limite certaines informations selon les domaines de comptence de la personne qualifie :
les botanistes qualifis dans une langue particulire passent en revue, corrigent puis valident les
informations linguistiques dans cette langue pralablement saisies ; de la mme faon les informations
botaniques sont valides par des botanistes. Les informations sur les utilisations font intervenir des
domaines diffrents et sont valides selon les comptences des valideurs.

Cette caractristique a pour consquence la dfinition prcise des domaines de comptence des
utilisateurs chargs de la validation des informations. Pour chacun de ces utilisateurs, sont donc mmoriss
(en plus du nom dutilisateur et du mot de passe) un ou plusieurs domaines de comptence (linguistique,
botanique ou utilisation). Pour la linguistique, il faut galement noter la langue de comptence, et pour les
utilisations le ou les types dutilisation concerns. Lors de ltape de validation, seules les informations
correspondant ses comptences sont proposes lutilisateur qualifi en validation.

Ces exigences aboutissent la dfinition de trois modes de fonctionnement du site :

4.2.1 Consultation
Tout Internaute peut consulter le site. Il accde aux informations pour toutes les espces. Il peut
consulter les informations botaniques et /ou linguistiques et /ou sur les utilisations.
Enguehard, C., Mbodj, C., "Recueillir et diffuser les noms des plantes dans les langues africaines". Les cahiers du RIFAL
n23 LE TRAITEMENT INFORMATIQUE DES LANGUES AFRICAINES, pp.47-54, novembre 2003.

4.2.2 Saisie
L'utilisateur s'identifie l'aide d'un nom d'utilisateur et d'un mot de passe pralablement dlivrs par
l'administrateur du site.

L'utilisateur peut :

ajouter une espce,

complter la description dune espce,

ajouter des composants des espces existantes,

ajouter ou complter des utilisations,

ajouter un nom une espce,

ajouter un exemple d'usage un nom,

ajouter un enregistrement audio,

complter la description dun nom,

ajouter une variante,

etc.

4.2.3 Validation
L'utilisateur s'identifie l'aide d'un nom d'utilisateur et d'un mot de passe pralablement dlivrs par
l'administrateur du site.

L'utilisateur est qualifi en botanique ou en linguistique ou pour les utilisations. Dans le cas de la
linguistique, il est qualifi pour une seule langue. Dans le cas des utilisations, il est qualifi pour une ou
plusieurs utilisations.

Ces utilisateurs valident selon leurs comptences les informations pralablement saisies par des
utilisateurs qualifis en saisie.

Une fois valides ces informations sont prsentes en consultation.

4.3 Difficults techniques


La technologie des autoroutes de linformation a t originellement dveloppe aux Etats-Unis, pays
anglophone. Comme la langue anglaise nutilise que les 26 caractres non accentus et sans signe
diacritique de lalphabet latin, cette technologie nest pas adapte aux autres alphabets. Ainsi, la plupart
des utilisateurs francophones du courrier lectronique ont-ils dj t confronts des messages dans
lesquels les caractres accentus sont dnaturs et ne saffichent pas correctement. Ces caractres ne sont
Enguehard, C., Mbodj, C., "Recueillir et diffuser les noms des plantes dans les langues africaines". Les cahiers du RIFAL
n23 LE TRAITEMENT INFORMATIQUE DES LANGUES AFRICAINES, pp.47-54, novembre 2003.

pas cods de la mme manire par tous les systmes, ce qui entrane ces difficults (Chanard et al., 2002).
Le rcent standard Unicode reprsente une avance considrable dans le domaine de la transmission
lectronique des informations puisquil fournit un codage unique pour chacun des caractres utiliss dans
le monde (y compris les idogrammes chinois par exemple).

Cependant, ce standard est rcent, et nous sommes encore confronts de nombreuses difficults
techniques dues lutilisation de caractres spciaux (comme le b cross : ; ou le n palatal : ) dans
certaines langues africaines :

ces caractres ne sont pas supports par la plupart des polices de caractres. Nous tenons donc
disposition des utilisateurs une police de caractres quils peuvent tlcharger en ligne. Cette
police de caractres est suffisante pour la plupart des langues africaines et permet davoir des
affichages sans dfaut lors de la consultation du site.

les caractres spciaux sont mal reprsents dans les formulaires utiliss lors de la saisie ou de la
validation des donnes. Nous sommes actuellement la recherche dune solution satisfaisante.

les caractres spciaux ne sont pas prsents sur les claviers des ordinateurs. Lutilisateur peut
saisir le code du caractre (par exemple ŋ pour le n palatal ), mais cette solution nest
pas ergonomiquement satisfaisante. Prochainement il sera possible de saisir un caractre spcial
en utilisant une combinaison de touches approprie.

4.4 Etat du site


Le site Flore est visible sur la toile ladresse http://www.sciences.univ-nantes.fr/irin/flore/.

Pour linstant il contient 30 plantes (uniquement des arbres et des arbustes), 9 illustrations, 165
noms de plantes dans 4 langues (franais, jola, pulaar, wolof, zarma), 17 rfrences bibliographiques et 4
utilisations. Les noms sont accompagns de 30 exemples dusage (en zarma).

Vous pouvez consulter, titre dexemple, la fiche dcrivant lespce Andansonia Digitata L.
annexe cet article.

5 PERSPECTIVES
Les perspectives de dveloppement de ce site sont multiples et concernent lextension de la base de
donnes et des fonctionnalits.

Concernant la base de donnes, les contacts avec des nutritionnistes nous ont convaincus de rajouter
les noms de certains composants comme les fruits pour les arbres fruitiers, ou la racine lorsquil sagit de
plantes dont la racine est comestible (comme la carotte).

Par ailleurs, nous envisageons dtendre ce site lensemble des plantes et toutes les langues
souhaites (sans nous limiter aux langues du Sahel) tout en privilgiant cependant le public africain.
Enguehard, C., Mbodj, C., "Recueillir et diffuser les noms des plantes dans les langues africaines". Les cahiers du RIFAL
n23 LE TRAITEMENT INFORMATIQUE DES LANGUES AFRICAINES, pp.47-54, novembre 2003.

Concernant les fonctionnalits, les premiers mois de fonctionnement du site ont montr la ncessit
dun espace dchange et de discussion entre les contributeurs du site (en saisie ou en validation). Cet
espace de discussion se matrialisera par ladjonction dun forum de discussion.

Les informations saisies peuvent tre modifies, voire rejetes lors de la validation, ces dcisions
seront notifies, voire expliques, aux auteurs de la saisie afin de permettre aux contributeurs de suivre le
devenir de leur contribution et les raisons des dcisions finalement prises. Cette communication entre les
contributeurs nous parat essentielle pour fidliser leur participation et tendre le contenu du site.

Nous ajouterons au site la possibilit dditer son contenu (en totalit ou partiellement) sous la
forme dun fichier au format XML pour intgrer facilement nos donnes dautres bases de donnes, et
sous la forme dun fichier mis en forme qui, imprim, permettra la diffusion de ces donnes hors du
monde lectronique.

CONCLUSION
Mme si le site flore est principalement ddi la linguistique, llaboration de ce site nous a donn
loccasion de travailler dans un cadre pluridisciplinaire en faisant collaborer informaticiens, linguistes de
plusieurs langues, ethnologues, botanistes, nutritionnistes, personnels de sant. Cette collaboration a
considrablement enrichi le site car nous avons essay de respecter chacune de ces disciplines en
modlisant la reprsentation des donnes aprs des discussions pousses avec chacun des interlocuteurs. Il
est apparu que chacun est comptent dans son domaine mais devient trs incomptent dans le domaine des
autres : typiquement, botanistes et nutritionnistes ne peuvent jouer le rle des linguistes (cest--dire
recueillir les noms des plantes dans les langues nationales), tandis que les linguistes sont absolument
incomptents pour dcrire finement une espce botanique. Pourtant les informations intressantes sont par
essence pluridisciplinaires : il ny a aucun sens connatre le nom dune plante sans savoir la reconnatre,
sans connatre ses utilisations, sans savoir la transcrire correctement.

Par ailleurs, le travail pluridisciplinaire, en faisant communiquer des professionnels de comptences


diffrentes, fait merger de nouvelles questions et exige des rponses claires pour lesquelles le spcialiste
du domaine concern doit faire un rel effort didactique vis--vis de ses collgues dautres disciplines.

Il est, peut-tre, permis desprer que le site sur la flore puisse contribuer efficacement la
prservation du patrimoine culturel et matriel de lAfrique, la protection de ses langues dont les
ressources ainsi recueillies sont mises la disposition des usagers et, enfin, la diversit culturelle de la
Francophonie.

En vrit, il reste que lappel de Dakar de mai 1989 sur les enjeux du multilinguisme. doit
tre entendu si on veut que lAfrique, par le virage culturel que permet de raliser Internet, puisse
sapproprier les sciences et les techniques.

Chantal Enguehard,
Institut de Recherche en Informatique de Nantes,
Nantes,
Enguehard, C., Mbodj, C., "Recueillir et diffuser les noms des plantes dans les langues africaines". Les cahiers du RIFAL
n23 LE TRAITEMENT INFORMATIQUE DES LANGUES AFRICAINES, pp.47-54, novembre 2003.

France,
chantal.enguehard@irin.univ-nantes.fr.

Chrif Mbodj,
Centre de Linguistique Applique de Dakar,
Dakar,
Sngal,
chembodj@ucad.refer.sn.

BIBLIOGRAPHIE
Bernard (Y.), White-Kaba (M.), 1994, Dictionnaire zarma-franais (Rpublique du Niger) . Agence de
coopration culturelle et technique, ISBN 92.90.28.208.8, Paris.

Chanard (C.), Popescu-Belis (A.), 2001. Encodage informatique multilingue : application au contexte du
Niger . Cahiers du Rifal, 22, p.33-45, dcembre.

Durand (C.-X.), 2002. La nouvelle guerre contre lintelligence II. La manipulation mentale par la
destruction des langues . O.E.I.L., F.X. deGuibert, Paris.

Fortin (D.), L (M.), Maynart (G.), 1997. Plantes mdicinales du Sahel . CECI 1990, ENDA 1990.
ISBN 2-920114-0-2.

von Maydell (H.-J.), 1983. Arbres et arbustes du Sahel, leurs caractristiques et leurs utilisations . GTZ.

Mbodj (Ch.), 1994, Lactivit terminologique au Sngal , dans Terminologies nouvelles, n 11, pp.3-9

Oumarou (I. A.), 2000. Zarma ciine kaamuusu kayna , Niamey, ACCT ; Editions Alpha.

Sager (J.), 1990. A pratical course in terminology processing, Amsterdam : John Benjamins Publishing
Company.

Sapir (E.), 1921. Le langage. Introduction l'tude de la parole :


http://www.uqac.uquebec.ca/zone30/Classiques_des_sciences_sociales/livres/Sapir_edward/langage/langage
.html.

www.unicode.org
Enguehard, C., Mbodj, C., "Recueillir et diffuser les noms des plantes dans les langues africaines". Les cahiers du RIFAL
n23 LE TRAITEMENT INFORMATIQUE DES LANGUES AFRICAINES, pp.47-54, novembre 2003.

ANNEXE

FICHE DE LESPCE ADANSONIA DIGITATA L.

PARTIE BOTANIQUE

Espce : Adansonia digitata L.

Famille : Bombacaceae

Synonyme : Adansonia sphaerocarpa A. Chev.

Type botanique : Arbre

Description : Arbre haut de 10 15 m, tronc norme atteignant plusieurs mtres de diamtre corce lisse
et gristre. Les branches sont trs robustes, peu nombreuses et tales.

Station : Terres lgres et sablonneuses ou terrains calcaires

Description des composants :

Feuille : Les feuilles sont composes, digites, alternes, ayant un nombre variable (6 8) de folioles
obovales longues de 10 15 cm et larges de 4 6 cm. Le ptiole est long de 10 20 cm ou
davantage.
Fleur : Les grandes fleurs blanches, larges de 15 20 cm, pendent l'extrmit d'un long pdoncule.
Elles s'panouissent le soir et sont fcondes par les chauve-souris.
Fruit : Les fruits subsphriques ou ovodes de 15 35 cm de long sont ligneux, verdtre bronz et
velouts. Ils contiennent de nombreuses graines noires arrondies, noyes dans une pulpe
farineuse blanche entremle de fibres rougetres. Le fruit mrit de janvier avril au Sahel. Sa
pulpe, gnralement blanchtre, mais pouvant tre jaune ou rose, appele "pain de singe", est
trs riche en acide ascorbique (vitamine C; de 169 270 mg pour 100 g de matire frache ou 73
mg vit. C. 100 g MS/pulpe) et en thiamine (vitamine B1 : 0,38 mg/100 g M.V.) ainsi qu'en
potassium et en glucose : on dit qu' volume gal elle est plus riche que l'orange en vitamine C.
Utilisation : culinaire : Quand on est fatigu, mcher la pulpe du fruit du baobab redonne vite
des forces. On peut mcher la pulpe et l'avaler, ou bien la dissoudre dans de l'eau pour faire
une boisson rafrachissante qui est employe quelquefois comme un succdan du lait. On
peut aussi dissoudre la poudre dans du lait. Cette boisson est quelquefois mlange la
"mrissa", sorte de bire de sorgho ferment trs commune au Soudan.
Enguehard, C., Mbodj, C., "Recueillir et diffuser les noms des plantes dans les langues africaines". Les cahiers du RIFAL
n23 LE TRAITEMENT INFORMATIQUE DES LANGUES AFRICAINES, pp.47-54, novembre 2003.

Partie linguistique

Franais
Nom baobab
Phontique [babab]
Rfrences bibliographiques :
Fortin Daniel, L Modou, Maynart Guy, "Plantes mdicinales du Sahel" CECI 1997, ENDA
1997. ISBN 2-920114-0-2, 1990.
von Maydell H.-J., "Arbres et arbustes du Sahel, leurs caractristiques et leurs utilisations",
GTZ, 1983.

Jola-ssulaalu?
Nom bubak
Rfrence bibliographique :
Sambou Pierre-Marie, 2001.

Pulaar
Nom owdi
Rfrence bibliographique :
Fal Arame, Santos Rosine, Doneux Jean Lonce, "Dictionnaire wolof-franais", Karthala,
1990.

Wolof
Nom guy
Phontique [guj]
Rfrences bibliographiques :
Berhaut Jean, "Flore du sngal", Dakar, ditions ClairAfrique, 1967.
Diaw Abdoul Aziz, "Vocabulaire de la Flore", Dakar, CLAD, 1981.
Saar llaaji Taalam, "Gstu ci wllu garab", tomes 1, 2, 3, Dakar, Sngalaise de
l'imprimerie, 1998.

Zarma
Nom koo
Phontique [ko:]
Rfrence bibliographique
Oumarou Boureima, Document interne, 2001.
Exemple d'usage :
Enonc : Hano ka koo ga wura hay, talka si duu goobu kana a catu.