Vous êtes sur la page 1sur 82

Enseigner la terminologie

pour quoi faire ?

1- Enseigner qui ?
Des spcialistes du traitement de la chane documentaire : traducteurs, rdacteurs, qui ne sont pas en principe des spcialistes des domaines dans lesquelles vont sexercer leurs activits.

Quel est ltat du mtier et quels outils informatiques sont actuellement disponibles ? Quelles sont les volutions possibles du mtier, quels nouveaux mtiers sont en germe ? Donc quelles comptences souhaitons nous dvelopper ?

2 - Une terminologie : pour en faire quoi et avec quels outils.


La pratique de la terminologie est lie aux applications auxquelles on la destine (traduction, thesaurus) et aux outils dont elle dispose pour grer la description de la langue et pour diffuser ses donnes

Une terminologie ad hoc


Dans tous les cas, le but du dictionnaire, cest dtre utile Monique Slodzian.

Le but nest pas la description et lanalyse des phnomnes de langue dans les langues de spcialit
Il faut se poser les problmes dapplication et de gestion en termes defficacit, de rsultats, et de gestion du temps et des cots.

3 - Une terminologie : pour qui ?


Qui va utiliser cette terminologie ? Une entreprise qui croit quun glossaire va rsoudre ses problmes de communications entre les diffrentes filiales ou les conflits hirarchiques ?

Une entreprise qui sest rendu compte que ses ressources documentaires taient inexistantes et quelle avait un besoin doutils de formation ou dinformation dintervenants ponctuels et de consultants ?

Une entreprise ayant entrepris une structuration smantique de ses documents concernant la fabrication ou la maintenance dans des domaines sensibles (nuclaire, aronautique, pharmacie) ?

Une entreprise ayant besoin de localiser ses produits (logiciels), de faire des documents qui seront ensuite traduits automatiquement ou par des quipes de traducteurs dont on peut esprer quils respecteront la cohrence terminologique.

Ou bien le traducteur free lance veut se constituer une mmoire de la terminologie quil utilise rgulirement et la coupler avec son outil de traduction assiste (ou ventuellement automatique) de stockage et dalignement des traductions ?

Ou encore le rdacteur qui souhaite contrler la cohrence terminologique des documents quil produit ou qui dsire se constituer une banque terminologique et phrasologique pour rdiger en anglais ou le chercheur qui veut une assistance pour la rdaction darticles en anglais.

Tous ces utilisateurs ont des besoins spcifiques qui justifient la cration dun dictionnaire spcialement adapt leurs besoins.

Donc il faut savoir valuer - les besoins (explicites et implicites) - les cots en temps, en matriel, les investissements court terme, les cots cachs, - la rentabilit : les conomies long terme.

3- Comment faire ?
FAIRE une terminologie, cest sapproprier un domaine

mais aussi cest reprsenter de manire explicite des connaissances plus ou moins implicites, plus ou moins partages.

donc se donner un outil de reprsentation dun domaine de connaissances et tablir une carte des concepts du domaine et des relations multiples entre ces concepts.

Lexigence de cohrence dans la description des concepts et de leurs relations oblige une appropriation du domaine qui suppose la consultation douvrages de vulgarisation, puis douvrages spcialiss et le dialogue avec des experts du domaine.

Cette reprsentation du domaine va ncessairement faire apparatre les diffrences de structuration notionnelle entre les experts. Stonner ou regretter ces diffrences de catgorisations des concepts serait tomber dans le pige de lobjectivisme et croire que le concept flotte au dessus du langage, indpendamment des langues, indpendamment des locuteurs et des situations dnonciation.

Par le biais de la construction du sens des termes partir des textes, on va faire apparatre sur le terrain que lutopie terminologique de lobjectivisme, de lexistence du concept hors langue est une utopie impossible.

pour cela, il faut savoir :


1 - chercher la documentation, la trier, lorganiser, pouvoir faire une typologie des textes et valuer la fiabilit des sources (forme/fond),

2 - chercher les experts, les contacter, les interroger (et comment ?), diapo 21../termino/cours1.htm#expert - avec quelles stratgies pour obtenir les rsultats escompts ? - en profiter pour diffuser une information sur la spcificit du travail du traducteur ou du rdacteur, ses comptences de linguiste, sa capacit synthtiser linformation, sa capacit faire affiner la formulation par lexpert, ET DONC sensibiliser les experts aux incohrences, imprcisions, diffrences dapproches et de point de vue et les sensibiliser la polysmie des termes.

Lexpert, le spcialiste, est partag entre des attitudes contradictoires Condescendance et mfiance, Intrt, Mconnaissance du mtier de traducteur et des risques du mtier , Sentiment dinscurit linguistique, Inquitude devant le jargon terminologique, Il apprcie dexposer ses connaissances en essayant de les organiser, Sil rencontre un autre expert, sil relit ses remarques, la situation peut devenir passionnante et donner lieu des changes et des confrontations de thories ou dexpriences, ou bien se transformer en guerre des chefs.

Donc il faut laborder avec douceur, respect pour son savoir


et savoir se faire respecter en tant que spcialiste langagier en donnant des preuves de ce quon avance et de lutilit des questions quon pose. Il faut savoir aussi faire parler lexpert, lui faire produire de la langue, lcouter parler, noter ce quil dit spontanment en situation, lorsquil na pas limpression quon lui demande ce quil FAUT dire mais seulement comment a marche.

Exemple N Interaction universit entreprise

Sabriter derrire lusager Lui faire valide r le choix des termes

Rsumons nous :
Formation la recherche documentaire (papier, lectronique, Web), Matrise des deux langues de travail et de la traduction technique, Conduite dentretien non directif, Analyse de la demande et de la situation des acteurs dans lentreprise,

Matrise doutils qui ne sont pas a priori les outils du traducteur : Powerpoint, Access, Dreamweaver, VBA, php, phpMyAdmin, Linux, expressions rgulires Perl

4 - La terminologie tait dans le texte et regardait le traducteur.


Avoir accs aux textes, cela veut dire voir comment cette modlisation des concepts du domaine se ralise dans la langue, pas a priori mais pour de vrai , telle quelle est mise en uvre dans le discours.

Un langagier travaille sur la production de discours et analyse les textes. Lvolution de loutil informatique fait que lon a de plus en plus accs des textes numriss.

Comment procder ?
1 - Analyser la source : Savoir qui parle, pour qui et pour quoi faire, toute la dimension pragmatique des textes qui nous renvoie des besoins de description des sources dont nous avons dj parl.

2 - Stocker : se constituer de grosses bases de ressources de corpus (monolingues, multilingues selon lobjet du travail, comparables ou aligns).

Analyser le texte de ces corpus avec des outils plus ou moins performants existant sur le march
savoir choisir les outils en fonction des besoins, les amliorer ( ?), les fabriquer ( ?).

Extraire la vole des candidats termes, Recueillir des fichiers de concordances, Travailler sur du texte tiquet (tiquet comment, avec quelles incertitudes), Travailler avec des expressions rgulires (analyser les rsultats, dvelopper des stratgies de recherche) Savoir demander des informaticiens de dvelopper les outils dont on a besoin.

DONC constituer un corpus et lanalyser Quel type de corpus ? Aligns ? Comparables ? Sur supports lectroniques tiquets ou non Exemples : White balance, 256 segment, Addon, README

Traduction spcialise
called

"White Balance" (WB, for short), which simply means the camera tries to keep white objects fairly white, balance: function that allows you to have natural colors by adapting the whites to the light.
white balance mode, control, compensation, system,department, thing

White

Candidats-termes:

when

you take the pictures because your brain will automatically white balance it.

White balance
EN: balance => FR: quilibre Pas dans le corpus appareil numrique

EN: white => FR: blanc

=> Balance des blancs

Validation d'un candidat terme

Recherche dun quivalent bien que lattestation de lquivalent ne soit pas dans le corpus.

Personnalisation dun dictionnaire machine

Readme addon
TE: non mots: README, addon
Catgorie

syntaxique: N

Links which Linux describes in the README are set up correctly


EN:

addon => FR: ????

The FWTK does not proxy SSL web documents but there is an addon for it written by Jean Le fwtk ne route pas les documents web SSL, mais il existe un module complmentaire

O en sommes-nous, lorsque toutes ces procdures sont en place ?


ce stade, le domaine a t explor, le corpus recueilli, les experts contacts, une base documentaire qui donne accs aux corpus a t cre (reste savoir o et comment).

MAIS on sest peut-tre aussi rendu compte que, dans certains cas, - la documentation nexiste pas, - les supports sont multiples, disperss, non disponibles. Dans la vraie vie, parfois, souvent, (toujours ?) - linformation ne circule pas, - la communication est erratique, - la terminologie incohrente, - les experts pas daccord sans mme le savoir.

Il va falloir rechercher linformation, convertir des fichiers, convaincre, user de diplomatie, tre pdagogue sans condescendance ni dogmatisme

Cest pourquoi il nous parat ncessaire de donner une formation une utilisation astucieuse et bricoleuse de linformatique,

et de la complter par une formation la conduite dentretien, lanalyse des besoins, lcoute.

5-De la thorie loutil et vice versa


Cette tude des termes tels quils sont, et non tels quils devraient tre, se revendique dune approche terminologique dans la ligne des travaux de Jennifer Pearson, de Rita Temmerman.

Cette approche va orienter des choix de reprsentation des termes et donc avoir une influence directe sur la structure des bases de donnes.

Lusage quon se propose de faire du dictionnaire va galement influencer le choix de loutil informatique, la structure de la description.

Nous avons maintenant les matriaux, il faut maintenant constituer la base terminologique proprement dite.

Construire la base, dfinir sa structure

Premire possibilit
on apprend utiliser Trados coupl avec Multiterm (ou SDLX, ou DjVu, ou autre avatar des outils daide la traduction). Pour un traducteur, il est vident quil faut absolument quil sache utiliser nimporte quel outil de cette gamme.

mais
(Mais la mmoire de traduction, cest bien sil y a une mmoire. Cest dire si dj de nombreux textes en langue source ont t aligns avec des textes en langue cible, rviss, fiables. Au dbut de la mmoire tait le premier texte traduire. Et pour le traduire, il fallait bien passer par toutes les tapes prcdentes.)

mais encore
Loutil de mmoire de traduction a ses avantages incontestables et incontournables dsormais dans certains domaines et dans certaines conditions de travail,

Il a aussi ses limites et ses aspects pervers quil faut savoir reprer, analyser et contourner.

Rsumons nous
Nous avons notre disposition des outils ddis la gestion de la terminologie, des outils qui permettent de stocker des termes, de les dcrire (bien ou mal), et de travailler en mme temps dans le texte de la traduction en y insrant la terminologie ou en prlevant des termes pour les stocker dans le dictionnaire. Il nest pas question de faire limpasse sur ces outils. Ils sont dautant plus importants quils permettent de stocker ce qui est aussi important que la terminologie dans une activit dcriture dans une langue de spcialit, cest--dire : la phrasologie, la capacit rhtorique, argumentative de la langue.

Deuxime possibilit
Deux types de raisons nous ont amens choisir aussi dautres outils pour faire de la terminologie

Raisons pdagogiques
ces outils ddis au stockage de la terminologie coupl la mmoire de traduction ne sont pas exigeants sur la structure : on peut y mettre tout et nimporte quoi, la vole, au feeling. Ils risquent dluder une rflexion sur la structure.

Raisons pratiques
Premire raison : ces outils ddis ne sont pas toujours disponibles, ils cotent cher, changent souvent, les utilisateurs ne matrisent pas leurs principes de fonctionnement et ont du mal les faire communiquer avec dautres systmes (comment rcuprer des donnes stockes sous Multiterm dans une base Oracle, comment rinjecter des donnes venues de Word).

donc
Il faut savoir bricoler selon les besoins des petits outils avec les ressources bureautiques disponibles partout mais aussi savoir rcuprer ces donnes pour les reverser dans les outils ddis, donc comprendre comment ils fonctionnent, les principes de leur structuration.

Deuxime raison pratique


Lapprentissage des bases de donnes relationnelles et de la reprsentation et structuration des donnes dans des tables oblige se poser des questions de fond : Quest-ce que je veux obtenir de ces donnes, quels tris, quelles extractions, pour quoi faire, pour qui ? Cet apprentissage de la modlisation, mme simple, est une introduction la structuration des connaissances, lexplicitation des relations.

Troisime raison pratique


Cest aussi une introduction aux langages de structuration smantique de linformation. Quand on a compris comment fonctionne une base de donnes relationnelle, on comprend vite lintrt du balisage XML, de la rdaction structure, du single sourcing. Cest toute la problmatique de la relation entre le sens et la structure qui est pose.

Le choix pdagogique est donc :


Faire sa base de donnes soi-mme pour apprendre structurer linformation et justifier ses choix. Cette dcision pose un gros problme : elle est en contradiction avec la ncessit de parvenir des formats dchange de terminologie.

Il faut choisir entre deux approches


Imposer une structure norme et ainsi communiquer et fusionner les ressources avec dautres terminologues/institutions et donc montrer aux apprentis terminologues que la terminologie est un travail de groupe et dchange (ce qui est formateur)

Ou bien
Enseigner la manipulation des bases de donnes couple pas pas avec lenseignement de la terminologie pour amener ltudiant faire des choix, prendre des dcisions, faire des compromis quil devra dfendre, prvoir comment il va grer la synonymie, la polysmie, aligner les collocations, faire de son dictionnaire un vrai outil intelligent.

Nous avons essay de concilier les deux dmarches.


En faisant construire une base de donnes (sous ACCESS ou sous MySQL ou autre) par chaque tudiant puis en leur demandant tous de verser une extraction de leurs donnes dans un moule commun rpondant aux exigences des formats dchange.

Pour cela nous avons labor une formation partiellement distance, sur le Web, avec suivi individuel de projet, o les choix faire sont chaque fois lobjet de discussions, de justifications.

Quelques exemples de ces pages : http://www.ens.eila.jussieu.fr/~juilliard

Notre but
Prparer nos tudiants tre autre chose que des excutants lis un outil dont le but est dacclrer leur production pour accrotre leur rentabilit. Nous souhaitons quils puissent voluer dans leur vie professionnelle, suivre les mutations des nouveaux marchs lis au dveloppement de la socit de linformation, se prsenter comme des experts de traitement de la chane documentaire, des consultants, des interlocuteurs respects.

cran1

Le but de lcran daccueil est de montrer les liens entre les diffrents cours qui convergent tous vers un mme but, comprendre, analyser les textes pour pouvoir crire et traduire avec prcision et naturel.

cran 2

cran 3

Le cours de terminologie est coupl avec loutil informatique : loutil base de donnes va voluer en rpondant aux besoins que lon va formuler au fur et mesure de la progression du cours

cran 4

cran 5

Loutil va obliger rpondre un certain nombre de questions de fond :


faut-il, prvoir de mettre plusieurs hyperonymes ? si oui cela veut dire que les catgorisations peuvent tre plurielles.

Ou bien
Les synonymes sont-ils des termes comme les autres ?

faut-il les mettre dans une table part ou faut il les ranger dans la table terme ; et alors faut-il dcider quel est le terme vedette ? (dans quelles conditions, pour quoi faire).

La rponse la question a dpend .

Ou bien
Les liens indirects entre les termes sont-ils plus clairants que les relations logiques ou ontologiques ?

et dans ce cas comment faut-il les reprsenter, comment veut-on les exploiter ultrieurement ?

cran 6

Ou encore
Les fichiers de concordance que nous avons extraits de corpus vont nous servir faire les collocations, lenvironnement privilgi du terme, qui va nous fournir la phrasologie du domaine et nous permettre de fabriquer un vrai outil de rdaction et de traduction.

Aide la rdaction
Tenir compte de la situation de communication: anglais pour francophones Base de donnes bilingues dans un domaine spcifique Typologie dans le but dautomatiser Baser sur des corpus

Langue spcialise: STU


LP events to be more likely to develop into an energetic swarm in explosive systems supporting strong pressurization, than activity soon evolved into an intense swarm that lasted 23 hours and terminated manifest itself in an energetic LP swarm , whereas a leaky system the source of the LP swarm . Petrological data provide to indicate in the swarm sequence, the outstanding features of the swarm were recognized [2], as the sequence the initiation of the swarm may be interpreted as and the 1982 eruptions of El Intense swarms of LP Precursory LP swarms were recognized per day over a two-week period Examples of weak LP swarms were those Two outstanding examples of precursory swarms of long-period events Japan [14-16]. Swarms of long-period events also preceded the

Collocations du verbe
Prcision pour lextraction des noms
Meilleure identification des constituants de phrase dans un corpus Illustration : (a) to boot [a Linux kernel] on [a CD ROM] * Linux kernel on a CD ROM to boot on a CD ROM / Linux kernel (b) to give [the compiler] [hints] about how to optimize *compiler hints to give hints / compiler

Extraction automatique
Contexte ambigu
to run programs in virtual terminals => program? run?

Contexte non ambigu: un seul gouverneur


Dosemu has to be run in another terminal compile and run in double precision mode why not run in a Linux box your NIS slaves

=> Productivit:
(run, in {terminal, mode, box}) : occurrences dans le corpus (run, in) : productivit = 3 to run different programs in virtual terminals

Quelle structure de tables pour les collocations Comment faut-il les ranger, selon quels critres ?
Sil y en a beaucoup, le champ risque de devenir illisible,

comment range-t-on les exemples dans un dictionnaire unilingue ? et dans un dictionnaire bilingue ? quest-ce qui va faciliter la lecture du futur utilisateur de ce dictionnaire ?

Ce ne sont que quelques exemples. Il y en a bien dautres. Le principe est que chaque champ est loccasion dune rflexion sur toutes les questions que nous avons voques.