Vous êtes sur la page 1sur 16

Les apports possibles de la phrasologie la didactique des langues trangres

Mojca Pecman
p. 109-122
Rsum

L'article explore les avantages d'une analyse phrasologique du discours scientifique


face aux difficults de la matrise des formules conventionnelles de ce genre dans une
langue trangre, en l'occurrence en anglais. Notre recherche postule en effet
l'existence d'une langue commune aux scientifiques, une langue qui transcende les
disciplines, et dsormais, grce l'anglais, les continents. Pour observer les
caractristiques de cette Langue Scientifique Gnrale un corpus parallle a t mis
en place recueillant des textes de trois domaines connexes : la chimie, la physique et
la biologie. Le dpouillement de ce corpus a abouti une base de donnes
phrasologiques dont les principes qui ont guid la construction assurent sa
rutilisabilit, notamment pour la ralisation d'applications concrtes destination
des apprenants. L'article prsente un projet de construction d'un dictionnaire
phrasologique multifonction offrant un double accs aux units phrasologiques
(UP), un accs via la forme des UP (fond sur une approche smasiologique de la
langue) et un accs via le sens des UP (fond sur une approche onomasiologique de la
langue).
Haut de page

Entres d'index

Rubriques :
Recherche
Haut de page

Plan

1. Introduction
2. Phrasologie et TAL
2.1. Une histoire parallle
2.2. Limites du TAL au niveau phrasologique de la langue
3. Phrasologie du discours scientifique
3.1. Langue Scientifique Gnrale : un postulat
3.2. Intrt des tudes phrasologiques de la LSG
3.3. Historique des travaux en LSG
3.4. "Traquer" les UP de la LSG ?
3.5. Stocker les UP de la LSG
3.6. Spcificits de la phrasologie scientifique
4. Un outil d'aide la matrise du niveau phrasologique de la LSG
4.1. Dictionnaire phrasologique de la LSG
4.2. Thsaurus phrasologique de la LSG
5. Conclusion
Haut de page

Texte intgral
PDF 724kSignaler ce document
1. Introduction

1En Europe occidentale et en France tout particulirement, la phrasologie constitue


un domaine de recherche gnralement encore assez peu connu. Son volution,
directement lie au dveloppement de la linguistique de corpus et du traitement
automatique du langage (TAL), va toutefois grandissant depuis les annes quatre-
vingt-dix. Dans cet article, la phrasologie est exploite pour la construction d'outils
d'aide l'apprentissage des langues. L'tude explore le cas du discours scientifique et
des difficults de la matrise des formules conventionnelles de ce genre dans une
langue trangre, en l'occurrence en anglais. Par ailleurs, un postulat se trouve au
centre de cette tude : l'existence d'une langue commune aux scientifiques travers
les disciplines, et dsormais, grce l'accession de l'anglais au statut de lingua
franca des sciences, travers le monde. Pour observer les caractristiques de cet
univers linguistique un corpus a t mis en place recueillant des textes de domaines
scientifiques varis. Le dpouillement de ce corpus a abouti une base de donnes
phrasologiques rutilisable.

2Le premier chapitre explore l'interaction entre le TAL et le domaine de la


phrasologie. Le deuxime chapitre s'articule autour de la dfinition du concept de
Langue Scientifique Gnrale (LSG) et du traitement de la phrasologie relative cet
univers linguistique particulier. Ce chapitre donne par ailleurs lieu une discussion
sur les intrts des tudes phrasologiques de la LSG et il prsente les travaux dj
existants sur ce sujet. Le troisime chapitre explore l'une des possibilits
d'exploitation des donnes phrasologiques obtenues au terme de la collecte pour l
ralisation d'applications concrtes.

2. Phrasologie et TAL

2.1. Une histoire parallle


1 Bien que le domaine de la phrasologie souffre encore de nos
jours d'une terminologie assez floue e (...)

3La linguistique de corpus et le TAL en gnral ont jou un rle dcisif dans
l'volution de la phrasologie, domaine la frontire de la lexicologie et de la syntaxe
qui se consacre l'tude des combinaisons de mots rcurrentes e arbitraires souvent
appeles "collocations" ou "units phrasologiques" (UP)[1]. Bien qu'elles
constituent des lments constants du discours, les combinaisons de mots lexicalises
n'en demeurent pas moins des lments subliminaux du langage se refusant tout
reprage facile. Souvent absentes des dictionnaires traditionnels, elles parsment le
discours d'effets de "dj entendu" et ne se prsentent pas l'esprit distinctement
comme des units minimales de la langue. La prolifration de corpus textuels
informatiss, ainsi que de programmes pour leur exploitation, a apport une rponse
cette difficult en rendant possible le reprage des squences de langue
rcurrentes :

The increasing use of computer-held text corpora containing many millions of


words has allowed linguists to establish lexico-grammatical patterns in language
that were previously unavailable to observers. ([Gledhill00] : 115)

4Alors que dans les autres disciplines de la linguistique, l'apport des corpus et du
TAL consiste principalement en un gage d'objectivit, en phrasologie les corpus
apparaissent comme les piliers mme de la recherche, puisque eux seuls permettent
en effet de confirmer le statut phrasologique de certaines constructions
polylexicales. Comme Habert et al. le remarquent :

(...) tant donn une expression juge "contrainte" quant ses possibilits de
transformation, les corpus permettent de chercher si ses ralisations effectives
confirment ce jugement. ([Habert97] : 57)

2 Cette mthode d'investigation des amalgames de mots lexicaliss


est sous-tendue par l'interprtatio(...)

5Par exemple, il n'est pas toujours ais de dterminer si une squence aussi banale
que to start a car constitue une combinaison libre d'lments lexicaux ou une
combinaison restrictive. premire vue, il semble s'agir d'une construction libre
tant donn que ses lments constitutifs, le verbe start et le nom car, possdent tous
les deux des paradigmes combinatoires trs tendus (to start [a lesson/ a play/ a
book/ studying/ cooking/ singing/...], to [buy/ drive/ wash/ lend/ break/ look at/...]
a car). Toutefois, grce au TAL et aux mthodes de la statistique lexicale, il est
dsormais possible de connatre la probabilit de leur apparition mutuelle et
d'affirmer leur statut phrasologique. Par exemple, selon les rsultats fournis par
le Collins Cobuild corpus, la probabilit d'apparition de l'unit start au voisinage de
l'unit car est significativement forte : 8,6 %.[2]

6Souvent, l'observation d'autres langues permet de confirmer le statut avr d'une


UP moyennant une interrogation de corpus, puisque dans le cas des vraies UP la
traduction mot mot est souvent impossible : *commencer une voiture est
effectivement inacceptable en franais, de mme que l'est*zapoeti auto (traduction
littrale) en croate. Le choix arbitraire de la collocation devient vident puisqu'en
franais on dira dmarrer une voitureet en croate upaliti auto (litt. "allumer la
voiture").

2.2. Limites du TAL au niveau phrasologique de la langue

7Les techniques pour le traitement automatique de corpus servant l'identification


des UP utilisent des mthodes statistiques qui s'appuient sur des modles
mathmatiques solides. Malgr leur rigueur scientifique, les rsultats obtenus au
moyen de ces techniques pointent trois dfauts majeurs de ce type de mthode
lexicographique : l'exclusion des UP frquence faible, le recensement possible des
amalgames ne constituant visiblement pas des UP et l'absence de toute catgorisation
des ressources linguistiques obtenues.

8Dans le cadre du traitement automatique de corpus textuels, il existe un grand


risque de ngligence des modles qui font visiblement (ou intuitivement) partie de la
phrasologie, mais dont la frquence n'est pas significative. Par exemple, dans sa
qute des collocations partir d'un corpus de textes du domaine des sciences et
technologies de l'information, Curado ([Curado01] : 112) relve les units suivantes
comme ayant une frquence trs faible : first and foremost, diskette drive et ticket
booth. Les lexicologues ont l'habitude de grer ce type de problme de faon
rhabiliter ces units dans leurs listes d'tude afin qu'elles reoivent le mme
traitement que les units de haute frquence. De manire analogue, les units
polylexicales haute frquence qui ne constituent visiblement pas des UP (par ex. we
accurately, access which) sont rgulirement radiques de ces mmes listes.

9Enfin, les techniques pour le traitement automatique de corpus offrent comme seul
rsultat combinaisons de mots qui sont vraisemblablement des collocations. Elles ne
sont pas capables de classer ces combinaisons suivant une typologie. Par exemple,
des squences aussi diverses que to result in,quite possible et so as to apparatront
toutes dans une liste sans aucune information discriminatoire supplmentaire et sans
aucune mise en relation des UP smantiquement ou autrement proches. Or, une
classification, par exemple selon le rle jou par les UP dans le discours (cf. exemple
1) ou encore selon la notion laquelle elles renvoie (respectivement "aboutissement",
"probabilit" et "objectif") faciliterait grandement la manipulation des donnes
recueillies par la suite, notamment dans le cadre de la cration des applications fins
didactiques.

10Exemple 1

- avoir pour rsultat -> to result in (fonction prdicative) ;


- fort possible -> [very / easily / quite] possible(fonction
adjectivale) ;
- en vue de <qch> -> so as to <do sth>, with a view to <(doing)
sth> (fonction adverbiale) ;

11Par consquent, tout traitement automatique de la phrasologie ncessite une


relecture manuelle des rsultats obtenus au terme de l'exploitation du corpus.

3. Phrasologie du discours scientifique

3.1. Langue Scientifique Gnrale : un postulat

12Notre recherche dfend l'ide de l'existence d'une langue commune aux


scientifiques indpendamment de leurs spcificits disciplinaires et de leur origine
linguistique, langue que nous avons dcid d'appeler "Langue Scientifique Gnrale"
(LSG). Dans notre qute de la dfinition de cet univers linguistique particulier, nous
avons prfr, l'instar de Williams [Williams99], remplacer les notions de "sous-
langage", de "langues de spcialit" et de "plurisystmes" (telles qu'elles sont dfinies
par ([Lerat95] : 11, 28) et ([Habert97] : 148-152)) par la notion de "communaut de
discours", introduite par Swales ([Swales90] : 1 et passim). Alors que les premires
sont souvent prcises selon des paramtres sociolinguistiques, Swales dcrit
communaut de discours sur des bases socio-rhtoriques. En ce sens, la LSG peut
tre dfinie en tant que : pratique langagire spcifique une communaut de
discours compose de chercheurs en sciences exactes dont les objectifs
communicatifs poursuivis manent des proccupations partages par des
scientifiques travers le monde et indpendamment de leurs spcif disciplinaires.

13L'emploi de plus en plus rpandu d'une seule langue, l'anglais, travers le monde
pour les besoins communicatifs de cette communaut de discours, est la preuve
indniable de sa cohsion.

14Par consquent, notre tude se situe dans la ligne des travaux mens sur le
"Vocabulaire Gnral d'Orientation Scientifique" (VGOS) par Phal. Sa dfinition du
VGOS nous conforte dans notre point de vue :

Le vocabulaire scientifique gnral est (...) commun toutes les spcialits. Il sert
exprimer les notions lmentaires dont elles ont toutes galement besoin (mesure,
poids, rapport, vitesse, etc.) et les oprations intellectuelles que suppose toute
dmarche mthodique de la pense (hypothse, mise en relation, dduction et
induction, etc.) ([Phal71] : 9)

15Rappelons que dans la tradition linguistique anglo-saxonne, on rfre parfois


l'univers linguistique vis dans cette tude en termes de English for Science and
Technology (EST) ou encore en termes de English for Academic Purposes (EAP).

3.2. Intrt des tudes phrasologiques de la LSG

16La matrise de la phrasologie scientifique, de mme que celle de la terminologie,


apparat comme un facteur non ngligeable de la pertinence de la communication
scientifique. Pourtant le respect des conventions en matire de phrasologie
scientifique n'est pas toujours ais. Dans le cadre de la LSG, ce constat est d'autant
plus valable que pour un grand nombre de scientifiques il s'agit de manipuler une
langue trangre. En effet, de nos jours l'anglais joue le rle de lingua franca de la
communication scientifique internationale. Dans les sciences dites dures, les chiffres
le confirment : 85,7 % de publications en anglais pour la biologie, 84,6 % pour la
physique, 66,9 % pour la chimie ([Baldauf83] : 99).

3.3. Historique des travaux en LSG


3 Dans le cadre du projetCONPHRAS-PROCOP par exemple,
Grciano ([Grciano97] : 34) analyse la fois (...)

17Le nombre de travaux, dans les milieux anglophone et francophone, qui


s'intressent aux langues de spcialit et au discours scientifique plus
particulirement est consquent. Toutefois ce nombre diminue considrablement si
l'on value leur intrt pour la phrasologie. L'analyse systmatique de la
phrasologie scientifique est au cur d'une petite poigne de travaux, ceux de
[Grciano97], [Gledhill00], [Williams99] et [LuzonMarco00] principalement. Il est
important de noter que ces travaux n'abordent pas la phrasologie de la LSG par le
biais d'une analyse croise de plusieurs disciplines scientifiques. Les travaux de
Gledhill, Williams et Luzon Marco traitent un seul domaine ou thme scientifique la
fois (respectivement, la recherche sur le cancer, les plantes parasites et le domaine
mdical). En ce qui concerne les travaux de Grciano, ils sont davantage orients vers
la phrasologie des langues de spcialit de manire gnrale, phrasologie qui se
trouve rgulirement aborde en regard de la langue commune[3]. Bien que les
tudes thme impliquent une certaine pluridisciplinarit, elles n'abordent pas la
LSG de manire directe et explicite. Leur apport pour ce genre de recherche est
toutefois de taille puisque, de par la nature mme des phnomnes collocatifs, leurs
observations sont diriges vers les assemblages lexicaux les plus rcurrents qui
peuvent apparatre dans d'autres thmes, d'autres disciplines et qui peuvent, de ce
fait, faire partie de la LSG.

3.4. "Traquer" les UP de la LSG ?

18Pour localiser les UP relatives la LSG, un corpus bi-textuel a t mis en place. Ce


corpus, d'une taille de 82 800 mots, rassemble des textes de trois domaines
connexes : la chimie, la biologie et la physique. Un des critres principaux de
slection de nos textes tait leur disponibilit dans les deux versions, anglaise et
franaise. En dfinissant ce critre, nous avons voulu rendre possible l'tude
contrastive de la langue scientifique dans son usage. La taille relativement petite du
corpus est un fait voulu. En effet, le corpus devait rester l'chelle d'une exploitation
manuelle des donnes. Celui-ci a pu ainsi subir une double lecture : une premire
lecture automatique par le biais du logiciel ZText [Zingl98] et une deuxime lecture,
manuelle. Les rsultats des ces deux lectures ont t confronts. Les UP retenues ont
t celles qui rpondaient aux critres de slection prtablis, savoir la frquence, la
rpartition ( travers les domaines) et la rexploitabilit des units releves. Notre
hypothse est la suivante : si une combinaison de mots connat un emploi ritr
travers les trois domaines scientifiques, elle est susceptible de faire partie de la LSG.
Quant au critre de rexploitabilit, il est li directement notre objectif de
recherche, savoir la cration d'outils d'aide l'apprentissage des langues trangres.
L'tape de la collecte des donnes phrasologiques a t suivie par une tape
d'tiquetage des donnes (cf. infra) ainsi que par une tape de vrification et
d'enrichissement de la base (consistant en une valuation des donnes par des
locuteurs natifs et en une confrontation des donnes diverses ressources
linguistiques telles que les dictionnaires phrasologiques ou autres existants).

19Une unit de traduction (UT) consiste en une UP anglaise ou une srie d'UP
anglaises laquelle se trouvent associs son ou ses quivalents en franais. La
prsentation des UT reflte le processus de leur collecte avec l'anglais comme langue
source et le franais comme langue cible (ex. this work is an outgrowth of -> ce travail
dcoule de) mais, de temps autre, l'anglais prend la place de la langue cible pour
mettre en avant la perspective d'aide la rdaction (ex. ce travail dcoule de -> this
work is an outgrowth of).

4 En effet, une unit comme : description [dtaille / prcise /


minutieuse / exhaustive]-> [detaile (...)

20 l'issue de ces deux tapes, la base de donnes actuelle comporte quelque 2000
units de traduction (UT), sans la prise en compte des variations paradigmatiques
possibles l'intrieur des UT qui augmenterait sensiblement le nombre total des UT
minimales[4]. Elle sert de point de dpart notre tude du systme phrasologique
de la LSG et notre rflexion sur les possibilits de cration d'un dictionnaire
phrasologique bilingue.

3.5. Stocker les UP de la LSG

21Les UP de la LSG sont stockes dans une base de donnes dont la rutilisabilit est
assure grce l'tiquetage des donnes. Un jeu de six tiquettes a t dvelopp
pour les besoins de la recherche : tiquet fonctionnelle, tiquette qualificative,
tiquette notionnelle, tiquette du domaine scientifique, tiquette de l'exemple et
tiquette de la rfrence bibliographique. Celles qui rpondent directement aux
besoins applicatifs de cette recherche sont l'tiquette fonctionnelle et l'tiquette
notionnelle (voir ce sujet [Zingl03]).

22L'tiquette fonctionnelle est intressante du point de vue de l'utilisation de la


langue parce qu'elle apporte une information sur le rle jou par l'UP dans le discours
(cf. exemple 2).

23Exemple 2

- valeur de quantifieur (a wide range of -> une vaste gamme


de) ;
- valeur qualitative (well-known -> bien connu) ;
- valeur adverbiale (within the framework of -> dans le cadre
de) ;
- valeur de connecteur (as expected -> comme prvu,comme on
s'y attendait) ;
- valeur prpositionnelle (with respect to -> en ce qui
concerne, par rapport ) ;
- valeur prdicative (to address a question ->soulever une
question) ;
- etc.

24Paralllement, l'tiquette notionnelle apporte une information sur le sens de l'UP


et peut constituer un accs aux UP, facilitant ainsi la formulation du sens dans la
langue seconde. Au total, 125 tiquettes notionnelles ont t mises en place,
apportant une preuve de l'homognit de l'univers linguistique observ (seulement
6,6 % du corpus phrasologique n'a pas pu tre class dans des grands thmes
identifis ce stade de la recherche).

3.6. Spcificits de la phrasologie scientifique

25L'analyse des donnes phrasologiques collectes selon la mthode dcrite dans la


section prcdente indique que l'univers phrasologique relatif la LSG est
caractris par un type d'UP bien dtermin. Si l'on se rfre au modle dominant de
la typologie des UP [Pecman04], propos par des linguistes comme Howarth
[Howarth96], Cowie [Cowie98], Mel'uk [Melcuk93] ou encore Hausmann
[Hausmann84], il s'avre que la plupart des units phrasologiques collectes entrent
dans la catgorie des "collocations restrictives", catgorie laquelle de nombreux
linguistes rfrent d'ailleurs sous le terme simple de "collocations".
26Les idiomes purs tels que vendre la mche, casser sa pipe, avoir du pain sur la
planche, etc., n'apparaissent jamais dans le discours scientifique. Ce type d'units est
d'ailleurs d'une manire gnrale plutt rare dans la langue crite. De plus, on ne
trouve gure dans notre corpus d'idiomes figuratifs commesortir du lot, tourner au
vinaigre, c'est dans la poche, etc., si ce n'est quelques UP lexicalises dont l'image est
devenue compltement opaque, comme celles qui gravitent autour des thmes
de light ou step (cf. exemple 3).

27Exemple 3

- in the light of -> la lumire de, compte tenu de ;


- to shed further light on <sth> -> clairer (<qn>) sur <qch> ;
- to spotlight <sth> -> mettre <qch> en lumire,souligner ;
- to bring to light -> dcouvrir ;
- as a first step -> comme premire tape ;
- to take steps -> prendre des mesures ;
- to be a key / an important step -> tre une tape
importante /
cl ;
- to remain in step with <sth> -> suivre le rythme de <qch>.

28Ainsi, la phrasologie de la LSG consiste principalement en un tablissement


d'associations privilgies entre les units lexicales (UL), associations observes dans
des paradigmes (clusters) tels que, par exemple, ceux qui gravitent autour de la
notion d'|hypothse|, dont un extrait est donn dans l'exemple 4.

29Exemple 4

- [btir / construire] une hypothse -> to construct a


hypothesis ;
- adopter une hypothse -> to [accept / agree with] a
hypothesis ;
- confirmer une hypothse -> to [confirm / prove / support] a
hypothesis ;
- [corroborer / renforcer] une hypothse -> to [consolidate /
strengthen] a hypothesis ;
- dans l'hypothse de / o -> in case of, in the event of ;
- [dmentir / contredire] une hypothse -> to [invalidate /
refute] a
hypothesis ;
- carter l'hypothse de -> to rule out the possibility of ;
- [mettre / formuler / avancer / suggrer] une hypothse -> to
[putforward / put forth / advance / formulate / suggest] a
hypothesis ;
- faire des hypothses (sur) -> to speculate (about) ;
- proposer une hypothse -> to [invoke / propose] a
hypothesis ;
- hypothse directrice -> main hypothesis ;
- hypothse plausible -> plausible hypothesis.
30Toutefois, les limites entre les diffrentes catgories d'UP ne sont pas toujours
faciles tablir, notamment celles qui sparent les collocations restrictives des
combinaisons libres. Les UP de notre base de donnes s'approchent ainsi parfois
sensiblement de ce que l'on pourrait appeler, l'instar de Gross, des "classes
d'objets" :

Les domaines d'arguments de prdicats (verbaux, nominaux ou adjectivaux), quand


ils sont libres, peuvent tre exprims en termes de classes d'objets (...) et non
d'units lexicales. (...) Le verbe ressemeler a comme objet un lment de la classe des
chaussures (soulier, sandale, botte, etc.). Le verbe lire est caractris par deux types
de classes : celle des textes (rcit, dissertation, roman, rdaction, pome, article,
etc.) et celle des supports de textes (livre, journal, cahier, brochure, etc.)
([Gross96] : 78-79)

31Aprs avoir expos la mthode de collecte des UP qui constituent le fond


phrasologique commun des sciences exprimentales et aprs avoir dcrit leurs
spcificits fondamentales, prsenterons une rflexion sur les possibilits
d'exploitation de la base de donnes phrasologiques pour la construction d'outils
d'aide l'apprentissage des langues trangres.

4. Un outil d'aide la matrise du niveau phrasologique de la LSG


5 Ce projet est actuellement en cours de ralisation l'universit de
Nice-Sophia Antipolis.

32Un des outils qui pourrait rpondre le mieux aux difficults que connaissent les
locuteurs non natifs face aux constructions de mots rcurrentes et arbitraires se
prsente, notre avis, sous forme d'un dictionnaire phrasologique multifonction.
Celui-ci se compose de deux volets : un volet qui propose une approche
smasiologique du vocabulaire phrasologique (le dictionnaire phrasologique
proprement dit) et l'autre qui offre une approche onomasiologique du mme
vocabulaire (le thsaurus phrasologique).[5]

33Un tel projet tend ainsi fournir des rponses concrtes qui pourraient faciliter
l'apprentissage des langues trangres. En ce sens, notre travail partage les
proccupations des chercheurs en didactique des langues trangres ([Cohen90] ;
[Ellis94] ; [Lessard97]) et plus spcifiquement celles des chercheurs qui abordent la
question de la production en langue trangre dans l'univers des connaissances
scientifiques ([Bowers95] ; [Histon03]). En effet, les connaissances phrasologiques
sont souvent vues comme prsentant un obstacle davantage dans le processus
d'encodage que dans le processus de dcodage de la langue.

4.1. Dictionnaire phrasologique de la LSG

34Le dictionnaire phrasologique de la LSG est sous-tendu par une approche


smasiologique de la langue permettant de connatre la traduction d'UP recherches
dans la langue cible (cf. Figure 1). En effet, toute mise en relation des units lexicales
de deux ou plusieurs langues passe par comprhension du contenu smantique
spcifique des UP et de leur distribution dans la langue donne. Par consquent,
l'appariement des UP bilingues quivaut au processus de dfinition des UP dans la
perspective monolingue.

35Le dictionnaire phrasologique bilingue devrait permettre en outre de consulter


les donnes partir de n'importe quel mot contenu dans l'expression recherche, afin
de faciliter l'accs aux UP [Zingl03].

Figure 1 - Maquette pour la cration d'un dictionnaire phrasologique.

Agrandir Original (jpeg, 40k)

4.2. Thsaurus phrasologique de la LSG

36L'approche onomasiologique de la langue apparat comme une rponse aux


problmes de formulation de sens dans la langue seconde. Un des principaux
obstacles auxquels se trouvent confronts les locuteurs non natifs est la difficult que
l'on a parfois trouver une forme linguistique prcise pour exprimer une ide
[Zingl96].

37Notre thsaurus est sous-tendu par une ontologie de la LSG labore pour les
besoins de la recherche. tant donn que le seul point d'accs au sens possible
demeure les UL, la recherche dans le thsaurus est assure via les mots-cls (cf.
Figure 2).

Figure 2 - Maquette pour la cration d'un thsaurus phrasologique.


Agrandir Original (jpeg, 47k)

38Un tel outil pourrait trouver des applications pdagogiques intressantes non
seulement en tant que simple rpertoire bilingue des units lexicales complexes
permettant de retrouver facilement les quivalents dans les deux langues, mais aussi
en tant que source potentielle de donnes utiles pour la cration d'exercices destins
l'enseignement systmatique des paradigmes combinatoires des UL dans la langue
seconde. D'ailleurs, le regroupement des UP formellement diffrentes mais ayant un
sens proche, ralis grce l'approche onomasiologique des UP, permet d'ores et dj
d'envisager la construction de fiches de vocabulaire thmatiques qui pourraient
constituer une aide utile aux apprenants dans le processus d'acquisition de la
comptence phrasologique de la langue seconde.

5. Conclusion

39La prsente tude montre que l'approche phrasologique de la langue offre de


nombreuses perspectives pour la cration d'outils d'aide l'apprentissage des
langues. Face la difficult que prsente le maniement des collocations restreintes
pour les locuteurs non natifs, les outils recensant les UP bilingues offrent des
solutions concrtes et pertinentes. Dans le cadre du discours scientifique, de tels
outils sont d'autant plus bienvenus que l'efficacit de la communication scientifique
repo grandement sur le respect des conventions en matire de phrasologie. Le projet
de cration dictionnaire phrasologique multifonction rpond aussi une absence
gnrale l'heure actuelle de dictionnaires phrasologiques bilingues. Enfin, bien que
l'investigation de la phrasologie scientifique prsente dans cet article repose sur
l'analyse d'un corpus textuel relatif aux sciences exprimentales, les UP releves
semblent dpasser largement ce cadre. Le caractre trs gnral des UP recenses
suggre leur pertinence dans le cadre global des sciences exactes, voire dans le cadre
des sciences humaines et sociales, corroborant ainsi notre hypothse de l'existence
d'une LSG.

Haut de page

Rfrences

Les liens externes taient valides la date de publication.

[Baldauf83]
Baldauf, R. B. & Jernudd, B. H. (1983). "Language of Publications as a Variable in Sc
Communication". Australian Review of Applied Linguistics, vol. 6, 1. pp. 97-108.

[Benson89]
Benson, M. (1989). "The Structure of the Collocational Dictionary".International
Journal of Lexicography. vol. 2, 1. pp. 1-14.

[Bowers95]
Bowers, R. (1995). "A Computer-Mediated Scientific Writing Program". TESL-EJ, vol.
1, 3, A-3. http://www.kyoto-su.ac.jp/information/tesl-ej/ej03/a3.html

[Cohen90]
Cohen, A. (1990). Language Learning: Insights for Learners, Teachers, and
Researchers. New York: Newbury House.

[Cowie98]
Cowie, A. p. (1998). "Introduction". In Cowie, A. p. (dir.) Phraseology: Theory,
Analysis, and Applications. Oxford: Oxford University Press. pp. 1-20.

[Curado01]
Curado, F. A. (2001). "Lexical Behaviour in Academic and Technical Corpora:
implications for ESP development". Language Learning & Technology, vol. 5, 3.
pp. 106-129.

[Ellis94]
Ellis, R. (1994). The Study of Second Language Acquisition. Oxford: Oxford
University Press.

[Gledhill00]
Gledhill, Ch. J. (2000). Collocations in Science Writing. Language in performance:
22. Tuebingen: Gunter Narr Verlag.

[Grciano97]
Grciano, G. (1997). "Collocations rythmologiques". Meta, vol. 42, 1. pp. 33-44.

[Gross96] Gross, G. (1996). Les expressions figes en franais : noms composs et


autres locutions. Paris / Gap : Ophrys, coll. "L'essentiel franais".

[Habert97]
Habert, B., Nazarenko, A. & Salem, A. (1997). Les linguistiques de corpus. Paris :
Armand Colin, coll. U.
[Halliday66]
Halliday, M. A. K. (1966). "Lexis as a linguistic level". In Bazell, Ch. E., Catford, J. C.
Halliday, M. A. K. & Robins, R. H. (dir.). In Memory of J. R. Firth. London/Harlow:
Longmans. pp. 148-162.

[Hausmann84]
Hausmann, F. J. (1984). "Wortschatzlernen ist Kollokationslernen. Zum Lehren und
Lernen franzsi Wortverbindungen". Praxis des neusprachlichen Unterricht, vol. 31.
pp. 395-406.

[Histon03]
Histon, C. (2003). "Writing Scientific Project Applications for Peer Review".The
Internet TESL Journal. vol. 9, 8. http://iteslj.org/Articles/Histon-
ProjectApplications.html

[Howarth96]
Howarth, p. A. (1996). Phraseology in English Academic Writing: Some
Implications for Language Learning and Dictionary Making. Tbingen: Niemeyer.

[Lerat95]
Lerat, p. (1995). Les langues spcialises. Paris : PUF, coll. "Linguistique nouvelle".

[Lessard97]
Lessard-Clouston, M. (1997). "Language Learning Strategies: An Overview for L2
Teachers". The Internet TESL Journal. vol. 3,
12.http://www.aitech.ac.jp/~iteslj/Articles/Lessard-Clouston-Strategy.html

[LuzonMarco00]
Luzn Marco, M.J. (2000). "Collocational frameworks in medical research papers: a
genre-based study". English for Specific Purposes, vol. 19, 1. pp. 63-86

[Melcuk93]
Mel'uk, I. A. (1993). "La phrasologie et son rle dans l'enseignement/apprentissage
d'une langue trangre". tudes de Linguistique Applique, vol. 92. pp. 82-113.

[Pecman04]
Pecman, M. (2004). "L'enjeu de la classification en phrasologie".EUROPHRAS
2004, 26-29 aot 2004, universit de Ble, Suisse. Baltmannsweiler : Schneider
Hohengehren Verlag. pp. 127-146.

[Phal71]
Phal, A. (1971). Vocabulaire gnral d'orientation scientifique (V.G.O.S.) : part du
lexique commun dans l'expression scientifique. Paris : Credif.

[Sinclair66]
Sinclair, J. M. (1966). Beginning the Study of Lexis. In Bazell, Ch. E. et al.(dir.). In
Memory of J. R. Firth, London/Harlow: Longmans. pp. 410-430.

[Smadja93] Smadja, F. (1993). "Retrieving collocations from text:


Xtract".Computational Linguistics, vol. 19, 1. pp. 143-177.
[Swales90] Swales, J. M. (1990). Genre Analysis: English in academic and research
settings. Cambridge: Cambridge University Press.

[Williams99]
Williams, G. C. (1999). Les rseaux collocationnels dans la construction et
l'exploitation d'un corpus dans le cadre d'une communaut de discours scientifique.
Thse de doctorat, universit de Nantes.

[Zingl96]
Zingl, H. (1996). "ZART : un linguiciel d'aide la rdaction scientifique et technique
en langue trangre". Travaux du Lilla, n 1, publication de la facult des lettres, arts
et sciences humaines de l'universit de Nice-Sophia Antipolis. pp. 111-113.

[Zingl98]
Zingl, H. (1998). "ZTEXT: un outil pour l'analyse de corpus". Travaux du Lilla, n 3,
publications de la facult des lettres, arts et sciences humaines de l'universit de
Nice-Sophia Antipolis. pp. 69-78.

[Zingl03]
Zingl, H. (2003). "Constitution et exploitation d'une base de donnes
phrasologiques en franais". Actes du Congrs international des linguistes,24-29
juillet 2003, Prague.

Haut de page

Notes

1 Bien que le domaine de la phrasologie souffre encore de nos jours d'une


terminologie assez floue et d'une difficult dfinitoire de son propre objet d'tude
(due principalement la complexit de celui-ci), les termes "unit phrasologique"et
"collocation" commencent tre unanimement admis et reoivent de plus en plus
souvent la dfinition de "an arbitrary and reccurrent word combination"
([Benson89] : 3).

2 Cette mthode d'investigation des amalgames de mots lexicaliss est sous-tendue


par l'interprtation statistique de la collocation en tant qu'entit linguistique
compose d'lments monolexicaux rapparaissant une distance n de manire
significative au sein d'un corpus reprsentatif d'une langue (cf. [Halliday66] ;
[Sinclair66] ; [Smadja93]).

3 Dans le cadre du projet CONPHRAS-PROCOP par exemple, Grciano


([Grciano97] : 34) analyse la fois les domaines de la mdecine, de l'conomie, du
sport, de l'administration et de la politique.

4 En effet, une unit comme : description [dtaille / prcise / minutieuse /


exhaustive] -> [detailed / accurate /thorough/ exhaustive] description est compte
comme une seule UT. Elle consiste toutefois en plusieurs UT minimales (par
ex.description dtaille -> detailed description, description prcise -> accurate
description, etc.).
5 Ce projet est actuellement en cours de ralisation l'universit de Nice-Sophia
Antipolis.
Haut de page

Table des illustrations

Titre Figure 1 - Maquette pour la cration d'un dictionnaire phrasologique.

URL http://alsic.revues.org/docannexe/image/334/img-1.jpg

Fichier image/jpeg, 40k

Titre Figure 2 - Maquette pour la cration d'un thsaurus phrasologique.

URL http://alsic.revues.org/docannexe/image/334/img-2.jpg

Fichier image/jpeg, 47k

Haut de page

Pour citer cet article

Rfrence
Mojca Pecman, Les apports possibles de la phrasologie la didactique
des langues trangres , Alsic [En ligne], Vol. 8, n 2 | 2005, document
alsic_v08_15-rec9, mis en ligne le 15 dcembre 2005, Consult le 23
septembre 2012. URL : http://alsic.revues.org/334 ; DOI :
10.4000/alsic.334
Haut de page

Auteur

Mojca Pecman
Mojca Pecman a soutenu sa thse en linguistique l'universit de Nice en
2004 sur le thme "Phrasologie contrastive anglais-franais : analyse et
traitement en vue de l'aide la rdaction scientifique". Auteure de
plusieurs articles portant sur les divers aspects de la recherche en
phrasologie bilingue, elle enseigne la linguistique et l'informatique depuis
cinq ans au sein du dpartement des sciences du langage en qualit
d'ATER et prcdemment de monitrice.
Courriel : pecman@unice.fr
Adresse : Laboratoire d'Ingnierie Linguistique et de Linguistique
Applique (LILLA), universit de Nice-Sophia Antipolis, 98 bd douard
Herriot, BP 209, 06204 Nice Cedex 3, France.

Haut de page

Ce texte fait partie des textes de la journe Atala 2005 qui font l'objet
d'un numro spcial d'Alsic. Date de rception de l'article 1er novembre
2004 ; date d'acceptation, 30 mai 2005.
Droits d'auteur

CC-by-nc-nd