Vous êtes sur la page 1sur 12

PRSENTATION : COLLOCATIONS, CORPUS, DICTIONNAIRES

Franz Josef HAUSMANN et Peter Blumenthal Armand Colin | Langue franaise


2006/2 - n 150 pages 3 13

ISSN 0023-8368

Article disponible en ligne l'adresse:

-------------------------------------------------------------------------------------------------------------------http://www.cairn.info/revue-langue-francaise-2006-2-page-3.htm

--------------------------------------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------------------------------------HAUSMANN Franz Josef et Blumenthal Peter, Prsentation : collocations, corpus, dictionnaires , Langue franaise, 2006/2 n 150, p. 3-13. DOI : 10.3917/lf.150.0003

--------------------------------------------------------------------------------------------------------------------

Distribution lectronique Cairn.info pour Armand Colin. Armand Colin. Tous droits rservs pour tous pays.

La reproduction ou reprsentation de cet article, notamment par photocopie, n'est autorise que dans les limites des conditions gnrales d'utilisation du site ou, le cas chant, des conditions gnrales de la licence souscrite par votre tablissement. Toute autre reproduction ou reprsentation, en tout ou partie, sous quelque forme et de quelque manire que ce soit, est interdite sauf accord pralable et crit de l'diteur, en dehors des cas prvus par la lgislation en vigueur en France. Il est prcis que son stockage dans une base de donnes est galement interdit.

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Pour citer cet article :

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Franz Josef Hausmann Universit dErlangen-Nrnberg Peter Blumenthal Universit de Cologne

Prsentation: collocations, corpus, dictionnaires


1. QUEST-CE QUUNE COLLOCATION?
Ce cahier de Langue franaise dsire promouvoir ltude dun type de signe linguistique qui est connu sous le nom de collocation, terme utilis en linguistique de deux faons. La premire acception, quantitative, relve de la description statistique de corpus. Elle dsigne lapparition soit frquente, soit statistiquement significative (compte tenu de frquences pondres) de deux units lexicales donnes dans un contexte plus ou moins troit. Un dictionnaire qui runit des cooccurrences frquentes, mais souvent peu pertinentes pour qui veut se renseigner sur la combinatoire spcifique des mots, existe pour langlais et sappelle A Dictionary of English Collocations (Kjellmer 1994). Larticle hotel de ce dictionnaire donne, entre autres, les cooccurrences suivantes: hotel at/hotel room/hotel suite/a hotel/either hotel/Hilton Hotel/my hotel/of hotel. La seconde acception, essentiellement qualitative, de collocation peut tre dfinie par cooccurrence lexicale restreinte. Comme lexplique trs bien Steinlin (2003: 3), lintrt quon trouve ce type de cooccurrences tient davantage aux contraintes quelles font peser sur lutilisation du lexique qu leur frquence, car il sagit dun savoir lexical, dune proprit du lexique. Et le mme auteur de donner comme exemples: on ne pousse pas un son, on lmet; on nmet pas un hurlement, on le pousse; qqch inflige une dception, mais inspire une crainte. Cest cette seconde acception qui se trouvera au centre de la majorit des contributions prsentes ici; nous verrons par ailleurs quelle ne soppose pas radicalement la premire (cf.infra4.). Un dictionnaire qui runit les collocations dans leur seconde acception existe pour langlais et sappelle Oxford Collocations Dictionary for Students of English (2002). Larticle hotel de ce dictionnaire fournit, parmi dautres, les collocations suivantes: VERB +NOUN stay at/in | book in at/into, check in at/into, check out of | own | manage, run.
Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

L AN GU E FRA N A IS E 150

Collocations, corpus, dictionnaires Regardant de plus prs lunit syntagmatique en question, nous pouvons dcrire la collocation (exemples: passer un examen, un clibataire endurci, grivement bless, une bouffe de colre) comme la combinaison phrasologique (code en langue) dune base (examen, clibataire, bless, colre) et dun collocatif (passer, endurci, grivement, bouffe). La base est un mot (plus prcisment lacception dun mot, appele aussi lexie) que le locuteur choisit librement parce quil est dfinissable, traduisible et apprenable sans le collocatif. Le collocatif est un mot (ou lacception dun mot) que le locuteur slectionne en fonction de la base parce quil nest pas dfinissable, traduisible ou apprenable sans la base. tant une unit polylexicale code en langue, la collocation se distingue premirement de la combinaison libre, non combine en langue, quelle soit banale (oublier un examen, un clibataire rancunier) ou originale (lait noir, la route se rabougrit, le jour se fissure). Mais elle se distingue aussi dautres units polylexicales codes en langue, notamment de la locution idiomatique ou figure (prendre la mouche, casser les pieds qqn) qui est code en langue mais na pas de base (ni, par consquent, de collocatif), puisquelle signifie et est slectionne par le locuteur en bloc (le locuteur ne parlant pas de mouche ou de pieds). Elle semble galement se distinguer des mots composs polylexicaux terminologiques du type arrt cardiaque, quipement portuaire ou feu rouge quon a propos dappeler phrasotermes (G.Grciano, daprs Gonzlez Rey 2002: 92) et qui, malgr leur transparence, sont cods, sans pour autant prsenter une structure base-collocatif (le locuteur ne choisit pas cardiaque en fonction darrt). Ces distinctions se rsument de la faon suivante: la phrasologie (unit: phrasme) se compose de phrasotermes (arrt cardiaque/quipement portuaire/ feu rouge ), de collocations ( administrer une gifle / un clibataire endurci/grivement bless ) et de locutions ( casser les pieds qqn / prendre la mouche/un cordon bleu ). La hirarchie base-collocatif (quon peut appeler lorientation de la collocation), hirarchie qui fait quen formulant, le locuteur progresse en partant de la base pour arriver au collocatif et non inversement, est une ralit psychologique observable en discours, notamment de la part dun locuteur tranger qui peroit lapprentissage des bases comme celui dquations simples (angl. exam = fr. examen), alors que lquation du collocatif varie en fonction de la base (pour dire passer un examen, langlais dit take prendre et le collocatif anglais pass veut dire en franais russir). Cette variation pouvant prendre des proportions considrables, ltranger mme trs avanc dans la matrise de la langue peut se retrouver dans une vritable situation de dtresse dencodage o, connaissant la base, il cherche dsesprment le collocatif, linverse tant improbable: on ne cherche pas dsesprment la base clibataire partir du collocatif endurci . Cest une dtresse dont mme le locuteur natif nest pas toujours labri, notamment quand il sagit de variation synonymique du collocatif. Tout le monde na pas toujours sa disposition les diffrentes faons dexprimer la russite ou lchec lexamen: russir, russir , tre reu , tre admis /chouer , tre refus , recal , coll , blackboul , manquer, rater, etc. La collocation est donc une entit prendre en compte en linguistique thorique et descriptive, en psycholinguistique, en linguistique cognitive, en linguistique contrastive, en lexicographie et dans la pdagogie des langues, 4

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Prsentation: collocations, corpus, dictionnaires maternelles comme trangres. Prenons le cas, particulirement significatif, de la lexicographie monolingue. larticle du collocatif (par exemple administrer), le bon dictionnaire gnral signalera que la dfinition (en loccurrence, donner) est restreinte la collocation du mot (ou de lacception) avec un nombre rduit de bases (en loccurrence, gifle). La mention de la collocation constitue ainsi le prolongement naturel de la dfinition et est indispensable pour le traitement lexicographique. Tel nest pas le cas larticle de la base (gifle) o le collocatif (administrer) est sans importance pour la dfinition. Il est en revanche indispensable si le dictionnaire veut galement remplir une fonction dencodage et apprendre lutilisateur contextualiser correctement la base (gifle). On peut dire que la collocation a une fonction smasiologique larticle du collocatif et une fonction onomasiologique larticle de la base. Comme les dictionnaires gnraux privilgient par nature la fonction smasiologique (de dcodage) et ngligent souvent la fonction onomasiologique (dencodage), il faut pour cette dernire un dictionnaire spcialis quon appellera dictionnaire de collocations et dont la macrostructure sera faite de bases de collocation sur lesquelles il adressera en microstructure la totalit des collocatifs. Le modle (forcment imparfait) dun tel dictionnaire de collocations est pour le moment le Oxford Collocations Dictionary, cit ci-dessus. Pour le franais, quatre projets sont en cours (cf.Meluk & Polgure et Verlinde, Binon & Selva dans ce fascicule, ainsi que Blumenthal 2005; Dominique Le Fur, des Dictionnaires Le Robert, travaille galement sur le concept de collocation). En linguistique syntagmatique, les deux perspectives (de la base aux collocatifs/du collocatif aux bases) ont leur intrt. On peut donc prendre comme point de dpart (anglais node) de la description le collocatif et inventorier une classe de bases. Par exemple, le collocatif appeler se combine en franais avec les bases taxi et ascenseur (contrairement lallemand rufen qui va pour taxi mais non pour ascenseur o on dit holen). On peut aussi prendre comme point de dpart de la description la base (taxi ) et faire linventaire des collocatifs (appeler, hler, etc.). Dans les deux cas, on tablit ainsi le profil combinatoire du mot ou de lacception (Blumenthal 2002, 2005). Et dans les deux cas le profil combinatoire peut se mettre au service de la synonymie, de lapprentissage systmatique du vocabulaire, de la traduction automatique ou dautres activits. Bosque (2004) est pour lespagnol un dictionnaire (admirable de richesse) consacr au profil combinatoire des collocatifs (et accessoirement des bases). Certaines coles, refusant lorientation de la collocation, ne connaissent par consquent que des points de dparts (nodes) et utilisent le terme anglais collocate pour dsigner nimporte quel partenaire collocationnel. la recherche dun quivalent de collocate, on pourra proposer collocateur (quon prendra soin de distinguer de collocatif). De mme pourra-t-on proposer pour langlais node le terme de noyau. Dans ce sens, noyau et collocateur (point de dpart de la description et partenaire dune collocation) seraient distinguer de base et collocatif. En aucun cas, on ne pourra accepter que le collocatif soit appel base si on veut viter la confusion totale et la fin de la communication entre les coles. La thorie de la collocation, telle quelle est prsente ici, sans tre absente de la linguistique franaise ( cf. Cusin-Berche 2002, Gonzlez-Rey 2003: 89 sqq, Grossmann & Tutin 2003, Polgure 2003: 134-142, Steinlin 2003),

L AN GU E FRA N A IS E 150

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Collocations, corpus, dictionnaires reste relativement confidentielle. Cela a de quoi surprendre, tant donn luniversalit du phnomne et sa prsence massive dans la lexicographie en France depuis la Renaissance.

2. LEXICOGRAPHIE ET COLLOCATIONS EN FRANCE PASS ET PRSENT


La description et ltude des collocations a en France une longue tradition qui sexerce dans lactivit lexicographique spcialise et gnrale du latin, dans lactivit lexicographique spcialise et gnrale du franais et dans le discours mtalexicographique des lexicographes. Le premier dictionnaire franais monolingue est en 1571 une sorte de dictionnaire de collocations, Les pithetes de Maurice de La Porte, dont le sous-titre affirme son utilit pour illustrer toute composition Franoise (Bierbach 1997: 59-62, 363-371). Ce dictionnaire, qui relve de la lexicographie spcialise, sinsre logiquement dans la tradition des dictionnaires rhtoriques collocationnels du latin qui accompagnent, lpoque de la Renaissance, les grandes ralisations bien connues de Robert Estienne, galement riches en exemples de type collocationnel (Lindemann 1994). Lhistoire des dictionnaires collocationnels du latin, du franais, ainsi que dautres langues est esquisse dans Hausmann (1989). La place nous manque pour revenir l-dessus. Il faudra, en revanche, rpondre rapidement deux questions peu poses: quelle place occupent les collocations au sein de la lexicographie franaise gnrale et comment y ont-elles t nommes? Dans la lexicographie franaise gnrale, les collocations ont toujours eu une place de premier choix, et ceci grce lAcadmie franaise et son refus de citer. Regardons larticle DBAT du premier Dictionnaire de lAcadmie franaise en 1694:
DBAT. Diffrend, contestation. (1) (2) (3) (4) (5) (6) (7) (8) tre en dbat de quelque chose mettre en dbat vider un dbat terminer un dbat avoir dbat avec quelquun ouvrir un dbat apaiser un dbat dbat dun compte

On dit prov. eux le dbat/entre eux le dbat pour dire quon ne se veut point mettre en peine de leur diffrend.

LAcadmie est reste fidle sa mthode rhtorique et collocationnelle jusqu la 9edition en cours. De par son modle raliste, lAcadmie stait oppose au modle philologique et autoritariste de lAccademia della Crusca. Or, cest ce modle premier, privilgiant la citation, qui est repris son compte par le plus grand lexicographe du XIXesicle, mile Littr. Par consquent, le dictionnaire de Littr est relativement pauvre en collocations. Qui cherche la double richesse, citationnelle et collocationnelle, la trouve pour 6

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Prsentation: collocations, corpus, dictionnaires la premire fois dans le Nouveau Littr que veut tre Le Grand Robert et aprs lui dans le Trsor de la langue franaise. Comment les lexicographes parlent-ils, depuis la Renaissance, des units phrasologiques? Les dictionnaires de collocations latines du XVIesicle ne manquaient pas de termes pour les nommer: N+A: Epitheta / Adiuncta Nominibus / N+V: Phrases / Locutiones / Formulae / V+Adv: Adiuncta (verbis) / X et Y: Coniuncta (Hausmann 1982: 191). Lexamen attentif des premiers dictionnaires franais gnraux monolingues (prfaces, articles concerns, pratique de la catgorisation) rvle une thorie sous-jacente qui, pour floue et implicite quelle soit, nest pas moins existante et surtout concordante (cf.aussi Leroy-Turcan 1997 et Grimaldi 1997). Certains emplois de phrase semblent indiquer que ce terme vise davantage les collocations que les locutions. LAcadmie place deux fois le terme ct des pithtes (Quemada 1997: 30, 39) qui sont des collocatifs, et ceci apparemment pour signifier les collocations autres quadjectivales. Furetire (1690) nomme phrase lunit collocationnelle Reparations locatives (sous locative ). Dans ses Factums, il oppose aux dfinitions quatre composants syntagmatiques de larticle (Hausmann 1982: 197 sq ): pithtes, phrases (propres), phrases figures et proverbes ce qui confirme que phrase (propre) collocation est utilis la fin du XVIIesicle. Pour nommer des units phrasologiques, le terme de phrase est en recul au moins depuis le XIXesicle (cf.TLF sous phraseI, Rem., et Grimaldi 1997). Il a cd au profit de phrase, terme de syntaxe, ou a subi une dtrioration pour signifier lieu commun, parole creuse. Par quoi le terme de phrase a-t-il t remplac pour signifier collocation? Le Dictionnaire de lAcadmie de 1835 (prface par A.-F.Villemain) lutilise encore, ct de locution et idiotisme (Quemada 1997: 346, 362). Aprs le texte de Villemain, la notion est dilue dans la vaste catgorie des exemples ( op.cit .: 404, 446). En conclusion, on peut dire que, dans les premiers dictionnaires, grce au terme de phrase, les collocations sont plus clairement distingues que plus tard o elles seront noyes dans la catgorie peu spcifique des exemples. Pour lpoque moderne, on en arrive ce constat sidrant: les dictionnaires sont bourrs de collocations, mais les lexicographes ne ressentent pas ou peu le besoin de les nommer.

3. DISCOURS LINGUISTIQUE ET COLLOCATIONS


La linguistique du XIXesicle ignore les collocations. Lorsque Hermann Paul (Paul 1970 [1880]: 73) parle de groupes de mots (Wortgruppen), de combinaisons (Verbindungen) et de tours (Wendungen), ses exemples montrent quil sagit uniquement de locutions idiomatiques ou figures. Et Saussure? Quand il en vient parler des syntagmes non libres, appartenant la langue, il emploie deux termes: expressions et locutions toutes faites. Pour les dernires, il donne les exemples quoi bon? et allons donc! (Ldition du CLG par Engler ajoute sil vous plat, appel locution; Engler 1968: 284). Expression est chez Saussure une catgorie floue qui comprend les locutions toutes faites et un autre type auquel il ne donne pas de nom spcifique mais que les exemples

L AN GU E FRA N A IS E 150

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Collocations, corpus, dictionnaires (prendre la mouche, forcer la main qqn, rompre une lance, avoir mal , force de, que vous en semble?, pas nest besoin de) permettent didentifier galement comme des locutions (Saussure 1965: 172). Faute dexemples concrets, tout ce que dit Saussure au sujet des syntagmes, groupes de mots, combinaisons, groupes dassociations, groupements et groupements syntagmatiques (Engler 1968: 283-294) reste trop vague pour quon lise ces termes dans le sens des collocations. Tout autre est la situation pour Charles Bally, disciple de Saussure certes, mais ayant au moment du Cours de linguistique gnrale prs de 45ans et une solide exprience de lenseignement du franais langue trangre. Cest cette vue contrastive sur la langue qui lui fait dcouvrir quil y a deux types de locutions phrasologiques [= phrasmes]: les units phrasologiques [= locutions idiomatiques] et les sries phrasologiques (Bally 1951, 1 [1909]: 68) [= collocations] quil appelle aussi groupements usuels (op.cit.:70) et pour lesquels il donne de nombreux exemples, entre autres: grivement bless, gravement malade, dsirer ardemment, aimer perdument, intimement li, refuser catgoriquement, chaleur tropicale, chaleur torride. (Cf.aussi Bally 1951, 2: 43-53, avec des exercices sur des collocatifs verbaux). Voici donc la terminologie de Bally: la locution phrasologique [phrasme] est ou bien une srie phrasologique/ un groupement usuel (sries dintensit/sries ou priphrases verbales) [collocation] ou bien une unit phrasologique [locution]. Cette analyse na laiss aucune trace immdiate dans la linguistique de son temps. Trois raisons semblent tre lorigine de cette rception rate. Dabord, le genre de publication choisi, un trait de stylistique pratique pour trangers. Cette linguistique applique avant la lettre passait pour artisanale et ntait pas prise au srieux par les thoriciens. Bally, lui-mme, ne semble pas lui attribuer une valeur extraordinaire, puisque, dans sa clbre Linguistique gnrale et linguistique franaise de 1932 (Bally 1965), il nen parle pas. Ensuite, la terminologie choisie, trop priphrastique, insuffisamment identifiante et individualisante. Pour finir, lloignement de ce sujet des grands courants de la linguistique de la premire moiti du XXesicle. Cest ainsi que dans ce petit livre, destin surtout lenseignement secondaire (Bally 1909, 1: VIII), les chercheurs, dont Bally avait dit: Peut-tre les chercheurs y trouveront-ils aussi leur compte (op.cit.: IX), ont mis trs longtemps dcouvrir le pactole qui y tait enseveli. Les lexies complexes de Pottier renferment des units collocationnelles, sans pour autant clairement les analyser (Pottier 1964: 290sqq). Les synapsies de Benveniste sont seulement un certain type de collocations, de forme N +prp +N (Benveniste 1966). Quant Andr Martinet, il ne parle pas des collocations (oubli rpar par Builles 1998: 166). Lecteur de Bally et de Marouzeau (qui avait dit: On peut constater que la langue est faite de formules autant que de mots (Marouzeau 1959 [1941]: 145)), le grand linguiste Eugenio Coseriu reprend dans une confrence retentissante de 1964 lors du Premier Colloque International de Linguistique Applique (Actes 1966) des exemples du type un gros chagrin, une grande douleur, de graves soucis quil appelle clichs lexicaux et syntagmes lexicaux pour les situer dans la norme, cest--dire dans la langue (Coseriu 1970: 42). Malheureusement, il les oublie lorsquil fait quelques pages plus tt linventaire du discours rpt (op.cit.: 27-32, oubli rpar par Thun (1978: 65 8

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Prsentation: collocations, corpus, dictionnaires et 1995: 670) qui compte ces analyses prfres (collocations) parmi les combinaisons figes de mots [fixierte Wortgefge]). Dans la discussion interviennent des noms aussi prestigieux que Baldinger, Culioli, Gougenheim, Isaenko, Larochette, Ullmann, mais seul K.V.Sinclair, mdiviste manifestement au courant des ncessits de lenseignement scolaire, relve cette partie de la confrence et insiste sur limportance fondamentale des highfrequency collocations, relay par P.J.Wexler (cf.Coseriu 1970: 92, 103). Il a donc fallu que lcole britannique dcouvre le rle du contexte et invente le terme de collocation (Williams 2003) et que ce terme, par le truchement de Halliday et al. (1964: 33 sqq), parvienne Paris et soit repris par certains (Mitterand 1965: 79; Galisson 1971 [1965]: 6; Wagner 1967: 140; Quemada 1967: 508 sqq ; Imbs 1971: XXXII), sans pour autant simposer. Car on lui a longtemps prfr le terme de syntagme, pourtant trop ambigu (libre? cod?) pour imposer un concept nouveau. Et puis il restait dcrire la structure interne des syntagmes/collocations. Il revenait en effet un chercheur orientation pdagogique, Robert Galisson, daller plus loin que Bally en analysant les collocations en un terme-noyau [= la base] et un terme-satellite quil appelle collocatif (Galisson 1971 [1965]: 14). Pour Galisson, qui sinspire des travaux britanniques, le verbe fumer est un collocatif limit, puisquil nadmet gure que cigarette , pipe et quelques autres comme termes-noyaux. Galisson stait mis faire un petit dictionnaire de collocations o on trouvait allumer, frotter et teindre dans lorbite d allumette , dictionnaire circulant au BELC depuis 1965, mais accessible la communaut des chercheurs seulement en 1971. Cest de Bally et de Galisson que sinspire Hausmann (1979; cf.aussi 1996, 1997, 1999, 2004). Mais paralllement sest dveloppe une autre rflexion qui, ses dbuts, ignore Bally et ne connat comme modle de collocations que les dictionnaires dAlbrecht Reum (1953, 1961), cest celle dIgor Mel uk. En 1962, dans les collines pierreuses du Kazakhstan, ce jeune chercheur russe (n en 1932, ayant tudi lespagnol et le franais, travaillant depuis 1956 la traduction automatique), tout en portant le barda dun gologue, rflchit au problme de lautomatisation de la traduction des collocations anglaises ( heavy rain, to launch an attack) et a la gniale ide des fonctions lexicales, publie pour la premire fois en 1965 avec A.K. olkovskij (Mel uk etal. 1984: 3 et communication personnelle du 27mars 2005). Cette recherche devait mener au Dictionnaire explicatif et combinatoire du franais contemporain (Meluk etal. 1984-1999) dont lanalyse collocationnelle est certainement la plus pousse en thorie et la plus universellement productive. Les dictionnaires de terminologie linguistique sont avant 2000 dune affligeante pauvret en matire de phrasologie. Pour que cela change, il faut attendre le dictionnaire de Charaudeau & Maingueneau (2002) et son article cooccurrence par la regrette F.Cusin-Berche. Les introductions la lexicologie avant 2000 ( lexception de Niklas-Salminen 1997: 112sq) ignorent galement les collocations. La notion de collocation nest sortie de la confidentialit en France que dans les annes1990 (Liang 1991, Bjoint & Thoiron 1992, Descamps 1994, Candel 1995, Tutin 1995). On peut constater un dbut de prise de conscience loccasion du colloque international de Saint-

L AN GU E FRA N A IS E 150

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Collocations, corpus, dictionnaires Cloud: La locution: entre lexique, syntaxe et pragmatique. Identification en corpus, traitement, apprentissage (Martins-Baltar 1995, 1997; Fiala, Lafon & Piguet 1997). Mais la claire distinction entre collocation et locution est souvent encore refuse. Le Petit Robert dfinit depuis 1993 la phrasologie dans le corps du dictionnaire comme lensemble des expressions, locutions, collocations et phrases codes dans la langue gnrale. Mais la dfinition de la collocation dans le mme dictionnaire est bien maigre: Position (dun objet, dun lment) par rapport dautres; proximit dans une chane. cooccurrence. (inchange en 2003). Pour une premire initiation au phnomne de la collocation, on peut sadresser maintenant Gonzlez Rey (2003: 89sqq), Grossmann & Tutin (2003), Polgure (2003: 134-142), Steinlin (2003).

4. COLLOCATIONS, CORPUS, DICTIONNAIRES


Dans la rgle, nous ne parlons pas par signes isols, mais par groupes de signes, par masses organises qui sont elles-mmes des signes (Saussure 1965: 177). Si on appelle phrasologie, comme nous le proposons, lensemble des units polysegmentales codes en langue, que ce soit dans le systme ou dans la norme, il faudra reconnatre que la collocation est un certain type de phrasme ct de bien dautres (locutions figures, phrasotermes, noncs cods, proverbes, citations clbres, jusques et y compris les phrasmes grammaticaux, polymorphmatiques ou morpholexmatiques, transparents ou opaques). Et bien quil ny ait pas de limite tranche entre le fait de langue, marque de lusage collectif, et le fait de parole, qui dpend de la libert individuelle (Saussure 1965: 173), il est de notre devoir de linguiste didentifier dans les corpus et de dcrire dans les dictionnaires ces mmes collocations. Voil pourquoi les auteurs de ces lignes ont organis les 1er et 2juillet 2005 le Colloque de Cologne sur les Collocations 1 dont les sept communications, connues auparavant dans leur version provisoire, figurent ici dans une version qui a pu profiter des dbats mens en toute convivialit 2. Plus haut, nous avons voqu lexistence de deux conceptions dans les recherches actuelles sur la collocation, lune purement quantitative, lautre plutt qualitative. Il convient toutefois de ne pas surestimer lintrt mthodologique de cette opposition. Car pour le moment, ces conceptions partagent toutes deux lapproche descriptive dun phnomne dont lexplication scienti1. Nous remercions lUniversit de Cologne pour son hospitalit, La Deutsche Forschungsgemeinschaft, ainsi que le Bureau pour la collaboration universitaire, Service culturel de lAmbassade de France Berlin (CCCL Dsseldorf) pour le soutien financier. Le comit dorganisation tait compos de Sandra Lhafi, Sascha Diwersy et Ludwig Fesenmeier. 2. Ont prsid les sances et/ou particip aux dbats : Danielle Leeman, Dominique Le Fur, Ulrich Heid et Franz Schneider. Quils en soient remercis. Gaston Gross et Igor Meluk, vivement sollicits, nont pas pu venir pour cause dempchement. La contribution de F.J.Hausmann, intitule Lexicographie franaise et phrasologie et ddie la mmoire de Charles Bally (1865-1947), mtacollocationniste avant la lettre, et Igor Meluk (n en 1932), dchireur dhorizons en linguistique , na pas pu tre insre, tant trop longue. Toutefois, certaines de ses idesforce se retrouvent dans cette prsentation.

10

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Prsentation: collocations, corpus, dictionnaires fique (pour quelles raisons profondes les mots se combinent-ils dune certaine faon?) en est encore ses dbuts. Avouons incidemment que les auteurs des articles runis ici sestimeraient heureux sil savrait quils avaient pu contribuer, ne serait-ce que dans de bien modestes proportions, faire voluer cette situation: le temps semble mr pour passer des classifications descriptives aux tentatives de mieux comprendre le pourquoi et le comment des faits dment tiquets et catalogus. Un second facteur plaidant en faveur dune vision plutt complmentaire quantagoniste des deux approches tient au fait que tous les chercheurs en ce domaine, quel que soit par ailleurs leur credo thorique, travaillent aujourdhui sur de vastes corpus informatiss, souvent catgoriss et lemmatiss; le dpouillement automatique de ceux-ci simpose presque irrsistiblement et permet au lexicologue, mme sil nest pas un aficionado de mthodes quantitatives, soit de se faire une premire ide de lenvironnement du mot de base, soit de contrler empiriquement les rsultats dun travail thorique sur les contraintes combinatoires. En effet, corpus numriss et outils lexicomtriques ont profondment rvolutionn la recherche linguistique et, plus particulirement, lexicographique, en dcuplant les possibilits dobservations. Vu limpact de cette rvolution, il ne parat pas exagr daffirmer que lavant et laprs sopposent autant que lil nu soppose aux jumelles, tlescope et microscope runis. Longtemps pionnire dans le domaine lexicographique de par limmense entreprise du Trsor de la langue franaise, la France a un rang tenir, dsormais menac par la Grande-Bretagne, o lamlioration annuelle des dictionnaires pour tudiants avancs nest plus imaginable sans le soutien des grands corpus accessibles tous. En matire de dictionnaires spcialiss, lOxford Collocations Dictionary, cit plusieurs reprises, reprsente la dernire preuve du haut niveau lexicographique gnr par lexploitation lectronique des corpus. Pourquoi ne disposons-nous pas dun outil comparable en franais, capable de nous fournir pour chaque mot de base une liste de mots-satellites prslectionns par la langue franaise de mots justes, disait-on autrefois pour exprimer une ide, articule tout fait diffremment dans dautres langues? Dans ces conditions, lobjectif gnral du prsent projet est de runir un certain nombre de tentatives en matire de description syntagmatique des mots pour crer une synergie profitable tous, au niveau de la recherche pure comme celui de la recherche applique, celle qui mne la confection de dictionnaires. Tous les contributeurs ne comprennent pas le terme de collocation, point de mire de nos rflexions, exactement de la mme faon, mais tous sont convaincus de lextrme utilit des corpus et des concordances pour donner une description raliste de la dimension combinatoire des mots et de la langue. Les contributeurs se sont efforcs de faire apparatre la diversit des buts et des mthodes qui caractrise cette vaste thmatique, mais de garantir aussi une certaine comparabilit des approches do la focalisation sur les mmes lexmes ou champs smantiques dans plusieurs articles (deux exemples: dbat et ses synonymes, les noms daffects).

L AN GU E FRA N A IS E 150

11

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Collocations, corpus, dictionnaires Peter Blumenthal soumet la discussion lhypothse que rien dans la combinatoire strotype du mot ne relve du hasard des rencontres fortuites; dans cette perspective, tout dpend en dernire instance des structures smantiques ou cognitives profondes que reflte le contenu du mot. lintrieur du contenu, il sagit de dgager la conceptualisation (dune ralit) laquelle donne lieu lunit lexicale et qui amne le locuteur imaginer le rfrent dune certaine manire, diffrente dun mot lautre. Puisquil nexiste pas non plus deux units lexicales environnement identique, lanalyse du profil combinatoire (base sur des outils lexicomtriques) permet de cerner lidentit smantique du mot et de le distinguer de ses synonymes. Dun point de vue mthodologique, larticle part donc de donnes distributionnelles, passe par la recherche de schmas explicatifs et aboutit des observations sur les diffrences entre synonymes. Lobjectif d Agns Tutin, Iva Novakova, Francis Grossmann et Cristelle Cavalla est desquisser une typologie des noms daffect partir de leurs proprits smantiques et syntaxiques. Ils partent pour cela de lhypothse que les dimensions smantiques peuvent tre mises en vidence par la combinatoire lexicale et syntaxique. Ayant recens dans une tude de corpus (utilisant Frantext ) les contextes linguistiques des 40noms daffect les plus frquents du franais, ils tudient travers ces cooccurrences un ensemble de dimensions: la structure actancielle, laspect (ponctuel vs duratif, phases), les manifestations physiques extrieures, le contrle de laffect, la causation, la verbalisation. La mthode combinatoire employe permet dtablir six classes de noms daffect, bases en premier lieu sur la structure actancielle, le caractre ponctuel vs duratif et le contrle, et plus accessoirement sur les manifestations extrieures et la verbalisation. Si les dimensions causation et phases se rvlent peu discriminantes, dautres paramtres smantiques jugs apriori non pertinents (la polarit, lintensit, la dimension axiologique) apparaissent finalement essentiels. Le propos de larticle de Jacques Franois et Jean-Luc Manguin est en premier lieu de comparer les terminologies qui se sont dveloppes autour de la notion de collocation dans deux optiques, fonctionnelle et statistique. En second lieu, les auteurs testent lintuition que les noms exprimant des types de dialogues ou de dbats sattachent des adjectifs particuliers, de type relationnel comme de type qualificatif, le rattachement adjectivo-nominal tant pour partie du type quasi-phrasme. partir du nom dbat, et en sappuyant sur la liste des synonymes de dbat fournie par le dictionnaire lectronique des synonymes du CRISCO, ils reprent toutes les cooccurrences <N+Adj> dans la base de donnes Frantext catgorise de 1830 nos jours. Trois types de profils collocatifs (au sens statistique) en ressortent: les collocations troites (ex.: joute oratoire), asymtriques (ex.: controverse thologique) et lches (ex.: conciliabule interminable ). La notion fonctionnelle de collocation ne sapplique quau premier type, les deux autres ne reprsentant que des cooccurrences prfrentielles. La contribution dAlain Polgure et Igor Meluk prsente une approche globale de la description des drivations smantiques et des collocations, celle du DiCo/LAF. Cette approche se conforme au postulat suivant: les collo12

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Prsentation: collocations, corpus, dictionnaires cations ne doivent pas tre dcrites de faon isole. Les relations base-collocatif liens lexicaux syntagmatiques doivent tre modlises avec les drivations smantiques liens paradigmatiques , au moyen dun mme outil descriptif: les fonctions lexicales. De plus, il faut considrer dautres proprits lexicales, comme ltiquette smantique de lunit lexicale, sa structure actancielle et son schma de rgime, tout cela en tenant compte dune stricte sparation des diffrentes acceptions. Les auteurs expliqueront comment toutes ces proprits sont encodes dans la base de donnes DiCo, en illustrant leur approche partir du cas particulier du vocable polysmique franais DBAT. Dans leur contribution, Serge Verlinde, Jean Binon et Thierry Selva illustrent le traitement du mot dbat dans le Dictionnaire dapprentissage du franais langue trangre ou seconde (Dafles), un dictionnaire dapprentissage semi-multilingue du franais gnral, accessible en ligne et destin des apprenants de niveau intermdiaire et avanc. Ils tudient successivement ltablissement des lexies et la rdaction des dfinitions, les relations syntagmatiques (la syntaxe du mot et ses cooccurrents) et les relations paradigmatiques (les corrls). Pour chacun de ces aspects, ils mettent en vidence la ncessit dun dpouillement de corpus, en loccurrence un corpus de textes journalistiques de plus de 75millions de mots, provenant de trois communauts francophones importantes. Ils procdent galement une comparaison exhaustive de leurs donnes avec celles releves dans les principaux dictionnaires et inventaires de collocations disponibles sur le march lheure actuelle. La comparaison porte non seulement sur la slection des collocations, mais galement sur leur modlisation. Dirk Siepmann nous propose une tude richement documente qui aborde le phnomne collocatif du point de vue de lapprenant de langues trangres et du lexicographe pdagogique. Une premire partie thorique se penche sur un certain nombre de difficults inhrentes aux dfinitions actuelles de la notion de collocation, telles que le caractre suppos binaire des collocations et les diffrences supposes de statut smiotaxique entre la base et le collocatif. Une attention toute particulire est prte aux collocations entre smes. Sur la base de ces rflexions, lauteur propose une nouvelle division du continuum phrasologique et une nouvelle dfinition du phnomne collocatif. La deuxime partie de ltude donne une vue densemble de la faon dont les collocations peuvent tre enregistres dans un manuel de vocabulaire de fort volume. Dirk Siepmann argumente en faveur dune mthodologie onomasiologique bilingue ou multilingue, seule mme selon lui de rpondre aux besoins de lapprenant des langues et daboutir un traitement exhaustif du lexique, et illustre les premiers rsultats dune telle mthodologie. Gageons que ce volume aidera le lecteur mieux sorienter face aux diffrentes approches du rapport entre base et collocatif lequel rapport constitue la cl de vote de toutes les contributions. Esprons, de plus, que la notion de collocation, longtemps nglige en linguistique franaise, sera encore mieux reconnue comme outil indispensable une lexicographie moderne, celle qui sappuie sur les avances de la linguistique de corpus et qui met profit certains modles dictionnairiques provenant doutre-Manche.

L AN GU E FRA N A IS E 150

13

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin

Document tlcharg depuis www.cairn.info - - - 84.98.197.14 - 06/08/2013 17h18. Armand Colin