Vous êtes sur la page 1sur 29

Sylvie Archaimbault Jacqueline Lon

La langue intermdiaire dans la traduction automatique en URSS (1954-1960)


In: Histoire pistmologie Langage. Tome 19, fascicule 2, 1997. Construction des thories du son [Deuxime partie] pp. 105-132.

Rsum rsum : Les premires recherches en Traduction Automatique (TA) dbutrent en URSS en 1954. Elles se distinguent des recherches amricaines, commences en 1948, par leur caractre thorique et le choix d'une mthode faisant appel une langue intermdiaire. La cration de langues intermdiaires prend sa source dans la linguistique comparative de Baudouin de Courtenay et dans la rflexion sur l'internationalisation des langues. Le travail pionnier de P.P. Trojanskij de 1933 est ractualis par Panov en 1956, qui conoit la langue intermdiaire comme devant tre une langue naturelle, et spcifiquement le russe. Se dvelopprent paralllement des modles smantiques de langue intermdiaire comme ceux d'Andreev ou de Mel'cuk, modles qu'on peut apparenter des tentatives de langues universelles. Abstract abstract : Research work on Automatic Translation (TA) started in the USSR in 1954. It differed from American research, started in 1948, by its theoretical slant and by the choice of a method that resorted to an intermediate language. The concept of intermediate languages springs from Baudouin de Courtenay' s comparative linguistics and from a reflection on the internationalisation of languages. In 1956, P. P. Trojanskij's pioneering work of 1933 was updated by Panov, who sees the intermediate language as a natural language, and more specifically Russian. At the same time, semantic models for intermediate languages were developed by, for instance, Andreev or Mel'cuk. These models may be seen as attempts to construct a universal language.

Citer ce document / Cite this document : Archaimbault Sylvie, Lon Jacqueline. La langue intermdiaire dans la traduction automatique en URSS (1954-1960). In: Histoire pistmologie Langage. Tome 19, fascicule 2, 1997. Construction des thories du son [Deuxime partie] pp. 105-132. doi : 10.3406/hel.1997.2679 http://www.persee.fr/web/revues/home/prescript/article/hel_0750-8069_1997_num_19_2_2679

VARIA

LA LANGUE AUTOMATIQUE INTERMEDIAIRE FiliationsEN et modles URSS DANS (1954-1960) ' LA TRADUCTION

Sylvie ARCHAIMBAULT, Jacqueline LON URA CNRS 381 - Universit Paris 7

rsum : Les premires recherches en Traduction Automatique (TA) dbutrent en URSS en 1954. Elles se distinguent des recherches amricaines, commences en 1948, par leur caractre thorique et le choix d'une mthode faisant appel une langue intermdiaire. La cration de lan gues intermdiaires prend sa source dans la linguistique comparative de Baudouin de Courtenay et dans la rflexion sur l'internationalisation des langues. Le travail pionnier de P.P. Trojanskij de 1933 est ractualis par Panov en 1956, qui conoit la langue intermdiaire comme devant tre une langue naturelle, et spcifiquement le russe. Se dvelopprent paralllement des modles smantiques de langue interm diaire comme ceux d'Andreev ou de Mel'cuk, modles qu'on peut apparenter des tentatives de langues universelles.

abstract : Research work on Automatic Translation (TA) started in the USSR in 1954. It differed from American research, started in 1948, by its theoretical slant and by the choice of a method that resorted to an intermediate language. The concept of intermediate languages springs from Baudouin de Courtenay' s comparative linguistics and from a reflection on the internationalisation of languages. In 1956, P. P. Trojanskij's pioneering work of 1933 was updated by Panov, who sees the intermediate language as a natural language, and more specifically Russian. At the same time, semantic models for intermediate languages were developed by, for instance, Andreev or Mel'cuk. These models may be seen as attempts to construct a universal language.

Nous tenons remercier Sylvain Auroux, Irina Ivanova, Andr Lentin et Patrice Pognan pour leur lecture attentive et leurs prcieuses remarques et surtout Igor Mel'cuk pour les informations nombreuses et indites qu'il nous a si gnreusement fournies. Ils ne sauraient bien sr tre tenus responsables des ventuelles erreurs qui subsisteraient dans ce texte.

Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

106

S. ARCHAIMBAULT, J. LON key words : History of linguistics ; USSR ; Machine translation ; Intermediary language ; Universal language ; Semantics ; 20th century ; Baudouin de Courtenay ; Drezen E.K. ; Trojanskij P.P. ; Panov D. Ju. ; Andreev N.D. ; Mel'cuk I.A.

mots-cls : Histoire de la linguistique ; URSS ; Traduction Automatique ; Langue intermdiaire ; Langue universelle ; Semantique ; XXe sicle ; Baudouin de Courtenay ; Drezen E.K. ; Trojanskij P.P. ; Panov D. Ju. ; Andreev N.D. ; Mel'cuk LA.

INTRODUCTION LA RECHERCHE en traduction automatique (dsormais TA)2 commena en URSS en 1954 la suite de la premire dmonstration sur calculatrice lec tronique qui eut lieu en janvier 1954 New York. D. Ju. Panov eut ainsi connaissance des travaux du groupe de l'Universit de Georgetown, notam ment du programme de TA labor par le linguiste Paul Garvin et l'ingnieur Paul Sheridan. Toutefois, les Sovitiques prirent d'emble des options diffrentes pour des raisons la fois thoriques, technologiques et pratiques. Comme les groupes amricains, les groupes sovitiques comprennent peu de linguistes. Mais ces linguistes se rattachent une solide tradition de li nguistique comparative 3 qui les amnera poursuivre une rflexion thorique approfondie sur le passage d'une langue l'autre et sur le processus de traduction multilingue. Par ailleurs, les groupes sovitiques comprennent un certain nombre de mathmaticiens qui, face la pnurie de machines lec troniques, presque entirement monopolises par les militaires et les services secrets, ont dvelopp des algorithmes de prfrence des systmes de TA complets , c'est--dire comprenant un module programm. Cette situation a une consquence importante : les chercheurs sont moins soumis la pres sion sociale et aux contraintes conomiques ou politiques leur imposant de fournir des rsultats rapides et performants. Les recherches peuvent donc tre rsolument thoriques. En outre, les chercheurs en TA, engags dans des disciplines comme les mathmatiques ou la linguistique mathmatique, considres cette priode comme peu dangereuses idologiquement, bnficiaient d'une certaine tranquillit, qui, mme si elle les marginalisait 2. La prsente tude s'appuie principalement sur des documents publis. Nous avons fait appel autant que possible, pour les complter, des tmignages d'acteurs contemporains. On sait toutefois que, dans la Russie sovitique, l'activit scientifique tait trs fortement encadre et contrle par le parti communiste, et que carrires scientifiques et politiques taient souvent troitement mles. En consquence, on ne peut tre sr que les travaux les plus intressants aient tous t publis. On peut craindre d'ailleurs que cet tat de chose ne perdure aujourd'hui {cf. Cejtin 1997). 3. Cette tradition est entretenue en Russie travers l'influence de Baudouin de Courtenay (1845-1929) et de F.F. Fortunatov (1848-1914), fondateur de l'cole linguistique de Moscou. Elle imprimera sa marque propre au dveloppement de tous les domaines de la linguistique et reste trs vivace dans la priode qui nous occupe ici. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

TRADUCTION AUTOMATIQUE EN URSS

107

en partie, leur ont permis de jeter les bases d'une linguistique originale, de telle sorte que le mathmaticien V.A. Uspenskij (n en 1937), qui a particip ces travaux, a qualifi l'poque 1955-1967 de cercle d'argent de la linguistique russe. Enfin, les Sovitiques se trouvent confronts des pro blmes linguistiques et algorithmiques spcifiques lis la direction dans laquelle s'opre la traduction. La traduction anglais /franais vers le russe, laquelle ils doivent s'atteler, impose des contraintes trs diffrentes de la traduction du russe comme langue source, qui est le lot des Amricains. La commande des autorits en URSS est spcifique. Outre les besoins de traduction scientifique et technique, proccupation commune tous les tats au lendemain de la Seconde Guerre mondiale, il existe en URSS une vo lont politique de traduction du russe en diverses langues de l'Union. La traduction multilingue correspond une ncessit. Si, ds le dpart, les Sovitiques confrontent leurs propres recherches aux travaux amricains, du moins ceux qui leur sont accessibles, ils cherchent dvelopper des conceptions et des mthodes originales et enracines dans une continuit scientifique et culturelle. La langue intermdiaire constitue prcisment l'un des thmes les plus originaux des recherches russes en TA. La question de la traduction multilingue et l'ide d'utiliser une langue intermdiaire n'taient certes pas totalement absentes des premiers travaux amricains, ainsi qu'en tmoignent plusieurs articles du premier recueil de TA, publi en 1955 par A.D. Booth et W.N. Locke. Reifler prconisait d'utiliser, des fins de traduction multilingue, une langue grammaire et morphologie simple telle que le chinois comme pivot language. Booth voquait la cration d'une langue artificielle, le Machinese (y avait-t-il jeu de mots ?), susceptible de rendre compte des concepts de toutes les langues. S. Dodd proposait quant lui une version simplifie et standardise de l'anglais, le Model English. Enfin, Dostert se dclarait en faveur du dvelop pement d'une syntaxe gnrale (core syntax). Toutefois aucune de ces ides, issues de conceptions trop diverses, peu tayes thoriquement4 ou bien ne trouvant pas d'cho dans les discussions en cours, n'a donn lieu une vritable application, l'exception du groupe britannique de Cambridge qui a dvelopp une mthode smantique par thesaurus dont Halliday a propos une version multilingue en 1956. Seuls les Sovitiques ont vritablement ralis des algorithmes fonds sur un modle de langue intermdiaire.

4. Les proccupations amricaines taient davantage orientes vers la cration de grammaires universelles. Ainsi L. et A. Wundheiler exposaient la ncessit d'un langage universel logique pour la TA, inspir des travaux de Carnap et d'Ajdukiewicz. Cependant, mme si les premires recherches de Bar-Hillel sur les grammaires catgorielles partir des travaux d'Ajdukiewicz et de Harris ont t effectues dans le cadre de son groupe de TA au MIT, les grammaires formelles vise universelle se sont dveloppes dans un contexte de mathmatisation de la grammaire dont toute proccupation technologique tait absente. Elles ne furent donc gure envisages comme mthodes de TA. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

108

S. ARCHAIMBAULT, J. LON

Dans cet article, nous nous proposons d'examiner en quoi la question d'une langue intermdiaire, en tant que mthode de TA, rencontre, d'une part, un fort besoin de traduction du russe en diverses langues, li au multiliguisme rgnant dans l'Union, et d'autre part une tradition linguistique encore trs vivante en URSS, celle de la linguistique compare issue de Baudoin de Courtenay. La langue intermdiaire s'inscrit galement dans la tradition de la standardisation de la langue russe promue par des esprantistes comme Drezen. Enfin, il convient de considrer une troisime source rpondant une demande conjointe de traduction multilingue et de productivit technique : c'est la machine de Trojanskij, premier projet d'automatisation de la traduction conu en 1931, bien avant l'apparition des premires calculatrices lectroniques en 1945. Autant de sources qui contri buent la spcificit russe de la langue intermdiaire et qui vont conduire les premiers exprimentateurs envisager la traduction travers la mise en uvre de caractristiques communes diverses langues. On verra galement comment la ralisation de modles de langue intermdiaire par Bel'skaja, Andreev ou Mel'uk est traverse par une rflexion thorique la fois sur les algorithmes et sur le travail linguistique de recherche des caractristiques communes aux langues ncessaires la TA. 1. LE PROBLME DU MULTILINGUISME Le multilinguisme est, pour la Russie, un problme rcurrent autant qu'ancien. La claire conscience de ce multilinguisme accompagnait dj les expansions territoriales de Pierre le Grand, puis de Catherine II au XVIIIe sicle. Elle s'exprimait dans le recueil command par Catherine II Simon Pallas (1741-1811). Dans son Avis au public concernant les vocabul airescompars des langues de toute la terre (1785) 5, Pallas dcrivait L'Empire de Russie qui s'tend sur une grande partie de cette Asie, partie presque inconnue aux savants dans les temps antrieurs Pierre le Grand, [et qui] contient sans doute plus de nations et de peuplades, de langues et de dialectes qu'aucun autre Royaume de la terre. L'espace trs resserr du Caucase, habit par des peuplades peu nombreuses et trs voisines entre elles, recle plus de vingt-deux dialectes de huit ou neuf langues diffrentes. La Sibrie, plus vaste, en offre un plus grand nombre encore, et la seule presqu'le de Kamtchatka, dont la population, lors de sa dcouverte par les Russes, ne semblait que commence, contenait neuf dialectes diffrents de trois langues htrognes. Le problme de la dfinition d'une langue commune cet empire se po sait dans le mme temps. Tout au long du XVIIIe sicle, s'est labore la codification de la norme de cette langue vulgaire commune, aux confins de 5. Cf. Traduction de Dariusz Adamski, dans Caussat P., Adamski D., Crpon M. (1996), La Langue, source de la nation ; messianismes sculiers en Europe centrale et orientale du XVIIIe sicle au XXe sicle, Lige, Mardaga. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

TRADUCTION AUTOMATIQUE EN URSS

109

la grammaire slavonne et des descriptions du russe vemaculaire qu'avaient produites les trangers. Il n'est pas le lieu ici de dvelopper la perptuelle tension entre la prescription d'un russe stabilis et norme et la prise en compte d'un multilinguisme de fait, dont la vigueur est attise par les v nements actuels. Il importait pour notre propos d'voquer une situation qui n'a fait que se perptuer et que l'on peut rsumer ces quelques chiffres relativement rcents : Les rsultats d'un recensement de la population men peu avant l'clatement de l'URSS (1979), rvlaient que 28,1 % des habitants de l'Union Sovitique, soit 73 millions de personnes, taient bilingues, pour 61 millions d'entre eux, soit 23,4 %, le russe tait une deuxime langue6, ce qui nous indique au passage que les sujets bilingues sont majoritairement des sujets non russes . On comptabilisait 130 langues reprsentes, appar tenant 9 groupes diffrents : indo-europennes, caucasiques, sino-tibtaines, mongoles, palo-asiatiques, samoydes, tungouses-mandchoues, turkes, finno-ougriennes. 2. TRADITION LINGUISTIQUE COMPARE ET PROTO-LANGUE C'est Vjaceslav Ivanov, n en 1929, connu pour ses travaux sur l'indoeuropen et le hittite, qui propose de rinvestir dans la rflexion sur la lan gue intermdiaire l'immense travail thorique et pratique men par la li nguistique historique et compare. Ses propositions, contenues dans sa parti cipation la Confrence de Linguistique Mathmatique de 1959 (Thorie des relations entre les systmes linguistiques et fondements de la linguistique historique et compare), connatront un vaste cho ainsi qu'une influence certaine, sur les conceptions d'Igor Mel'uk notamment, dont Ivanov fut le directeur de thse. L'ide en est que les mthodes de comparaison des faits de langue sont largement prouves, mais qu'une mtathorie capable de dcrire la structure formelle de la comparaison, une thorie des relations des systmes linguisti ques reste construire. Cette thorie serait d'une importance capitale pour nombre de disciplines scientifiques nouvelles, de l'anthropologie structurale la traduction automatique, en passant par la thorie de l'information. Elle s'appuierait sur une langue abstraite, nomme proto-langue, qui ne serait pas reprsentative d'un tat antrieur d'une langue donne, mais qui en constituerait le systme abstrait, au sens o celle-ci reclerait toutes les potentialits communes un groupe de langues, que ces potentialits soient exprimes ou non. La proto-langue serait obtenue grce la mthode comparatiste, par reconstruction interne d'un sous-systme, compatible avec le

6.

Selon les rsultats d'un recensement men en 1979, cits par G. A. Zograf (1990), in Lingvisticeskij enciklopediceskij slovar', Moskva, Sovetskaja Enciklopedija. Histoire pistmologie Langage 19/11 {1997) : 105-132 SHESL, PUV

110

S. ARCHAIMBAULT, J. LON

systme dans son ensemble. C'est cette proto-langue que propose Ivanov comme langue intermdiaire pour la TA. Il s'inscrit ici dans l'hritage direct de Baudoin de Courtenay [18451929], puisqu'il fait rfrence explicitement la thorie de la mixit de toutes les langues que dveloppait Baudoin7. Ivanov retient un systme li nguistique diffrenci, c'est--dire compos d'une srie de systmes dont chacun peut tre rapport un autre systme : La thse de Baudoin de Courtenay sur le caractre mixte de toutes les langues se rduit l'affirmation d'une possibilit de diffrenciation de tout systme de langue. Ivanov reprend en outre deux autres ides fortes de Baudoin de Courtenay, savoir le caractre artificiel de la langue mre recre par le linguiste et sa conception de la langue nationale comme systme abst rait. Prenant ses distances avec les explications gntiques et organiques, Baudoin posait que ces langues, restitues par la science, ne sauraient tre prises pour des langues relles, mais pour des faits scientifiques, obtenus par dduction 8. Il prconisait des analyses typologiques pour faire apparat re les caractristiques communes des langues affilies. Pour Baudoin de Courtenay, les langues recres sont des observatoires, ce qui entre en cohrence galement avec sa vision de la langue nationale, vue comme une abstraction des faits typiques, conformes la loi gnrale et essentiels aux langues individuelles. Elle se prsente comme une pure abstraction, un difice d'unification. Les langues artificielles, ncessitant un travail conscient de type mtalinguistique (langue littraire, langages des

7.

L'article intitul O smescannom xaraktere vsex jazykov [Du caractre mixte de toutes les langues] constitue la leon inaugurale du Cours de grammaire compare des langues slaves en relation avec les autres langues aryoeuropennes prononc le 21/09/1900 l'Universit de Saint-Ptersbourg, publi dans urnal Ministerstva Narodnago Prosvescenija, Tom CCCXXXVII, 1901 [Revue du ministre de l'Instruction publique]. Baudoin y dveloppe l'ide que la mixit des langues, mixit gographique et historique, est un phnomne incontournable et concernant toutes les langues. Mixit gographique, car les situations de confins crent les conditions de la polyglossie, mixit chronologique, car la langue ancienne peut s'incruster dans la langue moderne, ou mme exercer une influence sur la langue moderne (dans le cas par exemple de la langue religieuse). La mixit des langues joue dans deux sens : elle apporte dans une langue donne des lments provenant d'une autre langue (lexique, constructions syntaxiques, morphologie, prononciation...), elle est responsable de l'aplanissement de la force de diffrenciation , qui existait entre divers lments d'une langue particulire. Au titre de ses effets, on compte l'homognisation, l'aplanissement, la perte du caractre flexionnel, l'extension des formes analytiques... 8. Cf. l'article Nekotoryja obSCija zameCanija o jazykovedenii i jazyke [Quelques remarques gnrales sur la linguistique et la langue], leon inaugurale prononce pour l'ouverture de la chaire de grammaire compare des langues indo-europennes (17/29 dcembre 1871, Universit de Saint-Ptersbourg). Des extraits en ont t traduits par Dariusz Adamski dans Baudoin de Courtenay et la linguistique gnrale , LINX 23, Traduction de textes peu ou mal connus. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

TRADUCTION AUTOMATIQUE EN URSS

111

mtiers...) apparaissent comme autant de sous-systmes de la langue natio nale. La proto-langue que propose Ivanov comme langue intermdiaire est bien dote des particularits dcrites prcdemment. Il s'agit bien, comme c'tait le cas chez Baudoin de Courtenay, non d'un modle a priori, mais d'un systme second, d'un modle intgrant les caractristiques potentielles des diffrentes langues tudies au pralable, d'un modle volutif capable de s'ouvrir de nouvelles langues, condition de suivre un protocole d'intgration. Nous reviendrons plus loin sur quelques mises en uvre de cette proto langue dans des modles de langue intermdiaire, et nous retiendrons pour l'instant qu' Ivanov voit ici un moyen de revivifier la rflexion issue du comparatisme, et le vaste matriau linguistique produit par ce courant, trs puissant en Russie, mais aussi dans cette fin des annes 50, trs dconsidr d'avoir servi de nourriture intellectuelle au marrisme et sa thorie de la stadialit 9. 3. DREZEN ET V INTERNATIONALISATION PROPORTIONNELLE DES LANGUES, 1937 Un autre courant extrmement fort avant-guerre, auquel Baudoin de Courtenay 10 avait apport galement une participation minente, puisqu'il contribua la popularisation de l'espranto , c'est l'laboration des lan gues artificielles. La situation rvolutionnaire, l'ide d'une exportation de la rvolution la plante entire, ont promu les travaux sur les langues inter nationales. C'est le cas de la langue cosmique, langue de communication internationale, dite langue AO, qui fut cre par Gordin en 1920, dans le sillon du phnomne de dimension cosmique qu'est la rvolution (cf. Kuznecov 1995). Dans les annes 30, la construction des langues auxiliaires est encore l'ordre du jour, ravive par la forte demande terminologique qui accompagne le dveloppement des techniques. Ces travaux retentiront ga lement sur les projets de langue intermdiaire. Le courant liant la standardisation de la langue scientifique et technique et les langues internationales artificielles est reprsent, tant au niveau scien tifique qu'institutionnel par Ernest Karlovic Drezen, bolchevik de premier plan, responsable de la standardisation de la langue auprs du Commissariat du peuple la guerre et esprantiste eminent : Membre, puis Prsident, de la

9. Ivanov insiste sur le fait que les mthodes de formation des modles abstraits communs aux langues apparentes doivent tre mises en vidence par des recherches typologiques dans le domaine de l'anthropologie structurale et ne pas tre postules a priori . 10. On rappellera que le manuel fondateur de l'espranto rdig par Lejzer Ludwik Zamenhof, parut pour la premire fois en russe en 1887. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

112

S. ARCHAIMBAULT, J. LON

socit Espro, membre de la socit Kosmoglott, avec Baudoin de Courtenay, entre 1915 et 1918, il en devient secrtaire perptuel en 1925, il est galement secrtaire gnral de l'Union des esprantistes, membre du Jazykfront (Front de la Langue). Auteur prolifique, dont l'uvre sera brutalement interrompue en 1936 par son arrestation, puis son excution {cf. Tatarinov 1993), Drezen affronte deux problmes principaux : la ncessit d'arriver une langue technique standardise et le rapport de cette langue aux langues nationales d'une part, la langue internationale d'autre part. Dans son dernier ouvrage, paru en 1936, intitul L'Internationalisation de la terminologie scientifique et technique, Histoire, actualit et perspectives, Drezen tudie de prs les diffrentes langues universelles ayant exist ou existant. Il critique l'usage du latin comme langue scientifique contempor aine (Drezen, op. cit., 12), et rfute de la mme faon toute langue artifi cielle ou semi-artificielle obtenue partir d'une langue nationale, ce pour des raisons linguistiques (elle sera accessible surtout aux locuteurs de cette langue nationale, ou la rigueur des langues proches), mais aussi idologi ques11. Dans la socit capitaliste, les contradictions inhrentes la socit concernent galement les langues : les unes rechercheront l'hgmonie, les autres survivre et se maintenir. Drezen dveloppe des arguments en faveur d'une langue internationale cre de toutes pices. En effet, du point de vue strictement terminologique, l'imprcision, la polysmie des notions et des termes scientifiques et techni quesrepris des langues naturelles sont pour lui rdhibitoires. S' appuyant sur l'inadquation de termes tels Force-Cheval, losadinaja sila, Pferdestrke, Horse-Power n, il souligne la complication qu'il y a tablir des dictionnai res techniques bilingues, les normes difficults d'harmonisation ds que l'on passe une troisime langue, sans mme envisager le cas des diction nairespolyglottes. Selon Drezen, seule une langue internationale artificielle peut tre univoque. La tche reste accomplir. Or, si l'on tient compte du fait que la science et la technique se dveloppent une vitesse acclre, et que les besoins en terminologie sont paralllement accrus, il y a urgence proposer des voies d'unification. C'est le but que se fixe Drezen, qui uvre au sein des instances internationales, telles que Y Association Internationale de Normalisation, dans laquelle il tente de faire prvaloir les ides sovitiques,

11. Drezen cite l'exemple du latin sans flexion, l'Interlingua de Peano. 12. Tout d'abord, la signification technique du terme (soit 75 kilogrammtres/sec = 0,736 KW) est en dcalage avec le mode de dsignation mtaphorique, mais en plus, le Horse-Power des Anglais excde cette force mtrique de 1 %. (Drezen, op. cit., 24). Nous remarquerons que le terme force-cheval employ par Drezen ne semble pas attest en franais. C'est le terme cheval-vapeur qui est attest depuis 1922. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

TRADUCTION AUTOMATIQUE EN URSS

1 13

nourries des ides internationalistes qui avaient dj guid Mendeleev, et que Drezen cite ce propos : Toute personne qui comprend que viendra le jour d'un rapprochement troit des peuples se doit de prparer le lien, aussi solide que possible, qui les unira. L'homognisation des classifications scientifiques et techniques et de la terminologie affrente constitue un jalon vers ce rapprochement ultime. Si, pour Drezen, l'ide forte d'une normalisation linguistique serait de supprimer du langage technique toute quivocit dans les termes, la syno nymie, l'homonymie, les ambiguts, la pseudo-internationalisation de cer tains termes, il reste raliste et prne une internationalisation proportionnelle de la langue technique, une mise en place progressive, par le biais notam mentdes termes nouveaux, de la future langue mondiale, dans son esprit, l'espranto. terme, l'volution de la socit menant une socit sans classe rejoindra l'volution de la langue qui se sera progressivement interna tionalise. Il s'agit d'un horizon lointain, vers lequel doivent tendre les d cisions fragmentaires prises dans le domaine de la standardisation linguistique. Les propositions qu'il fait en ce sens devant V Association Internationale de Normalisation de Stockholm en 1934 recevront un certain cho, puisque la Confrence confie l'URSS le soin d'avancer des propositions nouvelles sur ces questions {cf. rsum franais et espranto, Drezen 1936, 97). Le dbat sur les langues internationales est encore vif, y compris au ni veau institutionnel. Les problmes concerns sont tout autant la communicat ion scientifique, les rapports entre les scientifiques eux-mmes, les immens es besoins terminologiques qui accompagnent le dveloppement des scien ces et techniques. Par ailleurs, on assiste un important effort de traduction en russe de textes techniques et scientifiques trangers. Il existe donc cette poque en URSS une demande accrue, lie aux besoins de terminologie dans les diffrentes langues de l'Union, ainsi qu'une ncessit d'opter pour une langue de communication scientifique commune. Ce sont ces mmes problmes que tente de rsoudre l'ingnieur P.P. Smirnov-Trojanskij (1894-1950) avec sa machine traduire. Partant du constat qu'il est impossible de traduire par d'anciennes mthodes la masse sans cesse accrue des textes , il propose d'largir la traduction la mcanis ationqui a dj fait ses preuves dans maints domaines d'application. 4. LA MACHINE DE TROJANSKIJ, 1931 Les objectifs de Trojanskij sont donc pris dans l'air du temps, et c'est avec certitude qu'il fustige le rflexe passiste qui consiste nier l'importance de la mcanisation et de la standardisation dans le nouveau mode de vie ; celles-ci sont pour lui inluctables, preuve en est les nom breux domaines dans lesquels elles sont appliques. L'analogie avec la m-

Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

114

S. ARCHAIMBAULT, J. LON

canisation des campagnes n'est pas anodine : On peut fort bien semer le grain la main. Mais il existe des semeuses mcaniques tires par des trac teurs . La Machine pour la production automatique des traductions im primes en plusieurs langues, ne ncessitant qu'une mise au point litt raire , laquelle il travaille ds 1931, sera dcrite dans un mmoire dat du 29 juillet-3 octobre 1933 13. Comme base d'automatisation de la traduction, Trojanskij postule une structure commune toutes les langues, au del de leur diversit ; entre la langue-source et la langue-cible, il suggre de passer par un texte intermd iaire,qu'il dit logique, qui consiste en fait en une suite de mots apparais sant leur forme grammaticale de base, comme autant d'entres de diction naire qui seront ensuite traduites : J'ai pris pour point de dpart l'existence d'une structure logique unique dans toutes les langues : un sujet reste toujours un sujet, un verbe un verbe et un complment un com plment etc. Cette unit de construction logique cre un rapprochement entre les langues, malgr la diversit de leur structure, de leur grammaire et de leur vocabulaire. Elle rend les difficults surmontables. Dans le systme de Smirnov, un traducteur obtient, partir d'un texte en langue source A, un texte en langage logique A 1, que la machine traduira automatiquement en langage logique B 1, grce un dictionnaire qui traduit automatiquement les entres. Le deuxime texte en langage logique ainsi obtenu sera ensuite arrang manuellement par un rdacteur en langue cible B, selon le modle ci-dessous d'une traduction de l'allemand simultanment en russe et en franais 14.

13. Cf. (Hutchins 1993) pour la description du fonctionnement de cette machine, et pour sa reprsentation tablie sur la base d'un schma figurant dans le brevet de Trojanskij, datant de 1933. 14. A est la langue source, B et C les langues cible ; Al (rsultat de l'analyse), Bl et Cl (entre de la synthse) sont les textes en langage dit logique, ils sont suivis d'une marque de reconnaissance du verbe (as) et du nom (o). Selon Hutchins (1993), qui a eu accs l'ensemble des travaux publis de Trojanskij, ces formes logiques sont empruntes l'espranto. Trojanskij prvoyait terme d'automatiser le travail du rdacteur qui opre partir de la langue source, en construisant une machine capable d'effectuer le travail pour le rdacteur nomm le logicien . Cette machine devait pouvoir reconnatre des traits morphologiques ou syntaxiques permettant de distinguer un verbe d'un substantif. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

TRADUCTION AUTOMATIQUE EN URSS A Das Bild der Welt zeigt, wie die Materie sich bewegt wie die Materie denkt Al Das Bild - o die Welt de - o zeigen - as wie die Materie - o sich bewegen as wie die Materie - o denken - as (Bl +C1) (B+C) KapTMHa - o Le tableau -o KapTMHa le monde de - Mwpa MMp de -o o noKa3HBaTb - as montrer - as noKa3UBaeT, Kaic comment KaK MaTepuH - o la matire - o MaTepHH se mouvoir - iiBuaceTCH, ilBHrabca - as as comment KaK KaK la matire o MaepMH - o MarepHH penser - as MbICJlHTb - as MbICJlHT

115 Le tableau du monde montre comment la matire se meut comment la matire pense

Pour Trojanskij, le grand intrt de la mthode rside dans le fait qu'il s'agit d'une mthode de traduction monolingue, chaque traducteur pouvant ne connatre qu'une langue et une seule : il met ainsi le travail de traduction la porte de tous les citoyens, puisque ce travail s'apparente aux exercices des coliers du cours lmentaire qui dcomposent un texte de leur langue maternelle en parties de propositions et en parties de discours . La ma chine pouvant traduire le langage logique source en plusieurs langages logi ques cible, la restitution en langue nationale partir de la langue inte rmdiaire peut tre effectue par le destinataire du message. Selon Trojanskij, les avantages conomiques de la mthode sont nom breux : outre la possibilit de faire appel des traducteurs non qualifis, elle permet de publier des textes en langage logique directement, pour une tr aduction rapide dans plusieurs langues cible, de faciliter les changes de cor respondances (notamment scientifiques) entre personnes parlant des langues diffrentes, ainsi que les traductions de livres et revues, de traduire simult anment en plusieurs langues. Plus le nombre de ces langues est lev, plus le prix de revient est bas. Selon Trojanskij, qui se garde de spcifier sa m thode de calcul, on peut raliser des conomies allant jusqu' 99 %. C'est l'embryon de langue intermdiaire qui permet de comprimer les cots. Il rfute d'ailleurs le fait que sa machine soit uniquement un dictionnaire. Pour lui, il y a rellement langage intermdiaire en l'espce de ces marqueurs de verbe et de nom 15. Trojanskij croit en l'avenir de sa machine traduire ; il travaille aux applications jusqu'en 1939, puis aprs un arrt forc, il revient son projet en 1947. Ce sont les pionniers de la TA en URSS, Bel'skaja, Panov et Korolev qui publieront en 1959 une dition commente de l'ouvrage que Trojanskij avait rdig en 1947 : De la machine traduire, construite sur la base d'une mthode monolingue. Ils insistent sur la prcocit de ce travail, 15. En ce sens, la machine de Trojanskij se distingue de la mthode de traduction interlinaire (cf. Auroux 1979, 194-196). Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

116

S. ARCHAIMBAULT, J. LON

ainsi que sur l'ampleur des problmes que l'auteur avait abords, tentant d'instaurer ainsi les Russes comme pionniers dans le domaine de la TA. 5. LES PREMIRES EXPRIENCES DE TA : PRSENTATION DES CENTRES DE RECHERCHES (1954-1960) Ces recherches se dvelopprent dans cinq principaux centres, quatre Moscou et un Leningrad {cf. Harper 1960, Hutchins 1986). Moscou, deux centres au sein de l'Acadmie des Sciences font de la TA. D. Ju. Panov, qui avait assist la premire dmonstration de TA sur calculatrice lectronique New-York en 1954, dirigeait le groupe de TA au sein de l'Institut de mcanique de prcision et de calcul mcanique dirig par l'acadmicien D.S. Lebedev. N en 1904, docteur s-sciences techni ques, Panov est spcialiste des problmes mathmatiques poss par la tech nique moderne. Son groupe, prconisant l'utilisation du russe comme langue intermdiaire, comprenait une philologue, I.K. Bel'skaja, spcialiste d'anglais, et des ingnieurs lectroniciens tels que L.N. Korolev, A.I. Muxin et S.N. Razumovskij. Le centre de TA de l'Institut de mathmatiques Steklov de l'Acadmie des Sciences de Moscou (MIAN) tait dirig par A.A. Ljapunov (19111973), docteur s-sciences. Spcialiste de balistique des fuses, il avait un poids politique et militaire important qu'il utilisa pour promouvoir les r echerches en TA. Ce groupe, l'orientation fortement thorique, comprenant galement la mathmaticienne O.S. Kulagina et la philologue T.N. MoloSnaja (nes toutes deux en 1932), contribua de faon spcifique au dveloppement de la thorie de la programmation. l'Institut de Linguisti que de l'Acadmie des Sciences de Moscou, le linguiste LA. Mel'cuk, n en 1932, dveloppa, partir d'un algorithme de traduction russe-hongrois, l'ide d'une langue intermdiaire. Il avait dvelopp auparavant en collabo ration avec Kulagina un systme de TA franais-russe. Outre ces grands instituts de l'Acadmie des Sciences, un sminaire heb domadaire anim par V. Ju. Rozencvejg au sein de l'Institut Pdagogique d'tat des Langues trangres de Moscou, l'Institut Maurice Thorez, regroupa les pionniers autour des premires discussions sur la TA. Cet institut accueillit des recherches focalises plus particulirement sur la thorie smantique, menes en particulier par I.I. Revzin (1923-1974). En 1958 le bulletin de l'Institut deviendra la revue de TA de l'URSS : Masinnyj Perevod i Prikladnaja Lingvistika. Alors qu' Moscou, la TA se dveloppe l'Acadmie des Sciences 16, Leningrad, c'est au sein de l'universit, au Laboratoire exprimental de tra-

16. Une des raisons de cette localisation tient au fait que Mel'cuk et Ivanov avaient t exclus de l'Universit de Moscou en 1957 pour avoir pris position en faveur de Pasternak. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

TRADUCTION AUTOMATIQUE EN URSS

1 17

duction par machine dirig par N.D. Andreev et rattach l'Institut de Mathmatiques et de Mcanique, que se dveloppent ces recherches. Spcialis dans l'examen d'un nombre considrable de langues diffrentes, ce groupe dveloppe les bases d'une langue intermdiaire, fonde sur les traits communs aux diffrentes langues 17. Ces grands centres sont les plus connus, mais de nombreux autres grou pessont aussi impliqus dans la recherche en TA. On en veut pour preuve le premier congrs sur la TA organis en 1958 Moscou qui rassembla quelques 340 participants issus de 79 institutions diffrentes. Lors de ce Congrs, la langue intermdiaire constituait un thme important et largement discut dans les dbats. 6. LES PROBLMES THORIQUES Lorsqu'ils entreprennent les premires expriences de TA, et en accord avec la tradition linguistique russe dont ils sont issus, les chercheurs vont mettre au premier plan l'ide que la traduction d'une langue une autre implique la mise en uvre d'invariants linguistiques et conceptuels com muns toutes les langues. De plus, les linguistes voient dans la TA, au-del d'objectifs purement pratiques, un lieu d'investigation totalement nouveau pour l'tude des langues, parmi lesquels l'examen des relations entre les expressions de la mme ide dans diffrentes langues (cf. Kuznecov, Ljapunov, Reformackij 1956). Par ailleurs, la rflexion thorique sur la traduction et la traductibilit des langues, quasiment absente des travaux anglo-amricains et europens en gnral l'ouvrage d'Eugne A. Nida Toward a science of Translating n'a t publi qu'en 1964 , est en revanche intense et continue en Russie depuis le XVIIIe sicle 18. Dans les annes 50, un important dbat anime les thoriciens de la traduction Moscou partir de la parution en 1953 de l'ouvrage de A.I. Fdorov (n en 1921) Introduction la thorie de la traduction , qui entreprend de poser les bases objectives d'une science de la traduction. Il est intressant de noter que l'ouvrage de Fdorov n'tait pas inconnu des exprimentateurs en TA (cf. Bel'skaja 1958). Les Russes adoptent une position critique l'gard de la conception amricaine des langues et de la traduction, reprsente par le Memorandum

17. G. S. Cejtin (n en 1936) et S. Ja. Fitjalov ont t rattachs un temps ce groupe, avant de crer, leur propre groupe, V Intelligent Systems Laboratory, encore existant, au sein du mme Institut (communication personnelle de G. Cejtin). 18. On pense par exemple la clbre colre de Pierre le Grand lorsqu'il eut en main la traduction en russe du Trait des fortifications (Istinnyi sposob ukreplenija gorodov, izdannyi ot slavnogo inzenera Vobana [...] Sankt Peterburgskaja Tipografja, 1724), dont la traduction littrale rendait impossible l'dification de fortifications. Il imposera alors que les traductions visent principalement la transmission d'informations directement utilisables. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL PUV

118

S. ARCHAIMBAULT, J. LON

de Weaver publi en 1949. Bien qu'ayant suivi, au dbut du moins, une dmarche empirique de traduction mot--mot, en tout point semblable celle de l'Universit de Georgetown, Panov (1956) et son groupe critiquent ex plicitement la position de Weaver selon laquelle la langue est un code et la traduction un dcodage. En codant et en dcodant, dit Panov, on ne change que la forme externe des mots sans toucher la langue elle-mme. Une telle tche peut tre rsolue par des mthodes formelles. Mais en traduisant, on a affaire des langues, c'est--dire, et c'est la position dfendue par Ivanov, des systmes complexes et subtils permettant d'exprimer des penses, ancrs dans l'histoire et les pratiques sociales. La traduction implique de transfrer du sens d'une langue l'autre et ne peut se traiter comme un changement de code. L'analyse des structures linguistiques ne peut donc elle seule rsoudre les problmes de traduction. Il faut aussi un systme smantique formel. Des considrations linguistiques sont aussi l'origine de la langue inte rmdiaire. La traduction de l'anglais vers le russe ne peut utiliser aussi la rgement l'analyse des flexions 19 qu'une traduction partir du russe. Il faut, par exemple, envisager des units de traduction diffrentes du mot graphi que, unit de la traduction mot--mot cf. Molosnaja 1957 qui propose une analyse en constituants immdiats issus de Fries . Les proprits sp cifiques des langues vont aussi imposer d'autres contraintes de traduction. Alors que, dans la traduction de langues comme le russe, l'anglais, le fran ais ou l'allemand, il tait possible de considrer la diffrence d'ordre des mots comme ngligeable, ce n'est pas possible dans la traduction hongroisrusse. C'est une des raisons qui inciteront Mel'cuk (1958) envisager l'utilisation d'une langue intermdiaire. De plus, l'ide de langue intermdiaire va se trouver implique dans deux types de proccupations technologiques. La premire est d'ordre algorithmique : c'est l'indpendance des algorithmes d'analyse et de synthse. La seconde est lie une conception de la TA, non comme une fin en soi, mais comme la premire tape d'un programme plus gnral visant utiliser les machines lectroniques comme des outils auxiliaires de la pense humaine. Deux autres points, qui seront au cur des premires tentatives de cration d'une langue intermdiaire, concernent la comparaison des langues : (i) il s'agit de savoir s'il est prfrable de dfinir des relations formelles entre une langue artificielle et chacune des langues naturelles considres ou entre deux langues naturelles ; (ii) ds lors que la langue intermdiaire repose sur les invariants des langues considres, que faire de la variation ?

19. Dans un article de 1957, MoloSnaja, Purto, Revzin et Rozencvejg tiennent le russe pour une langue riche en possibilits formelles, grce notamment ses terminaisons casuelles qui le rendent intressant comme langue source pour la TA. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

TRADUCTION AUTOMATIQUE EN URSS Langue intermdiaire et thorie des algorithmes

1 19

Ds 1954, Lon Dostert (Locke et Booth, 1955), directeur du groupe de Georgetown et instigateur de la premire dmonstration sur ordinateur, ex pose l'intrt d'une langue intermdiaire (une syntaxe noyau) pour la TA multilingue. L'argument est essentiellement conomique : dans le cas de la traduction binaire on a besoin de N (N-l) algorithmes pour N langues traduire ; grce une langue intermdiaire, il n'en faut plus que 2*N. Mais au-del de cette raison conomique, reprise d'ailleurs par les Sovitiques, l'utilisation d'une langue intermdiaire a des causes plus pro fondes. Pour Mel'cuk (1959), l'utilisation d'une langue intermdiaire sert non seulement conomiser le nombre des algorithmes mais les standardis er. Il insiste sur la ncessit d'laborer une thorie gnrale de la compilat ion des algorithmes de traduction, laquelle doivent participer les mathm aticiens. Celle-ci a pour objectif de mettre au point une forme universelle d'algorithme de traduction et de gnraliser les rgles d'applications aux langues concrtes 20. L'indpendance des algorithmes d'analyse et de synthse L'attention des Sovitiques porte au processus de traduction lui-mme, c'est--dire au transfert de sens entre langue source et langue cible, les con duit distinguer, sur le plan algorithmique, le processus d'analyse de celui de synthse21. Les russes {cf. Panov, Ljapunov et Muxin 1956) reprochent aux travaux amricains, orients vers la traduction mot mot, la liaison trop troite entre dictionnaire et procdure de traduction, ce qui favorise la seule analyse de la langue source au dtriment de la synthse en langue cible. Ils critiquent tout spcialement le fait que les instructions charges d'effectuer

20. Ces proccupations font cho un certain flou sur l'utilisation des termes algorithme et langue intermdiaire par les exprimentateurs de TA {cf. Andreev, Ivanov, Mel'cuk 1960 et Mel'cuk 1961). Selon certains, la langue intermdiaire est directement un algorithme. Pour d'autres, elle est indpendante. Ainsi Yngve soutient que la plupart des mthodes utilisent de fait une langue intermdiaire dans leurs algorithmes : dans le dictionnaire franais-anglais du groupe de Birbeck College de Londres, l'quivalent anglais du mot franais correspondant n'est pas directement stock, c'est son adresse qui est stocke, et c'est cette adresse qui constitue dans ce cas, selon Yngve, une langue intermdiaire. 21. Yngve suggra trs tt l'utilisation d'une langue intermdiaire et la dissociation analyse-synthse et cette proposition tait connue des sovitiques {cf. Mel'cuk 1961). Toutefois aucun algorithme concret ne fut ralis et il prfra dvelopper une autre mthode, la mthode dite de transfert fonde sur une analyse syntaxique des langues source et cible. Lors du premier congrs sovitique sur la TA qui s'est tenu Moscou en mai 1958 {cf. Nikolaeva 1958), I.I. Revzin rinsre dans la tradition russe l'ide d'une approche spare entre analyse et synthse en la rapprochant de la distinction entre grammaire active (la synthse) et grammaire passive (l'analyse) effectue par l'acadmicien Scerba propos de l'enseignement des langues. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

120

S. ARCHAIMBAULT, J. LON

l'analyse grammaticale soient directement associes aux mots contenus dans le dictionnaire et prconisent au contraire un dictionnaire indpendant du programme de traduction. Ce traitement dclaratif du dictionnaire, op pos au traitement procdural des Amricains a, selon eux, deux avantages : le dictionnaire est rendu aisment modifiable et la synthse en langue cible est indpendante de l'analyse de la langue source. Langage d'information et langue intermdiaire Pour la plupart des chercheurs sovitiques {cf. Mel'Cuk 1959), la TA n'est qu'une premire tape d'un programme plus gnral de traitement de l'information, de son extraction et de son stockage partir de textes crits dans diffrentes langues, tel qu'diter, faire des rsums, fournir des rfren ces bibliographiques etc., et pour lequel il faut un langage spcial. Le langage d'information ainsi conu a un usage documentaire. La TA fait donc partie d'un projet plus vaste mobilisant toutes les nergies22. En ce qui concerne la TA, les approches seront diffrentes selon les con ceptions linguistiques et algorithmiques prsidant au transfert d'information : entre deux langues naturelles ou entre une langue naturelle et une langue artificielle. Panov sera ainsi amen distinguer nettement la langue intermdiaire, qui doit tre une langue naturelle, d'une langue d'information artificielle23. Pour Mel'Cuk et Andreev, au contraire, le langage d'information peut aussi servir de langue intermdiaire pour la TA. 7. LE RUSSE COMME LANGUE INTERMDIAIRE Dans les toutes premires expriences menes par le groupe de Panov, la langue intermdiaire, consacre exclusivement la confection d'algorithmes multilingues, doit tre une langue naturelle. Panov (1956) carte les langues artificielles, telles que les langues internationales a posteriori comme l'espranto, l'interlingua, le volapiik, qu'il tient pour incapables de transmett re la richesse des langues naturelles. Il carte galement l'ide de construire une langue spcifique adapte la traduction et propose le russe comme langue intermdiaire. Les arguments en faveur du russe sont galement conomiques. Bel'skaja (1958) soutient que le russe est la langue intermdiaire qui convient le 22. Une rsolution du 20e Congrs du PCUS de 1956 a promu de faon explicite la TA comme projet scientifique prioritaire. 23. Pour Panov, la cration d'une langue d'information est directement lie la TA et la rsolution des ambiguts smantiques. Cette langue, qui doit tre univoque, rappelle la langue univoque de Drezen. Couple avec l'utilisation de micro-glossaires spcialiss, elle est destine dcrire le contenu d'un article scientifique dans ses grandes lignes, de faon rsume et sans ambiguits. Toutefois le groupe de Panov n'a jamais ralis de langue d'information qui est reste l'ide de projet. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

TRADUCTION AUTOMATIQUEEN URSS

121

mieux puisque c'est la langue du pays au profit duquel se font les traduc tions. La version russe, obtenue en passant , de tout ouvrage scientifique faisant l'objet d'une traduction, rpond aux besoins de l'URSS en matire de traductions scientifiques et techniques. Enfin le russe est prsent comme comportant des proprits linguistiques tout fait aptes jouer le rle de langue intermdiaire. Ainsi la non-ambig ut morphologique du verbe russe permet d'identifier exactement la forme d'un verbe mme hors contexte. Il est intressant d'examiner ce dont parlent les auteurs lorsqu'ils envisa gent le russe comme langue intermdiaire. La position du russe dans le pro cessus de traduction (ci-dessous VAER), correspond la phase de consulta tion du dictionnaire et d'analyse de la phrase anglaise : E -> VER -> AER SR - R VAER E : phrase anglaise R : phrase russe A : phase d'analyse S : phase de synthse V : consultation du dictionnaire

VAER : consultation du dictionnaire + analyse de l'anglais vers le russe On reconnat ici l'influence de Trojanskij, que le groupe de Panov avait lu et dit (cf. 4 ci-dessus), sur cette conception du russe comme langue intermdiaire. Les informations grammaticales extraites des phrases anglaises lors de la phase d'analyse correspondent en effet ce que Trojanskij appelle analyse logique. C'est I.K. Bel'skaja24 (1958) qui a concrtis ce projet en ralisant un dictionnaire en vue de la traduction russe-anglais. Pour Bel'skaja, c'est la signification 'relative' des mots qui est importante pour la traduction, c'est-dire envisage du point de vue de la langue de sortie, plutt que leur s ignification absolue. L'examen d'un de ses exemples est tout fait clairant : anglais infos grams sur l'anglais infos grams sur le russe russe let particule adj aux us nom pron 1re pers plur sujet plur now I consider adv de verbe temps various adj operations nom fem plur. ace. virgule sparation de proposition

teper'

prdicat, fem, fut, 1re plur, ace. pers plur prend l'ace rassmo- razlicnye trim

operacii

24. Bel'skaja (1928-1964) tant morte jeune de maladie, le projet resta sans suite et ne donna lieu aucun systme de TA. Histoire pistmologie Langage 19/11(1997) : 105-132 SHESL, PUV

122

S. ARCHAIMBAULT, J. LEON

anglais infos grams sur l'anglais infos grams sur le russe russe

which adj conj -> nom conj SUJ ace -> plur ko to rye

be may verbe verbe prdicat modal forme prdicat impers. inf sauter l'ace sauter l'ace vers vers (*- -1) (*- -1) mozno

performed verbe

upon prp

vectors nom masc, plur. instrum.

prdicat, inf prend inverser le l'instrum. sujet en obj dir. prend l'ace vypolnit' nad

vektorami

Les trois premires lignes reprsentent le rsultat de la phase d'analyse, la quatrime, le rsultat de la phase de synthse. partir de l'analyse de la phrase anglaise, on obtient deux types d'informations grammaticales : les caractristiques invariantes de la forme anglaise (partie du discours, genre, nombre, personne) mais surtout des informations grammaticales sur la forme russe correspondante. Celles-ci peuvent tre des informations sur la morphol ogie mais ce sont aussi des instructions pour la construction de la phrase ou des syntagmes : par exemple la rection d'un verbe (+ accusatif) ou d'une prposition (+ instrumental), ou encore la faon de traduire un passif (prvoir l'inversion du sujet et de l'objet). Ce peut tre aussi des instructions de dplacement sur la squence, de strictes instructions de parsage si l'on peut dire. Cette conception de l'analyse devrait assurer, selon les auteurs, l'indpendance des algorithmes d'analyse et de synthse. Une fois l'analyse faite, il n'y a plus besoin de revenir au texte source. La synthse en russe, partir de la traduction mot mot et des informations grammaticales sur les formes russes, devient totalement indpendante de la phase d'analyse et du texte source. Les rgles de synthse ne dpendent pas de la langue source mais sont fondes sur du matriau linguistique russe, sur les rgles de fo rmation des mots russes et de rarrangement de l'ordre des mots. Ces informations sur les formes russes, dduites de l'analyse des formes anglaises, qui sont en fait des instructions pour la traduction attaches au lexique, constituent donc pour les auteurs la langue intermdiaire. Bien que les auteurs ne s'expliquent pas sur la faon dont cette dduction s'effectue automatiquement ce qui somme toute est la cl du proces sus , et qu'un tel positionnement du russe comme langue intermdiaire rduit les variations entre langues quelques traits de morpho-syntaxe qui peuvent tre mis en commun entre le russe et une autre langue des fins de traduction, on peut toutefois avancer l'hypothse que cette attention porte ce qui est identique d'une langue l'autre, et ce qui les diffrencie une langue peut prsenter une forme absente dans l'autre constitue un premier pas permettant d'chapper aux impasses du mot mot. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

TRADUCTION AUTOMATIQUE EN URSS 8. CONSTRUCTION D'UNE LANGUE INTERMDIAIRE ARTIFICIELLE

123

La construction d'une langue intermdiaire artificielle pose deux types de questions : (i) le rapport d'une telle langue avec les langues artificielles auxquelles, on l'a vu, la tradition linguistique russe n'est pas trangre ; (ii) la question de la reprsentation smantique des invariants linguistiques, et de leur traitement automatique dans un processus de traduction. Deux tentatives principales de cration de langues intermdiaires artif icielles ont t proposes par les Sovitiques. Celle d'Andreev, dont la m thode de construction s'apparente celles des langues internationales, est issue de l'ide de langue univoque d'information promue par Drezen. Celle de Mel'Cuk est un langage de reprsentation smantique abstrait, issu de la proto-langue d'Ivanov, qui s'apparente davantage aux langues universelles a priori, et qui est l'origine de son modle sens-texte. Langue intermdiaire et congruence des langues Pour Andreev, la construction d'une langue intermdiaire repose sur un traitement statistique des invariants linguistiques et sur une conception des langues comme faits sociaux. C'est une langue artificielle avec son lexique, sa morphologie et sa syntaxe propres, dont seules font partie les structures suffisamment distribues dans les langues naturelles examines, pondres, par le nombre de locuteur et le nombre de textes dj traduits. On reconnat l la position statisticienne se prvalant de neutralit qui, au XIXe sicle, prsidait au choix d'une langue internationale a posteriori (Rasmussen 1995) 25, ainsi qu'une tendance bien connue en URSS la planification chiffre; travers le terme mme de hiroglyphes, par lequel Andreev nomme les lments de sa langue intermdiaire, on reconnat un des vieux mythes de construction d'une langue parfaite des images, de mme que certains projets de pasigraphie du XIXe sicle (cf. Salmon 1992). Andreev propose de calculer pour chaque langue un indice de con gruence partir du nombre de hiroglyphes concordants (le hiroglyphe de la langue d'entre est le mme que celui de la langue de sortie) et non con cordants qu'elle comporte, et de la pondration qui lui est affecte. Soit la phrase anglaise suivante et sa traduction en hiroglyphes : the sun is a yellow star (J)5x4 +51 +<|>14>8t5 +<1>6t4 +52x2 +63x1 Les hiroglyphes sont des symboles crits sous forme de suites de lettres et de chiffres.

25. Selon une conception qui tenait les langues pour des faits sociaux, le choix d'une langue commune rsultait d'une analyse scientifique des langues en Europe en fonction des masses de population qui la parlaient et des zones gographiques o elle tait l'uvre. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

124

S. ARCHAIMBAULT, J. LON - les hiroglyphes smantiques correspondent aux units lexicales : par exemple l est le hiroglyphe smantique de sun. - les hiroglyphes formels correspondent aux informations grammaticales : 5 est le hiroglyphe formel de l'article dfini. - les hiroglyphes tectoniques traduisent l'ordre des mots : x4 est le hiroglyphe tectonique indiquant que l'article est suivi de N.

Cette langue se prsente comme l'intersection des proprits communes aux langues naturelles considres et comme une langue univoque d'information. C'est ce qu'indique la rfrence au systme hiroglyphique qui souligne le caractre double du systme de conventions permettant la fois d'attribuer une signification sans ambigut aux signes primaires d'une part, et aux combinaisons d'autre part. Toutefois, comme on le verra dans le 9 (ci-dessous), la question de la non-concordance des hiroglyphes n'est pas sans poser quelques problmes dans le processus de TA. Langage de reprsentation smantique abstrait Comme nous l'avions voqu plus haut ( 5), des raisons lies la na ture propre des langues naturelles conduisent Mel'euk l'ide d'une langue intermdiaire comme mthode de TA. En mettant au point un systme de rgles pour la traduction du hongrois en russe, il note l'intrt pour la TA du hongrois qui prsente des traits communs avec d'autres langues. Comme les langues turques, le hongrois est agglutinant. Comme l'allemand, il a des mots composs, des prfixes sparables, et des postpositions ayant la fonc tion de prpositions. Rsoudre les problmes de TA en hongrois permettrait donc de rsoudre les problmes de TA qui existent aussi dans d'autres lan gues. Le hongrois prsente toutefois une caractristique spcifique : l'ordre des mots est radicalement diffrent de celui du russe. La solution consiste soit concevoir une procdure spciale qui rende compte de ce changement pour chaque paire de langues, soit envisager une mthode dissociant analyse et synthse de faon neutraliser le problme de transfert de l'ordre des mots. Cette mthode, c'est la langue intermdiaire. Sur le plan de la traduction, Mel'uk partage la position de son matre Ivanov, selon laquelle la traduction n'est pas directement lie au sens des mots et que seule une analyse smantique peut rendre compte du transfert de sens entre une langue et une autre. Cette analyse doit tre plus prcise et plus objective que l'analyse smantique traditionnelle : il faut raliser un langage de reprsentation smantique abstrait. La langue intermdiaire de Md'euk est, comme la proto-langue d'Ivanov (cf. Mel'uk 1959), fonde sur une thorie gnrale des relations entre sys tmes linguistiques. Les langues sont des systmes globaux, non sparables en niveaux, et dont une thorie smantique doit rendre compte concept ion que partageront galement A.K. Zolkovskij (n en 1937) et Ju. D. Apresjan (n en 1930) qui ont mis au point avec Mel'Cuk le modle sens-texte partir de 1965. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

TRADUCTION AUTOMATIQUE EN URSS

125

La langue intermdiaire ne peut en aucun cas tre une langue naturelle. C'est un systme formel de correspondances entre langues naturelles qui n'a pas tre utilis pour la communication : il ne se parle pas et n'a pas be soin de se matrialiser26. La langue intermdiaire est conue comme un systme abstrait form de mots relis par des relations syntaxiques. De ce point de vue, dit Mel'cuk, elle est analogue un langage formel logico-mathmatique : les mots sont les symboles et les relations syntaxiques, les rgles dductives. On remarquera que, grce ces caractristiques, ce langage s'apparente une langue philosophique a priori27. Cependant, contrairement aux langues universelles a priori, la langue intermdiaire de Mel'Cuk doit rendre compte des proprits des langues naturelles, reprsenter leurs caractristiques uni verselles tout en prenant en compte le problme spcifique de traduction d'une langue l'autre. Mel'uk labore donc un systme smantique dont les catgories sont des significations (znacenija) syntaxiques et lexicales. Les significations syntaxiques dsignent les relations entre les lments de la langue. Les significations lexicales dsignent les liens entre la langue et le monde extrieur par rapport la langue. Ces significations sont universell es : elles sont identiques pour toutes les langues ; elles doivent pouvoir tre exprimes dans n'importe quelle langue ; enfin, tout nonc d'une langue doit pouvoir tre exprim par ces significations. Toutefois, ce sont des abs tractions qui n'ont pas ncessairement de ralisation concrte dans toutes les langues naturelles. Le systme abstrait de correspondances dpend du nombre de langues pour lequel il est labor. Si l'on ajoute de nouvelles langues, le systme se trouve modifi. Il a donc un caractre cumulatif et volutif et se prsente comme l'union des proprits des langues naturelles considres, alors que le modle d'Andreev se prsentait comme leur intersection. Toutefois, bien que toutes les diffrences entre langues puissent tre exprimes dans la lan gue intermdiaire, seules certaines, comme on va le voir, sont obligatoires. En effet, une des caractristiques de la smantique du langage abstrait est sa pauvret . Elle doit tre rduite un minimum d'ensembles smantiques simples.

26. Une langue intermdiaire sans matrialit linguistique est difficilement acceptable par les Sovitiques de l'poque. Ce sont les mathmaticiens, tel Uspenskij (1959), qui encouragent le plus le projet de Mel'Cuk en reconnaissant derrire sa langue intermdiaire un projet de grammaire universelle. 27. Les langues philosophiques a priori n'ont pas de finalit pratique de communication. Elles se prsentent comme une grammaire des ides ou une classification des connaissances. Indpendantes des langues naturelles, elles sont postules a priori : le travail du philosophe prcde celui du linguiste (cf. Couturat et Lau 1903, Histoire de la langue universelle, Paris, Hachette). Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

126

S. ARCHAIMBAULT, J. LON 9. LANGUES INTERMDIAIRES, VARIATIONS DES LANGUES ET TA

Dans ces modles, la focalisation du processus de traduction sur le trans fertde sens d'une langue une autre en s'appuyant sur les invariants li nguistiques se heurte prcisment au problme de la variation. Autrement dit, que faire des traits variants dans la langue intermdiaire ? Dans le modle d'Andreev, c'est la non-concordance des hiroglyphes entre langues source et cible qui pose le problme de la variation, et ceci diffrents niveaux : (i) prsence d'une caractristique morpho-syntaxique dans une langue et pas dans l'autre (c'est, on le verra, le problme principal trait par Mel'cuk) ; (ii) ralisation lexicale sur un nombre d'units diffren tes qui implique un changement de types de hiroglyphes. Ainsi to catch cold correspondant prostudit' sja en russe entrane le remplacement d'un hiroglyphe smantique par un hiroglyphe formel ; (iii) la polysmie se traduit par une non-concordance smantique. Face aux normes difficults que posent, pour la TA, ces trois types de non-concordance, surtout quand elles se produisent simultanment, Andreev propose de supprimer de la langue intermdiaire les hiroglyphes non con cordants, tels que les articles et le genre dans les langues romanes et ge rmaniques ou les classifieurs dans les langues bantoues. Cette solution a sus cit de nombreuses critiques28. Par ailleurs, tant donn les problmes poss par l'automatisation de la traduction, le projet n'a pas donn lieu des ex priences en machine. Pour Mel'uk (1960), les variations sont au cur du dispositif. Toutes les significations grammaticales ne sont pas identiques au regard de la traduct ion. Une bonne partie des informations morpho-syntaxiques, singulires pour chaque langue et utiles lors de l'analyse du texte en langue source, ne sont plus ncessaires lors de la phase de traduction proprement dite. Ainsi il n'est pas ncessaire de connatre directement le genre, le nombre, le cas d'un adjectif russe quand on traduit un adjectif russe en franais ou en all emand. Ce qui est important c'est d'avoir trouv, lors de la phase d'analyse, le substantif avec lequel s'accorde l'adjectif. Il en va autrement des indicateurs grammaticaux de significations lexical es, servant au reprage rfrentiel des lments lexicaux (nombre des noms, temps et mode des verbes, etc.) qui, eux, sont ncessaires la traduction. Ainsi la langue intermdiaire comportera de faon obligatoire seulement deux sortes de variations entre langues, les significations lexicales et syn-

28. Ce mode de construction fond sur la congruence des langues, jug intressant a priori, a t vivement critiqu (cf. Lentin 1960, Uspenskij 1958) tant sur le plan mathmatique (calcul de l'indice) que sur le plan linguistique : affectation aux langues d'un poids proportionnel et rejet de certains traits linguistiques sur la base de critres extralinguistiques, absence de hirarchie des hiroglyphes, notion de hiroglyphe smantique ne tenant pas compte de la polysmie.... Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

TRADUCTION AUTOMATIQUE EN URSS

127

taxiques29 ; d'une part parce qu'elles existent dans toutes les langues : d'autre part parce qu'elles sont ncessaires la traduction. Ceci a des consquences pour la structure de la langue intermdiaire qui, parce qu'elle ne doit pas rendre compte des significations grammaticales des diffrentes langues, n'a pas de vraie grammaire. En revanche, les significa tions syntaxiques sont stockes sous forme de relations syntaxiques de la langue intermdiaire, et les traits grammaticaux lexicaux sont stocks sous forme de mots (ou de concepts) dans un dictionnaire. Mel'euk rejoint ici la position d'Ivanov qu'il cite : concrtement les significations relationnelles doivent se reflter non dans la grammaire, mais dans le vocabulaire de la machine (1960). Autrement dit, une partie considrable de la grammaire de la langue na turelle doit tre traduite sous forme de dictionnaire. Ceci s'explique, dit-il, par le fait que la grammaire des langues naturelles correspond trs peu la syntaxe logique d'une langue scientifique. Les mots et les relations syntaxi ques de la langue intermdiaire correspondent l'alphabet et aux rgles de formation des langages formels de la logique mathmatique. Enfin, le traitement automatique de la variation des langues impose deux contraintes lors de la traduction de la langue source vers la langue intermd iaire : (i) il ne faut perdre aucune information grammaticale de cette langue parce qu'une telle information peut tre ncessaire, en synthse, la traduc tion dans une des langues cibles. Ainsi, la catgorie du nombre des noms sera exprime dans la langue intermdiaire quand elle existe dans les lan gues sources (russe, anglais, hongrois...), mais non pour le chinois : ce qui vite la fois perte et redondance de l'information, (ii) aucune information ne doit tre dveloppe de faon spcifique qui ne soit exprime sous une forme claire dans la langue source, car cette information peut s'avrer su perflue lors de la traduction dans la langue cible. Par exemple, lors de la traduction du japonais vers le chinois, l'introduction dans la langue inte rmdiaire du nombre des noms, qui n'est pas exprim en japonais, exige la mise en uvre d'une srie de rgles lexico-smantiques, statistiques et con textuelles, inutile et redondante dans ce cas prcis. Lorsque cette information est requise pour la langue de sortie, il est plus conomique de la gnrer durant le processus de synthse du texte, grce une analyse du contexte. Une telle approche permet de traduire de nouvelles langues sans intro duire de changements fondamentaux dans la langue intermdiaire : les nou velles significations grammaticales sont transformes en mots de la langue intermdiaire et introduites de faon cumulative sans changer sa structure. la lumire de ces deux modles, on peut dire que la notion de langue universelle se trouve modifie par son apprhension comme langue interm-

29. L'opposition entre significations lexicales et significations grammaticales a pour origine la lecture d'un article de 1959 de R. Jakobson Boas' view of grammatical meaning - communication personnelle de LA. Mel'Cuk. Histoire pistmalogie Langage 19/11 (1997) : 105-132 SHESL, PUV

128

S. ARCHAIMBAULT, J. LON

diaire dans un systme de TA. La ncessit de prendre en compte les carac tristiques communes des langues conduit l'laboration de formes mixtes, la fois langue universelle a priori, langue logique ou langue univoque d'information, et a posteriori puisque rendant compte des caractristiques des langues naturelles. L'automatisation de la traduction a pour effet supplment aire de la rendre dynamique, du moins chez Mel'cuk, o les ingrdients de la langue intermdiaire ne sont pas fixs d'avance mais dpendent de la paire de langues considres. CONCLUSION Pour conclure, il est intressant de noter que l'laboration d'une langue intermdiaire a plusieurs consquences. La TA n'est plus seulement un ob jectif pratique, c'est le lieu o peut tre pens le rapport entre les langues et la recherche d'universaux de faon systmatique. Reste savoir le devenir qu'a eu cette systmatisation sur les recherches en linguistique en URSS. S'est-elle investie dans une relle dmarche de typologie exprimentale des langues laquelle elle semble apparente ? La mise en algorithme des caractristiques communes aux langues dans la langue intermdiaire a pour consquence de ne pas considrer les flexions (terme qu'utilisera Mel'Cuk dans son cours de morphologie gnrale pour dsigner les significations grammaticales) comme des universaux. Marquant les singularits des langues, elles ne peuvent tre utilises que pour la phase d'analyse dans un systme de TA. Toutefois, pour Mel'cuk, c'est un vrita blefait linguistique et non simplement une ncessit impose par l'algorithme. A cet gard, il est intressant de noter que la position des Sovitiques concernant le statut de la linguistique dans la TA, position particulirement illustre par Mel'cuk, est radicalement oppose celle de certains expri mentateurs amricains. Ces derniers revendiquent une position spcifique, indpendante des linguistes {cf. Reifler in Locke et Booth 1955) et se don nent des objectifs exclusivement pratiques, abandonnant explicitement la connaissance de la structure des langues aux linguistes thoriciens. Trs diffrente est la position de Mel'uk. La construction d'une langue intermdiaire est un travail de linguiste. Il va mme, dans le recueil sur la TA publi aprs le rapport de l'ALPAC {cf. Kulagina, Mel'cuk 1967), jusqu' tenir l'chec de la TA pour un chec de la linguistique. Tout progrs en TA, dit-il, est subordonn aux progrs de la linguistique qui doit rsoudre deux tches : crer un langage de reprsentation smantique et compiler des algorithmes d'analyse et de synthse de textes : cela n'tant possible que si la linguistique est transforme en connexion avec les mathmatiques. On

Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

TRADUCTION AUTOMATIQUE EN URSS

129

voit que la naissance de la linguistique mathmatique 30 en URSS est fonde sur des bases radicalement diffrentes de celles de la linguistique computationnelle aux tats-Unis (cf. Lon 1992, 1996). C'est une discipline part entire, appartenant la linguistique. On peut considrer que les tentatives de construction d'un tel modle constituent toutes, mme l'entreprise du groupe de Panov, un pas vers la formalisation des langues31, tape incontournable du traitement automatique des langues. Elles permettent d'chapper la mthode du mot mot qui, en imposant l'analyse linguistique de se conformer directement l'organisa tion d'une machine lectronique, ne peut aboutir qu' des impasses sur le plan linguistique comme sur le plan du processus de traduction. La langue intermdiaire32 sera l'origine d'un certain nombre de dveloppements linguistiques originaux, notamment par les linguistes Apresjan, Zolkovskij et Mel'uk, de la syntaxe de dpendance et des fonctions lexicales. reu juin 1997 adresse des auteurs : Universit Paris VU URA CNRS 381 Tour Centrale - Bureau 818 2, place Jussieu 75251 - Paris Cedex 05

30. En URSS, le terme linguistique mathmatique correspond en partie ce qui aux Etats-Unis est appel linguistique computationnelle, l'intersection de la linguistique proprement dite, des langages formels offerts par la logique mathmatique et certaines contraintes inhrentes au traitement automatique de l'information. Elle inclut donc la thorie des automates et la thorie des algorithmes. Toutefois la linguistique math matique est susceptible de dvelopper de faon purement thorique, indpendamment de l'existence mme de machines concrtes. 31. On peut considrer juste titre ces modles de langue intermdiaire comme les premiers langages de reprsentation smantique qui connurent un dveloppement considrable dans le domaine de l'intelligence artificielle partir des annes 1980. Il ne faut pas oublier qu'ils ont eu galement une postrit dans les recherches ultrieures en TA : le langage pivot dvelopp par le GETA au dbut des annes 60 s'inspire, pour la syntaxe, du modle de Tesnire et pour la smantique lexicale du modle de Mel'Cuk. C'est avant tout un modle syntaxique, fond sur des arbres syntaxiques profonds trs smantiss . 32. Dans le modle sens-texte, la langue intermdiaire dont la conception restait attache la ralisation d'algorithmes concrets, a t remplace par l'anglais basic et le russe basic, ensemble de structures lexico-syntaxiques profondes, ncessaire la synthse. Pour la TA, cette approche reste lie aux exigences de la demande sociale puisqu'elle permet un utilisateur ne connaissant que l'anglais de traduire un texte de l'anglais vers le russe. Histoire pistnwlogie Langage 19/11 (1997) : 105-132 SHESL, PUV

130

S. ARCHAIMBAULT, J. LON RFRENCES

Andreev, N.D. (1957). Masinnyj perevod : problema jazyka-posrednika , Voprosy Jazykosnanija 5, 117-121 [Trad. angl. : Machine Translation and the problem of an Intermediary Language , JPRS/68, archives ATALA]. Andreev, N.D., Ivanov, V.V., Mel'Cuk, I.A. (1960). Nekotorye zameoanija i predlozenija otnositel'no raboty po masinnomu perevodu v SSSR , Masinnyj Perevod i Prikladnaja Lingvistika 4, 3-24 [Trad. angl. : Some remarks and suggestions to work on machine translation in the USSR , JPRS/8026, archives ATALA]. Auroux, S. (1979). La Smiotique des encyclopdistes. Essai d'pistmologie historique des sciences du langage, Paris, Payot. Bel'skaja, I.K. (1958). Osnovnye xarakteristiki slovarja i grammati'eskix sxem masinnogo perevoda s anglijskogo jazyka na russkij , Sbornik state] po masinnomu perevodu, 47-80, Moskva [Trad. angl. : Basic Characteristics of the Dictionary and Grammatical Routines for MT from English into Russian , JPRS/925, archives ATALA]. Boduen de Kurtene, I. (1871). Obscie zameanija o jazykovedenii i o jazyke [Remarques gnrales sur la linguistique et sur le langage] , urnal Ministerstva Narodnago Prosvescenija, Tom CLVIII -1871, 279-316. Boduen de Kurtene, I. (1901). O smeSannom xaraktere vsex jazykov [Du caractre mixte de toutes les langues] , iurnal Ministerstva Narodnago Prosvescenija, Tom CCCXXXVII, 12-24. Caussat, P., Adamski, D., Crpon, M. (1996). La Langue, source de la nation ; messianismes sculiers en Europe Centrale et Orientale du XVIIIe sicle au XXe sicle, Lige, Pierre Mardaga. Cejtin, G.S. (1997). Let's rewrite the Rules of the Road , The Newsletter of the European Network in Language and Speech 6. 1 . Drezen, E.K. (1936). Internacionalisacija naucno-texniceskoj terminologii, Istorija, sovremennoe polozenie i perspektivy, Moskva-Leningrad, Gosudarstvennoje izdatel'stvo po standardisai Standartgiz . [Internationalisation de la terminologie scientifique et technique, Histoire, actualit et perspectives]. Harper, K. (1960). Soviet research in machine translation , Proceedings of the National Symposium on Machine Translation, 2-12. Hutchins, W.J. (1986). Machine Translation, past, present, future, Chichester, Ellis Horwood ltd. Hutchins, W.J. (1993). The first MT patents , MT News International 5, 14-15. Ivanov, V.V. (1958). Tipologija i sravnitel'no-istoriceskoje jazykoznanie [Typologie et linguistique historique et compare] , Voprosy Jazykoznanija 5, 34-39. Ivanov, V.V. (1959). Thorie de la compatiblit entre les systmes de langage et les bases de la linguistique historico-comparative , Extraits des rapports prsents la Confrence de Linguistique Mathmatique, 5-11, Leningrad, ditions du ministre de l'Instruction Suprieure [Trad. fr. Comit d'Action Scientifique de Dfense Nationale, Centre d'exploitation du renseignement scientifique et technique, archives ATALA]. Kulagina, O.S., Mel'cuk, LA. (1956). O masnnom perevode s francuzskogo na russkij, Voprosy Jazykoznanija 5, 111-121 [Trad. angl. : Machine Translation from French to Russian , JPRS/DC-68, archives ATALA]. Kulagina, O.S., Mel'uk, I.A. (1967). Automatic translation : some theoritical aspects and the design of a translation system , Booth, A.D. (d.), Machine Translation, 137-173, Amsterdam, North Holland Publishing Company. Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

TRADUCTION AUTOMATIQUEEN URSS

131

Kuznecov, P.S., Ljapunov, A.A., Reformackiy, A.A. (1956). Osnovnye problemy masinnogo perevoda , Voprosy Jazykoznanija 5, 107-111 [Trad. angl. : Fundamental problems of machine translation , JPRS/68, archives ATALA]. Kuznecov, S. (1995). Linguistica cosmica : la naissance du paradigme cosmique , Histoire Epistmologie Langage XVII/2, 211-234. Lentin, A. (1960). La Notion de congruence , La Traduction Automatique 2, 11-17. Lon, J. (1992). De la traduction automatique la linguistique computationnelle. Contribution une chronologie des annes 1959-1965 , Traitement Automatique des Langues, N spcial trentenaire, vol. 33, n 1-2, 25-44. Lon, J. ( paratre). La Traduction automatique I : les premires tentatives jusqu'au rapport ALPAC , Handbiicher zur Sprach- und Kommunikationswissenschaft, Berlin, Walter de Gruyter and co., vol. 3, Histoire des Sciences du Langage. Lingvisticeskij enciklopediceskij slovar' (1990), Moskva, Sovetskaja Enciklopedija. Locke, W.N., Booth, A.D. (ds) (1955). Machine Translation of Languages, 14 essays, New York, MIT et John Wiley. Mel'cuk, LA. (1958). O maSinnom perevode s vengerskogo na russkij , Problemy Kibernitiki 1, 222-264 [Trad. angl. : Translation from Hungarian into Russian , JPRS/646, archives ATALA]. Mel'Cuk, LA. (1959). Raboty po masinnomu perevodu v SSSR , Vestnik Akademii Nauk SSSR 2, 43-47, [Trad. angl. : Work on Machine Translation in the USSR , JPRS/662, archives ATALA]. Mel'cuk, LA. (1960). K voprosu o grammatieskom v jazyke-posrednike , Masinnyj Perevod i Prikladnaja Linguistika 4, 25-451 [Trad. angl. : The problem concerning the grammatical , in an intermediate language , JPRS/8026, archives ATALA]. Mel'cuk, LA. (1961). Nekotorye voprosy masinnogo perevoda za rubezom , Institut Naucnoj Informacii 6, 1-44, Moskva, AN SSSR [Trad. angl. : Some problems of MT abroad, USSR , Reports at the conference on Information Processing, MT and Automatic Text Reading, JPRS/13135, archives ATALA]. Mel'cuk, LA., Ravic, R.D. (1967). Avtomaticeskij perevod (1949-1963), Moskva, AN SSSR. Molosnaja, T.N. (1957). Nekotorye voprosy sintaksisa v svjazi s masinnym perevodom s anglijskogo jazyka na russkij , Voprosy Jazykoznanija 4, 46-59 [Trad, angl. : Certain questions of syntax in connection with machine translation from English to Russian , JPRS/68, archives ATALA]. Nikolaeva, T.M. (1958). Konferencija po masinnomu perevodu , Voprosy Jazykoznanija 5, 149-151, [Trad. angl. : Conference on MT : compte rendu du 1er congrs sur la TA, Moscou, 15-21 mai 58 , JPRS/487, archives ATALA]. Panov, D.Ju. (1956). Avtomaticeskij perevod, Moskva, AN SSSR [Trad. angl. : 1960, Automatic Translation, Oxford, New York, Pergamon Press Inc]. Rasmussen, A. (1995). L'Internationale scientifique (1890-1914), Thse de doctorat d'histoire, Paris, EHESS. Salmon, V. (1992). Caractristiques et langues universelles , Auroux, S. (d.), Histoire des Ides Linguistiques, t. II, 407-423, Lige, Mardaga. Tatarinov, V.A. (1993). Iz istorii otecestvennogo terminovedenija : Ernest Karlovic Drezen , Voprosy Jazykoznanija 3, 113-119 [Histoire de la terminologie en Russie : E.K. Drezen].

Histoire Epistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV

132

S. ARCHAIMBAULT, J. LON

Uspensku, V.A. (1959). Itogi raboty sekcii algoritmov masinnogo perevoda , Moscou, Masinnyj Perevod i Prikladnaya Lingvistika 1, 31-62 [Trad. angl. : Results of the work of the MT algorithm section , Actes du 1er congrs de TA, 15-21 mai 1958, JPRS/1006, archives ATALA].

Histoire pistmologie Langage 19/11 (1997) : 105-132 SHESL, PUV