Vous êtes sur la page 1sur 7

La Traduction Automatique Cours 1 Introduction

(TA)
De quoi s'agit-il ?
P. Bouillon et M. Starlander
Problèmes posés par la traduction
automatique
Bureau 6333

Organisation du cours et des examens


Master + DESS

http:// www.unige.ch/eti/courstim/ puis


Traduction Automatique

ISSCO ISSCO

Définition de la TA Types de Traduction Automatique (TA):

Application de l'informatique au • Traduction entièrement automatique


processus de traduction d'un texte en de haute qualité (TEAHQ; Fully
langue source (Ts) dans un texte Automatic High Quality Translation,
équivalent en langue cible (Tc). FAHQT) ;
• TAO (Traduction Assistée par
ordinateur) : la traduction se fait
Traduction automatiquement, mais avec l'aide
de l'homme qui peut intervenir dans
les trois différentes phases de la
traduction:
1 la préparation du texte,
Ts (français) Tc (anglais)
2 sa traduction ou
3 la révision.

ISSCO ISSCO
TEAHQ Automatisation de la préparation (1)

Système METEO (depuis 1977) %---------------------------------------------

Anglais: A. J’ai manger des pommes.

Metro toronto B. J’ai mangé des pommes.

Today.... mainly cloudy and cold with A. I have to eat apples.


occasional flurries. Brisk westerly winds to
50 km/h. High near minus 7. B. I ate apples.

Français: %---------------------------------------------

Le grand Toronto A. Clean reservoir system

Aujourd'hui... Généralement nuageux et B. Clean the reservoir system


froid avec quelques averses de neige.
Vents vifs d'ouest à 50 km/h. Maximum A. Système de réservoir propre.
d'environ moins 7.
B. Nettoyez le système de réservoir

ISSCO ISSCO

Automatisation de la préparation (2) Automatisation de la préparation (3)

%--------------------------------------------- • correction du texte avec des


correcteurs orthographiques,
A. Release the percussion heads with a grammaticaux ou stylistiques ;
strap wrench
• simplification du texte pour le rendre
A. Libérez les chefs(têtes) de percussion plus facile à traduire : phrases plus
avec une entorse de courroie simples, etc.
• annotation du texte pour le
B. Libérez les têtes de percussion avec désambiguiser : école de <C>cuisine
une clé à sangle grenobloise</C> vs <C>école de
cuisine</C> grenobloise ;
%---------------------------------------------
• Préparation des dictionnaires pour le
rendre conforme au domaine : ajout
des termes et de leur traduction,
suppression de certaines traductions
pas nécessaires, etc.

ISSCO ISSCO
Automatisation de la traduction Automatisation de la révision
proprement dite
• L'être humain peut aider à reviser le
Construction de systèmes semi- texte. On considère que s'il revise 250
automatiques utilisant de interventions mots en moins de 35 minutes, la TA
humaines pour désambiguiser le texte : est rentable !

Il lit le livre -> livre-volume ou livre-monnaie • Comment aider à trouver les erreurs ?
• Utilisation de correcteurs, mais les
Mais peut-on construire un dialogue de systèmes sont-ils assez bons ?
désambiguisation convivial ?
• intégration de marques de doutes
pour les mots très ambigüs ou les
segments rares (bigrammes,
trigrammes), par exemple grandes
pluies vs pluies torrentielles.

ISSCO ISSCO

Bref historique Historique

La TA n'est pas une idée nouvelle : • 1966 : rapport Alpac. L'évaluation des
progrès est très mauvaise et les
• 1949 : un américain du nom de subsides d'état sont coupés aux EU;
Weaver persuade les autorités que la pourtant, certaines compagnies
traduction est une application idéale privées arrivent à survivre. Systran
pour les ordinateurs ; est notamment utilisé par la US Air
Force pour traduire du Russe-Anglais
• Selon lui, la langue est un code. Elle en 1970 et par la Nasa en 1974-1976;
pourra être décodée de la même
manière que les messages chiffrés • 1975 : Achat de Systran par la
pendant la guerre ; Communauté Européenne; la
traduction redevient une activité
• Début de recherches intensives en connue du grand-public.
TA, vu l'intérêt stratégique /
économique en jeu (20.000.000 livres
sterling d'après Arnold);
• Même si l'argumentation de Weaver
est fausse : dans la langue naturelle,
pas de relation biunivoque entre un
mot/texte source et sa traduction.

ISSCO ISSCO
Les problèmes posés par la traduction Les problèmes posés par la traduction

Pourquoi n´existe-t-il pas encore de Quelques exemples (Systran) :


systèmes de TA entièrement
automatiques? 1er problème

Traduire, c´est deux choses : fumer nuit à la santé -> to smoke night with
health
transmettre le contenu d´un message : ce
qui est dit dans les phrases (contenu He hammers the metal flat ->Il martèle
propositionnel) et comment s´est dit (style, l'appartement en métal
tonalité, lien entre les phrases, etc.).
2d problème

This is a good man -> c'est un bon homme

I know this word -> je sais ce mot

ISSCO ISSCO

Les problèmes posés par la traduction Problèmes posés par la traduction

• Pour traduire, la machine devrait • De plus, la traduction pose des


idéalement comprendre les mots et problèmes spécifiques :
leurs relations ; or comprendre un
texte n'est pas facile : a Les langues peuvent exprimer un
même contenu, avec des moyens
1 Les mots sont ambigus : syntaxiques différents
«avocat»,«porte», «nuit» ; (divergences);
2 Les relations qu'ils entretiennent sont b Certaines langues n’expriment pas le
ambiguës : «la peur du gendarme», même contenu (décalages).
«je vois l'homme au téléscope», «he
hammers the metal flat» (Heid, Vandooren in : Bouillon et Clas, la
Traductique)
3 Certaines expressions ne sont pas
compositionnelles : «casser sa pipe»
-> to fall, to break a pipe ;

ISSCO ISSCO
Par exemple :Matthew 12.9-10 Par exemple :Matthew 12.9-10

• Latin: 24 words, 3 sentences • French: 45 words, 5 sentences


Et cum inde transisset, venit in synagogam Jésus partit de là et se rendit dans une de
eorum; et ecce homo manum habens leurs synagogues. Un homme s'y trouvait,
aridam. Et interrogabant eum dicentes: qui avait la main paralysée. Ceux qui
«Licet sabbatis curare?», ut accusarent étaient là voulaient accuser Jésus; c'est
eum. pourquoi ils lui demandèrent: -- Notre loi
permet-elle de faire une guérison le jour du
• Italian: 31 words, 3 sentences sabbat?
Partitosi di lí, egli entrò nella loro sinagoga. • German: 36 words, 4 sentences
Ed ecco un uomo che aveva una mano
arida. Essi domandarono a Gesù, per Darauf verließ er sie und ging in ihre
poterlo accusare: «É lecito curare in giorno Synagoge. Dort saß ein Mann, dessen
di sabato?» Hand verdorr war. Sie fragten ihn: Ist es am
Sabbat erlaubt zu heilen? Sie suchten
• Spanish: 26 words, 2 sentences nämlich einen Grundzur Anklage gegen
ihn.
De allí pasó a la sinagoga. Había en ella un
hombre que tenía seca una mano, y • English: (a) 41 words; (b) 42 words
lepreguntaron para acusarlo: «¿Es lícito
curar en sábado?» ......
ISSCO ISSCO

Les divergences Les divergences :

• Dans l’ordre des mots : fresh water -> • Prédicative


eau fraîche
he hammers the metal flat -> il aplatit le
• Catégorielle : métal avec un marteau
university degree -> degré universitaire I swam across the river -> J’ai traversé la
rivière à la nage
• Syntagmatique :
I’m waiting for the postman to pass -> Les décalages :
j’attends le passage du facteur
• La langue source fait plus de
• Lexicale : I’m hungry -> j’ai faim distinctions que la langue cible :

• De densité lexicale : he retired -> il a Embouteiller du vin -> Wein in Flaschen


pris sa retraite abfüllen

• Thématique : • La langue cible fait plus de


John missed Mary -> Marie a manqué à distinctions que la langue source (cf.
liste de Hutchins) :
Jean
poisson -> pez/pescado

ISSCO ISSCO
• Les champs sémantiques ne se Niveaux de compréhension
recoupent pas, par exemple les
verbes de mouvement : Approche rationaliste
fr : type de mouvement distinct du
• Pour l'approche minimaliste : on
mouvement dans l’espace
peut se limiter à une compréhension
implicite, c.à.d. à résoudre les
all : un seul verbe (avec des prépositions
ambiguïtés lexicales à l'aide des
différentes) pour le type de mouvement et connaissances linguistiques ad hoc:
le déplacement dans l’espace
la (det/pron) porte(verbe/
Il entre dans la salle en courant -> nom) ferme (verbe/nom/adjectif)
I (pron) hammer (nom/verbe)
Er rennt in den Saal the (det) metal (nom) flat (nom/
adj)
• Approche maximaliste : une
compréhension implicite n'est pas
suffisante : Il faut aller plus loin et
rendre explicites les relations
syntaxiques et sémantiques qui
existent entre les mots.

ISSCO ISSCO

Niveaux de compréhension Plan du cours

Approche empirique/statistique : pas de Focaliser sur l'approche rationaliste


compréhension requise.
1) Comprendre un texte dans une autre
a La source des connaissances = langue : les niveaux de compréhension.
grands corpus bilingues qui
décrivent les équivalences/lois 2) Les systèmes directs minimalistes. Le
grammaticales ; cas de Réverso (système pour traducteur
indépendant).
b Traduire équivaut à chercher dans le
corpus la phrase /mot source qui a la 3) Les systèmes indirects maximalistes.
plus haute probabilité d'être la
Le cas de Comprendium (système pour
traduction d'une phrase / mot cible
société).
donnée.
Trois questions :

• Comprendre la différence entre ces


systèmes
• Apprendre à les utiliser/spécialiser
• Comment évaluer les résultats ?
ISSCO ISSCO
Examen Master Quelques références

Dossier à rendre avec différents exercices W. Hutchins et H. Somers, An Introduction to Machine


Translation, London:Academic Press, 1992.
(4)
D. Arnold et al., Machine Translation, Cambridge, Back-
Examen DESS well, 1994.
Machine Translation, Kluwer.
Dossier à rendre avec différents exercices P. Bouillon et A. Clas, La Traductique, Montréal:PUM,
(4), plus un examen oral de 15 minutes 1993.
C. Fuchs, et al., Linguistique et traitements automatiques
des langues, Paris, Hachette,1993.
Langages, 1994, vol. 116, Le traducteur et l'ordinateur.
Meta, 1992, vol. 37:4

References WWW :

http://www.georgetown.edu/cball/ling361/
ling361_mt_links.html
http://www.globalink.com
http://www.systranmt.com
http://www.logos-ca.com
http://www.foreignword.com/Technology/technology.htm
ISSCO ISSCO

Quelques références Un peu de lecture pour la semaine


prochaine
Tester gratuitement :
Chapitre 1 de Arnold :
globalink : http://www.globalink.org
systran : http://www.systransoft.com http://www.essex.ac.uk/linguistics/clmt/
MTbook/HTML/book.html

Associations :

European Association for Machine Translation, Secrétar-


iat: TIM/ISSCO, 40 Boulevard du Pont d'Arve,
Genève

Conférences (avec actes):

(TMI) Theoretical and Methodological issues in Machine


Translation
MT Summit

ISSCO ISSCO

Vous aimerez peut-être aussi