Europe Solidaire
CultureEconomieEducationEnvironnementInstitutionsInternationalSciencesSécurité/DéfenseSocialTechnologiesValeurs
Aggrandir Réduire Reinitialiser

Mike Dillinger

Sur la traduction automatique
Comme toutes les technologies, la traduction automatique (TA) a ses limites. En l'absence de textes sans ambiguïtés, les traducteurs humains seront toujours nécessaires pour compléter les ordinateurs. C'est le cas notamment dans le domaine juridique et littéraire. La TA devrait s'attacher en priorité aux textes destinés à Internet et aux textes techniques. Pour cela les rédacteurs dans ces deux domaines doivent être formés à la production de documents facilement traduisibles.

Nous présentons ici le point de vue d'un expert, dans un domaine essentiel pour la communication entre les peuples d'Europe.
Mike Dillinger est président de l' Association for Machine Translation in the Americas et  Professeur au Department of Psychology, San José State University


L'état de l'art dans la TA a changé rapidement depuis 15 à 20 ans. Auparavant,  beaucoup de moyens avaient été dépensés afin d'établir les règles grammaticales nécessaires à l'analyse des textes originaux et les règles de traduction correspondantes. Il avait été cependant jugé impossible de prendre en compte manuellement l'énorme quantité de mots et de phrases utilisés dans ces documents. La nouvelle approche utilise des techniques statistiques pour identifier des règles qualitativement plus simples. Ceci est fait désormais automatiquement et à grande échelle, couvrant une grande partie du spectre du langage. La même démarche est appliquée en ce qui concerne l'identification des mots et de leurs traductions possibles.
Aujourd'hui, la recherche cherche à accroître la complexité des règles de façon à mieux s'adapter aux structures syntaxiques et à la variété des significations.

On peut considérer que la TA est aujourd'hui une industrie mature. Elle est utilisée couramment par les institutions militaires et industrielles depuis 30 ans : Commission européenne. Ford, Symantec, les forces armées américaines, etc. Par contre, elle n'est pas suffisamment mûre pour être utilisée par le public généraliste et au hasard des textes rencontrés. Tant que ceux-ci ne seront pas purgés de leurs impuretés diverses, elle donnera de mauvais résultats. Or le public voudrait obtenir des traductions parfaites.

La société dans son ensemble, en fait, ne comprend pas ce qu'est la TA. On attend d'elle qu'elle éclaire ce que l'auteur avait voulu dire, même si celui-ci ne s'était pas exprimé clairement. Il y a des éducations réciproques à mener à bien.

Par ailleurs la TA implique différents secteurs technologiques : la programmation, les systèmes de traduction, les dictionnaires électroniques. Ceci implique de réaliser des lexiques électroniques,  des grammaires, des bases de données répertoriant les co-occurrences de mots et d'autres ressources linguistiques. Il faut aussi développer l'évaluation des processus de traduction, le « nettoyage » automatique des textes, les procédures de gestion de documents nécessaire pour traiter des commandes de traduction pouvant atteindre 300.000 pages. La coopération entre linguistes, programmeurs et ingénieurs est indispensable.

Les phases de la traduction sont les suivantes: 1. Préparation du document, en veillant à ce que chaque phrase soit compréhensible et correct. C'est la phase la plus importante. 2. Ajustement du système de traduction au domaine professionnel concerné, notamment au regard des concepts spécialisés utilisés. 3. Traduction, adaptée aux formats électroniques du texte. Le contenu doit être séparé de ses mises en forme.  4. Vérification et contrôle de qualité, avec résolution des ambiguïtés. 5. Distribution des documents traduits à leurs destinataires. La tâche n'est pas simple quand le service de traduction reçoit 10.000 pages à traduire en 10 langues et à router vers une cinquantaine de bureaux.

La TA ne représente en rien une menace pour les interprètes et traducteurs humains. Comme toujours, la machine accomlira les tâches de routine, laissant les tâches nobles aux humains. Même si la qualité de la TM augmente, l'intelligence globale des textes nécessitera des compétences humaines s'élevant en proportion.

Ceci étant, un énorme effort d'adaptation sera requis des humains pour faire face aux nouvelles techniques et à l'accroissement corrélatif du nombre et de la difficulté des textes à traduire. On retrouve le même problème dans toutes les technologies en croissance, à quelques différences près. Le contrôle de l'exactitude des significations demandera un effort considérable, la machine pouvant fournir des traductions apparemment fidèles qui induiront en fait des malentendus graves. Il faut disposer de systèmes d'Intelligence Artificielle très évolués pour les détecter. La traduction porte souvent par ailleurs sur des documents déjà traduits, avec risque de pertes de sens en série.

Le British National Corpus comprend 15 millions de termes caractéristiques de la langue anglaise. Les dictionnaires de TA les plus riches se limitent à 300.00 entrées. Comment les sociétés de demain pourront-elles faire face à ces différences ? Il faut voir en fait que sur 15 millions de mots, 70% sont rarement utilisés. Il convient donc de se limiter à un cœur plus réduit, auquel s'ajouteront de 5.000 à 10.000 termes hautement spécifiques. Mais cette technique ne peut s'appliquer qu'aux documents professionnels. Pour des traductions en ligne sur le web, elle sera inutilisable. Il faudra donc généraliser des solutions déjà existantes, telles que le « try again » : demander à l'interlocuteur de formuler autrement sa question. L'auteur comme le destinataire devront coopérer avec le système, s'ils veulent communiquer.

Notre opinion. Ce texte (traduction-adaptation libre) montre plusieurs choses : 1. La TA reste ; comme elle le fut aux origines de l'Intelligence Artificelle, un défi pour l'intelligence appliquée aux machines. Il est donc intéressant d'investir pour enrichir ses techniques. 2. la communication écrite et parlée avec les robots multipliera les problèmes d'interprétation du genre de ceux rencontrés par la traduction, ceci même si les interlocuteurs utilisent en principe la même langue, en émission comme en réception. Il ne faut pas croire que les logiciels simplistes  actuels de reconnaissance ou de synthèse de la parole utilisés par les automates ont résolu tous les problèmes, même en se plaçant à un très bas niveau d'exigence. Si par contre la communication entre humains et robots s'améliorait sensiblement, en empruntant aux méthodes de la TA évoquées dans cet article, la convergence entre les deux formes d'intelligence pourrait croître rapidement.

Les notes :
01/07/2008
Vos réactions
Dernières réactions
Actuellement, pas de réaction sur cet article!
Votre réaction
Vérification anti-spam
Nom/pseudo*


Email*


Titre*


Commentaire*


* champs obligatoires
Europe Solidaire