jeudi 8 février 2007

No intervening human linguists: est-ce la GALE, Docteur ?

En commentaire à un billet intitulé Les traducteurs, espèce en voie d'extinction ?, j'observe :
En voie d'extinction, sûrement pas, mais en voie de transformation profonde, certainement. Même si apparemment beaucoup des parties prenantes n'en ont pas encore pris conscience.

On ne peut plus traduire sur et via Internet comme on le faisait AVANT Internet, et les logiques de nivellement par le bas à l'œuvre sur les différentes places de marché dédiées qui existent aujourd'hui font l'impasse sur ce que doit être une traduction de qualité, en finissant toujours par imposer aux traducteurs la quadrature du triangle...
Je voudrais donc développer davantage mon raisonnement, et, surtout, tenter d'expliquer pourquoi, selon moi, les métiers de la traduction vont subir bien plus tôt qu'ils ne le pensent des « transformations profondes », pour ne pas dire une véritable révolution.

Je vois deux grands axes d'évolution :
  1. la traduction automatique
  2. la localisation sans traduction

* * *

1. Traduction automatique


Eric Schmidt nous rappelait déjà en octobre 2005 que la traduction automatique (TA) pourrait aider à abolir les barrières linguistiques à la communication :
Larry and Sergey talked a little bit yesterday about some of the issues of automatic translation. And language has typically been a barrier for communication. If we can automatically translate between the two, that can help.
Il est d'ailleurs notoire que chez Google de nombreux ingénieurs s'y consacrent à plein temps :
Google also has an army of engineers working on automatic translation tools that would render information in any language intelligible in any other.
Ce n'est donc pas un hasard si en moins de 10 ans Google s'est hissé parmi les premiers acteurs mondiaux dans le domaine de la traduction automatique et pourrait bien nous réserver quelques surprises à l'avenir...

Mais Google n'est pas seul en lice. Dans son rapport 2007 de planification stratégique, la DARPA, mieux connue pour être à l'origine du défi Internet, nous annonce que l'un de ses développements clés à l'horizon 2010 va porter sur le traitement des langues, et plus spécialement sur une traduction automatique fiable en temps réel : Real-Time Accurate Language Translation, qui ne nécessitera plus l'intervention de traducteurs-interprètes humains. Directement du média à l'utilisateur !


Page 33 du rapport, fin de la section 3.7. Ce mode de traitement, qui fait partie du programme GALE (Global Autonomous Language Exploitation), prévoit trois phases :
  1. la transcription
  2. la traduction
  3. la distillation
La première étape pour pouvoir exploiter les données audio en langue étrangère à des fins de traduction consiste à convertir les discours en texte, c'est la transcription. Les américains nomment ça Speech to Text Transcription (STT). Après quoi le texte est traduit puis « distillé », l'ensemble des opérations étant automatisé par des moteurs de traitement (2.2 Transcription Engine ; 2.3 Translation Engine ; 2.4 Distillation Engine). Aperçu de ce dernier concept :


L'objectif est de parvenir à de très hauts niveaux de performances : 95% de fiabilité et 90-95% de cohérence/justesse sur les traductions depuis l'arabe et le chinois vers l'anglais, afin de pouvoir extraire et fournir des informations clés aux décideurs ayant un degré de pertinence égalant voire dépassant celui des humains.

Si on évalue grossièrement à 60% le degré de fiabilité des systèmes actuels, on peut se faire une idée des progrès qui seront accomplis. Disons qu'après 50 ans de tâtonnements de la recherche en TA, l'évolution sera significative dans les années à venir. Avec des conséquences qu'on peut aisément deviner pour les traducteurs, qui n'en sont plus à une révolution près ! D'ailleurs c'est écrit en toutes lettres :
GALE engines perform both of these processes in a completely automated fashion, without the intervention of human linguists.
Nous voilà fixés, si certains nourrissent encore quelques doutes. Car une fois au point, nous savons très bien que les technologies développées par les militaires sont ensuite industrialisées pour des usages civils. Il serait donc temps que nous remémorions le vieil adage : « Un traducteur averti en vaut deux... »

À noter que sur l'année 2007, la Darpa a budgété +84 millions US$ aux technologies de traduction du langage (language translation technologies), soit 7 millions par mois, ce qui s'appelle "se donner les moyens" ! (source : Human Language Technologies for Europe, p. 32, PDF - 7,7 Mo)

[Début]

* * *

Juste pour donner une idée de l'état de l'art en la matière, voici la synthèse d'un rapport publié par l'OTAN, Research & Technology Organisation, sur « La mise en œuvre des technologies de la parole et du langage dans les environnements militaires » (RTO-TR-IST-037) (PDF en anglais, 4,3 Mo) :
Les communications, le commandement et contrôle, le renseignement et les systèmes d’entraînement font de plus en plus appel à des composants issus des technologies vocales et du traitement du langage naturel : il s’agit de codeurs vocaux, de systèmes C2 à commande vocale, de la reconnaissance du locuteur et du langage, de systèmes de traduction, ainsi que de programmes automatisés d’entraînement. La mise en œuvre de ces technologies passe par la connaissance des performances des systèmes actuels, ainsi que des systèmes qui seront disponibles dans quelques années.
Etant donné l’intégration de plus en plus courante des technologies vocales et du traitement du langage naturel dans les systèmes militaires, il est important de sensibiliser tous ceux qui travaillent dans les domaines de la conception des systèmes et de la gestion des programmes aux capacités, ainsi qu’aux limitations des systèmes de traitement de la parole actuels. Ces personnes devraient également être informées de l’état actuel des travaux de recherche dans ces domaines, afin qu’ils puissent envisager les développements futurs. Cet aspect prendra beaucoup d’importance lors de la considération d’éventuelles améliorations à apporter à de futurs systèmes militaires.
Les textes contenus dans cette publication comprennent des communications sur l’état actuel des connaissances dans ce domaine, ainsi que sur des travaux de recherche en cours sur certaines technologies de la parole et du langage, à savoir : les techniques et les normes d’évaluation, la reconnaissance de la parole, l’identification linguistique, et la traduction.

Technologies déjà disponibles :

Décomposition du traitement de la parole (PDF, 12 Mo) :

[Début]
* * *

2. Localisation sans traduction

L'avenir souhaitable de la traduction sur Internet, selon moi, une évolution de la sphère GILT, une vision que j'ai déjà eu l'occasion de développer dans un discours sur la traduction technique professionnelle prononcé en 2003 à l'université de Rennes 2, lors du Colloque « Traduction et francophonie(s) ; traduire en francophonie », dont j'ai développé les conclusions dans ce billet.

Nous en sommes encore loin, c'est une évidence, même si je me plais à répéter une fois encore ces mots de M. Daniel Gouadec, qui résument parfaitement ma pensée :
L’une des évolutions à court terme pourrait donc porter sur l’assimilation de la « traduction » à une rédaction dans laquelle le document initial servirait uniquement de référence ou source d’informations qui, analysées et synthétisées par le traducteur, seraient ensuite reformulées ou réexprimées selon les contraintes posées par le public, le type de document, et les utilisations voulues ou prévues du document.

(...)

La meilleure façon de traduire est peut-être bien de rédiger d’abord et même de rédiger seulement.
Et dans une grande clairvoyance, il avait nommé ça la « naturalisation ». Le rêve de millions de PME qui voudraient pouvoir offrir (et s'offrir...) sur Internet une présence multilingue de qualité. La demande est là, qui va grandissante au fil des jours, ne reste plus qu'à créer l'offre.

Traducteurs, à bon entendeur...
[Début]


P.S. Pour finir en beauté, juste histoire de montrer que s'il est déjà difficile de se comprendre dans sa propre langue, que donnera le message une fois passé à la moulinette de la TA... [Début]

C'est en anglais, désolé :-) (Merci Emmanuelle)

, , , , , ,

2 commentaires:

AAA Copywriter a dit…

Si Babelfish est l'example de ce que font les traducterus automatique, je en dirais que le resultat est dégueulasse. Mais j'ai un correspondat japonais qui ne connait pas un mot d'anglais et qui utilise pour sa correspondance quelqeus traducteurs autommatiques et s'en tire tres bien. Quant a la localisation sans traduction, ça me depasse... J'ai du mal a digérér le concepte.

Alex

Jean-Marie Le Ray a dit…

Alex : « J'ai du mal a digérer le concept. »

Pourquoi donc ? N'est-ce pas très exactement ce que tu dis en commentaire ici : « Je suis parvenu à la conclusion que, quand la traduction n'est pas spécifique, il vaut mieux réinterpreter que traduire. Donc réécrire mon texte comme si c'était moi l'auteur. Bien plus efficace ! »

Je ne dis pas autre chose :-)
J-M