dimanche 31 août 2008

Google et la traduction

English version

Bluffé depuis le début par la percée significative et ultra-rapide de Google dans la traduction automatique, voici longtemps que je prédis ses avancées éclatantes dans le domaine de la traduction, de nature à nous réserver bien des surprises.

À tel point qu'à l'instar de l'opérateur define:, de temps en temps je teste l'opérateur translate: juste pour voir s'il n'aurait pas été mis en place entre-temps. Or il semble qu'avec la translation onebox, le moment est venu ! (Via Google Live).

Apparemment, ça ne concerne aujourd'hui que les expressions courantes, même s'il est probable que cela puisse porter sur tous les termes qui renseignent déjà les dictionnaires de Google.


J'ai testé avec l'italien mais ça ne marche pas encore. Pour autant, il est probable que dès la mise à régime du futur centre de traduction de Google, cet opérateur ira également rechercher les traductions dans les bitextes qui peupleront la mémoire de traduction universelle quotidiennement élaborée par une armée de traductrices et de traducteurs.

Pour rappel, cette mémoire sert également à l'auto-apprentissage de Google, et par bitexte il faut comprendre que l'on a texte source (ou texte de départ) et texte cible (ou texte d'arrivée) en regard l'un de l'autre. Exemple.

Par ailleurs, l'opérateur semble ne pas fonctionner de la même manière que define:, où vous utilisez le terme anglais quelle que soit votre langue.

Alors qu'avec "translate", c'est apparemment l'opérateur qui définit la langue d'arrivée, puisqu'en saisissant translate ordinateur Google interprète directement le sens de traduction français vers anglais, tandis qu'avec traduire computer l'interprétation se fait de l'anglais vers le français.

Donc en nous livrant à un bref exercice de prospective, on peut très facilement imaginer que dans un avenir proche, non seulement Google pourra coupler par défaut l'opérateur à votre profil (en clair, sachant que vous êtes anglais, il vous proposera par défaut des termes traduits en anglais, sauf indications contraires de votre part), mais aussi, et surtout, qu'il pourra puiser pratiquement tous les termes du langage humain, dans toutes les langues, au fur et à mesure que sa notre mémoire de traduction universelle prendra forme.

Alimentée autant par les traducteurs humains qui utiliseront les outils de Google pour traduire, que par ses technos automatisées à grande échelle (à ne pas confondre avec le déploiement d'un système de traduction automatique en entreprise, par exemple), voire par la mise en parallèle des œuvres littéraires qui appartiennent au patrimoine de l'humanité et sont déjà traduites dans de nombreuses langues.

Pour les profanes, mettre en parallèle un texte c'est prendre Les Misérables de Hugo ou votre livre préféré, le segmenter et mettre en parallèle les segments du texte original avec les segments correspondants traduits dans la ou les langues de votre choix (à noter qu'un segment ne correspond pas forcément à une phrase, découpée en plusieurs segments si elle est trop longue, par exemple). Vous faites ça avec français-anglais, et vous avez la mémoire français-anglais des Misérables. Ensuite vous faites de même avec anglais-italien, espagnol-allemand, russe-chinois, etc., et vous obtenez autant de mémoires que de langues dans lesquelles l'ouvrage a été traduit.

La pierre de Rosette est un parfait exemple de textes mis en parallèle. Et pour me limiter à n'en mentionner qu'un seul autre, pensez aux milliers de traductions de la Bible qui existent déjà...

Donc ajoutez-y tous les grands classiques mondiaux déjà numérisés, construisez les mémoires de traduction correspondantes dans les couples de langues dont vous disposez, et vous comprendrez aisément qu'on n'est pas loin de pouvoir mettre en parallèle pratiquement l'ensemble du langage humain, à toutes les époques.

Depuis l'aube de l'humanité, nul n'a jamais été en mesure de faire ça. Jusqu'à Google...

Google et la traduction, on n'a pas fini d'en parler. En fait, on commence juste !


Partager sur Facebook

, , , , , , , , , , ,

7 commentaires:

Unknown a dit…

Excellent article qui ouvre des perspectives sidérantes. Et si le mythe de la Tour de Babel était en train de s'effriter ?

Je me suis permis de le relayer sur mon propre blog www.eficiens.fr

Unknown a dit…

Intéressant article... Mais, il existe des problèmes avec cette approche qu'on ne peut pas régler aussi simplement.
Si cette approche est souvent bluffante, c'est parce qu'elle permet la traduction quasi parfaite des expressions idiomatiques et autres phrases récurrentes complexes.
En revanche, dès que l'on veut traduire des choses aussi simples que "sa, son, ses" en anglais, ce genre de système est vite perdu. Le même problème se pose dans le sens inverse si l'on veut traduire "which" par "lequel". Dans chaque cas, il faut disposer de la bonne co-référence.
Ce genre de traducteur pèche très souvent dans les finitions et la traduction des mots outils que les algorithmes d'alignement ont de grandes difficultés à gérer efficacement.

Jean-Marie Le Ray a dit…

Claude,

Je comprends votre approche, même si j'ai tendance à penser que ça reste "un détail" par rapport à l'éventail des possibles qu'autorise la phénoménale puissance de calcul de Google.
Car la question n'est pas, n'est plus (ou n'a jamais été, peut-être) de rendre des finitions 100% parfaites, mais plus grossièrement de permettre aux gens de comprendre des messages qu'ils seraient incapables de saisir sans un outil dédié.
Et dans cette optique, peu m'importe qu'un possessif, un démonstratif ou autre ne soient pas parfaitement rendus du chinois au français, pourvu que je comprenne l'essentiel du message, de façon simple, rapide et gratuite.
Pour les finitions, il faudra faire comme par le passé : appel aux services de professionnels. Et d'ailleurs, heureusement pour nous...

Jean-Marie

Unknown a dit…

Bonjour à tous,

Jusqu’ici, il y avait d’un côté les outils de traduction automatique, insatisfaisants mais gratuits, et, de l'autre, les traducteurs professionnels indépendants et par des agences de traduction, qui proposent un service de traduction professionnel payant. Il existait déjà, pour les plus curieux, des systèmes permettant de recruter en ligne son propre traducteur humain mais, d’une manière générale, les entreprises avaient plutôt tendance à faire appel à une société de traduction pour lui confier leurs projets.

Qu’apportent les agences de traduction ? Elles disposent de traducteurs professionnels dans toutes les langues, dans plusieurs domaines d’expertise, elles analysent et préparent les travaux avant traduction, elles contrôlent les délais, elles servent de point de contact aux clients et aux traducteurs, se faisant tantôt la voix du client auprès du traducteur, et tantôt celle du traducteur auprès du client, elles s’assurent de la bonne livraison du projet final au client, et elles gèrent les questions de règlement, contrôlant en amont la solvabilité du client et s’assurant en aval d’être payé à temps, et de payer le traducteur à temps. Du moins, c’est ce que nous faisons, chez Anyword, et c’est ce que font la plupart de nos concurrents.

Dans ce contexte, Google Translation Center est-il une menace pour les agences de traduction ? Il est possible (et même probable) que, dans un premier temps, un certain nombre de clients souhaiteront faire des économies en s’adressant directement aux traducteurs (qui peuvent ne pas être des professionnels, puisque Google accepte les “volontaires”, c'est-à-dire des bénévoles sans expérience) : ces clients-là seront perdus pour les agences. Au fil du temps, soit ils se satisferont d’une solution minimale, et ils resteront fidèles à Google Translation Center, soit ils souhaiteront bénéficier d’un vrai service d’intermédiation, et ils reviendront vers les agences. Du moins, je l’espère, et j’ouvre bien sûr le débat sur le blog L’Observatoire de la Traduction, tenu par Anyword (http://blog.anyword.fr).

Guillaume de Brébisson
Site de traduction Anyword

Anonyme a dit…

Bonjour Jean-Marie,

Votre billet est très intéressant. Toutefois, pour le moment, il me semble que les informations reprises dans les dictionnaires dont vous parlez proviennent de dictionnaires bilingues traditionnels semblables à ceux qui sont intégrés dans Microsoft Office (tant dans le volet de référence que dans les « screentips » disponibles directement depuis le traitement de texte dans Office 2007) et dont j’ai parlé ici :
Accessing bilingual dictionaries in Office 2007.

On le voit si l’on demande la traduction d’un mot comme « shoot », par exemple : ce mot est traduit par « pousse f », où le « f » est l’abréviation de féminin. Ce genre d’information ne peut que provenir d’un dictionnaire bilingue et pas d’une mémoire de traduction. Cela changera peut-être à l’avenir, bien sûr.

Bien à vous,

Thierry

un néo santécois a dit…

Moi je passe par google talk : il y a une série de "bots" qui permettent de traduite & très rapidement du texte
http://www.google.com/support/talkgadget/bin/answer.py?answer=89921

Jean-Marie Le Ray a dit…

Arnet,

Merci, j'ignorais cette possibilité, j'étudierai ça de plus près.

Jean-Marie