jeudi 10 septembre 2020

Du traducteur mécanique à la robotique du traduire, fin de la biotraduction ?

Du traducteur mécanique, théorisé dès 1929 par Federico Pucci, à la "robotique du traduire" annoncée dans un colloque à venir (reporté à une date encore indéterminée pour cause de COVID), la présente décennie n'a pas encore bouclé un siècle de progrès en traduction et déjà certains experts nous prédisent que d’ici 2024 l’intelligence artificielle dépassera les humains dans la traduction des langues...

En gros, je diviserais ce siècle d'incroyables progrès de la manière suivante :

  • Une cinquantaine d'années (1954-2007) durant lesquelles la traduction automatique à base de règles est pratiquement la seule technologie utilisée à grande échelle, sans parvenir toutefois aux résultats espérés, en termes de fidélité et de qualité des traductions. Je prends le mois d'octobre 2007 pour référence, puisque c'est à ce moment-là que Google, qui continuait jusqu'alors d'utiliser l'outil RBMT Systran, bascule sur son système maison à base de statistiques, Google Translate, ce dont j'avais rendu compte à l'époque.

    En moins de 80 ans, Google réalise donc l'utopie de Federico Pucci, sans aucun doute le seul de son époque à avoir rêvé d’une machine simple (Temps nécessaire pour apprendre à traduire : une minute…), pratique, peu encombrante et abordable (il n'aurait quand même pas pu en concevoir la gratuité !), le seul à avoir envisagé ante litteram la démocratisation planétaire de la traduction automatique telle que nous la connaissons aujourd'hui !
  • Une décennie (oct. 2007 - nov. 2016) à peine pour que Google passe définitivement de la traduction statistique à son moteur de traduction neuronal !
  • Moins d'une décennie (2016-2024) au cours de laquelle la biotraduction (ou "traduction humaine" pour les intimes, mais il y en aura également pour les interprètes avec le Translatotron) devrait toucher à sa fin, selon certains experts...
Rassurons-nous, cette "fin annoncée" ne date pas d'aujourd'hui, puisque cela fait longtemps que l'espèce en voie d'extinction des traducteurs humains agite les esprits : voir ici par exemple.

*

Donc : la traduction automatique arrive en force sur le (les) marché(s) de la traduction, c'est une évidence. Dont j'ai eu l'occasion de parler en mai dernier (dès 6'42'' sur la vidéo) lors des "rencontres sur les rives de la traduction" (Encounters at the Shores of Translation) organisées via la plateforme Zoom par Hammouda Salhi (Director of the Master’s Program in Translation and Interpreting - University of Tunis El Manar) :


Or aujourd'hui, qui dit "traduction automatique" dit "post-édition de la traduction automatique", MTPE dans le jargon. À ce sujet, le contexte du futur colloque robotrad2020 nous dit ceci : 
Comme de surcroît la machine permet des gains de productivité de l’ordre de 150 à 200% (certains traducteurs atteignent des rendements de 6000 à 8000 mots par jour), la technique de la post-édition tend à s’imposer de plus en plus dans les industries de la langue, ce que confirme en 2017 la sortie de la norme ISO 18587 (Services de traduction — Post-édition d'un texte résultant d'une traduction automatique — Exigences). Cette technique de post-édition pose un cas de conscience au traducteur : accepter de ne pas être à l’origine de sa propre traduction au profit de la machine.

Ces quelques lignes suscitent en moi quantité de réactions, de points à soulever, de non-dits à exprimer autour de la MTPE, que je qualifie personnellement d'industrialisation du good enough... 

Ou en tout cas d'un coup de force censé faire table rase de l'effet Mozart, théorisé il y a quelques années par Rory Cowan, fondateur de Lionbridge Technologies, à l'époque n° 1 de la localisation dans le monde : 

Si, en 1790, il fallait cinq musiciens pour interpréter un quintette de Mozart durant tant de minutes, aujourd'hui, en dépit des progrès techniques considérables qui ont été accomplis depuis, rien n'a changé : il faut toujours autant de musiciens jouant pendant autant de temps pour restituer la même œuvre ! 

Ce que je commentais ainsi, il y a plus de 10 ans déjà :

Cette belle métaphore sur l'incompressibilité de certains délais d'exécution souligne implicitement les limites de la technologie galopante, qui ne pourra jamais répondre à tout sans intervention humaine, notamment au plan de la productivité.

Des traducteurs en ce qui nous concerne. D'où l'inutilité de toujours les presser ... comme des citrons trop mûrs, en leur demandant à tort et à travers la quadrature du triangle !

Car à force de véhiculer un tas d'idées préconçues sur l'activité des traducteurs, par exemple en assimilant toujours plus le résultat de leur travail à une "commodité", on en finit par perdre de vue combien est fausse et nocive cette notion de commoditisation de la traduction. D'abord, une commodité en français (agrément, avantage, confort, utilité, ...) n'a absolument rien à voir avec la "commodity" anglo-saxonne, qui désigne un produit de base, une matière première.

Nous y voilà : traduction = marchandise, et plus la quantité est importante, plus la remise doit être conséquente. Or c'est oublier un peu vite le fait que la traduction n'est pas un produit comme un autre, mais un service à haute valeur ajoutée d'autant plus spécialisé que le domaine est pointu, et que la seule matière première utilisée servant à la "fabriquer" est la matière grise du traducteur. Dont la logique objective est très exactement inverse à celle du client : plus la quantité est importante, plus ça va me demander de temps et d'efforts pour maintenir le même niveau de qualité de bout en bout. Une qualité qui n'est pas acquise par enchantement, mais conquise de haute lutte. Dans la durée.

Une réalité sur laquelle les clients - et les agences qui les secondent dans cette approche pour les conserver à tout prix (c'est le cas de dire) - font trop souvent l'impasse, ce qui contribue à ternir l'image d'une profession en vérité hautement spécialisée, exigeant des années et des années de pratique et de formation continues avant de donner de bons ouvriers. De plus en plus rares. Or tout ce qui est rare est cher, qu'on se le dise.

De fait, la MTPE tente vainement d'annuler cette incompressibilité des délais d'exécution, qui demeure pourtant, envers et contre tout. Donc, lorsque l'on parle de "gains de productivité de l’ordre de 150 à 200%" et de traducteurs pouvant atteindre "des rendements de 6000 à 8000 mots par jour", il faudrait aussi préciser les conditions de tels "gains" et de tels "rendements", or c'est là où le bât blesse...

Car ces ordres de grandeur renvoient à des situations "idéales", où la qualité du moteur de traduction serait extrêmement performante et permettrait de générer un résultat brut (raw output) quasiment irréprochable, d'où une post-édition légère...

Ce qui supposerait en premier lieu d'avoir des corpus bilingues très importants pour former les moteurs de TA, voire une pré-édition humaine pour "nettoyer" ces masses de texte et fournir des corpus de qualité, etc. etc.

Je vous rassure, cela n'est presque jamais le cas dans la pratique ! Ce qui précède relève davantage du discours marketing des grands fournisseurs de services linguistiques (LSP et autres) pour mieux faire passer la pilule, car c'est surtout un excellent moyen de faire baisser (d'environ 30% au minimum) les tarifs payés aux traducteurs en bout de chaîne, ainsi qu'une bonne excuse pour raccourcir les délais de livraison : avant on pouvait raisonnablement compter sur 2500 mots/jour ouvrable en moyenne, nous en sommes aujourd'hui à une fourchette d'au moins 4000/5000 mots/jour ouvrable avec la MTPE.

Donc c'est vrai, 150 à 200% de gains de productivité, mais dans des conditions de travail loin d'être idéales : des résultats générés par la TA le plus souvent médiocres, d'où des post-éditions lourdes, à faire plus vite vu les quantités de mots à traiter augmentées, et en étant payés moins cher : la totale !

Nous en sommes toujours là, chose dont je parlais déjà en 2003 (!), en tentant d'expliquer et de dénoncer l'impossible exigence, finissant toujours par retomber sur le dos des traducteurs, qui consistait concrètement (et vainement) à leur demander de réaliser la quadrature du triangle !

Imaginez un triangle équilatéral avec aux trois côtés les légendes - DÉLAIS - COÛTS - QUALITÉ - et au centre le terme RESSOURCES :


- où la « ressource Traducteur » (seule composante « humaine » des ressources, matérielles, logicielles, etc.) est broyée dans l’engrenage irréalisable de faire cadrer des nécessités incompatibles, liées à la triple exigence des coûts, des délais et de la qualité (cités par ordre d’importance selon les clients)
- où les délais de remise de la traduction (c’est pour hier, comme on dit en italien) sont inversement proportionnels aux délais de paiement (à la fronde, et le plus tard possible)
- où le niveau des prix reconnus au traducteur (tarifs plus bas possibles) est inversement proportionnel au niveau de qualité requis (toujours être ultra-spécialisé et omni-polyvalent) (la « multicompétence » selon Gouadec).

En fait, dans cette impossible équation de la quadrature du triangle, le concept était très simple : entre DÉLAIS, COÛTS et QUALITÉ, prenez-en deux et oubliez le troisième…

Or ce n'est pas pour autant que les choses se sont améliorées avec la post-édition de la traduction automatique, au contraire, puisque nous avons plutôt tendance à régresser !

On voit d'ailleurs fort bien le déplacement des pôles d'attraction pour les clients au fil des décennies, puisque de l'accent essentiellement mis sur la Qualité dans les années 80, l'intérêt s'est reporté sur les Temps de livraison dans les années 90, pour passer au facteur Coûts dans les années 2000.

Vingt ans plus tard, avec la MTPE le secteur a résolument et ouvertement fait son choix : miser sur COÛTS et DÉLAIS aux dépens de la QUALITÉ !

Que les clients le sachent et ne s'en étonnent point : car prétendre offrir les trois à la fois est toujours une chimère, raison pour laquelle je pense que la "biotraduction" a encore de beaux jours devant elle...

La "robotique du traduire" aussi, c'est certain, mais tant qu'elle ne sera pas capable d'intégrer automatiquement tous les "plus" des traducteurs humains, autrement dit tant qu'elle restera tributaire de leurs compétences, il faudra que tous les partisans et acteurs de la "robotraduction" reconsidèrent les conditions de travail imposées aux biotraducteurs, à commencer par revaloriser le rapport multifactoriel difficulté/quantité/qualité/délais/tarifs au profit des femmes et des hommes qui se forment des années durant pour exercer professionnellement leur métier et en tirer un niveau de rémunération suffisamment gratifiant pour pouvoir en vivre décemment... Ouf !


3 commentaires:

David Cohen - dcohen@service-public.org a dit…

Bonjour Jean Marie

Cela doit bien faire 10 ans que je ne te lisais plus que sur Twitter (quand j'y vais). Il est 6h30 ("Les gens il conviendrait de ne les connaître que disponibles")
Mais là, ça titille ;-). Et le lecteur se met à parler.
J'ai tapé ça : https://www.google.com/search?q=comparaison+traduction+Google+vs+traduction+humaine&rlz=1CAIVGE_enFR787DE793&oq=comparaison+traduction+Google+vs+traduction+humaine&aqs=chrome..69i57.20948j1j7&sourceid=chrome&ie=UTF-8

Les 3 1ers résultats dont 2 premiers de 2018 ne m'ont pas satisfait (bal...bla ... que choisir?).
J'espérais trouver 2 blocs de texte : 1 trad auto vs 1 trad humaine

Je crois à cette démonstration par la lecture de textes traduits COMPARéS et sans doute faudrait-il faire des variantes autour de textes spécialisés, textes d'experts, textes de fiction ....

La traduction automatique de 2007 m'avait rappelé un système que j'avais mis au point en 1ere (fin années 60) et pour le latin : nous étions 3.
Mais ça ne marchait que dans le sens Latin >> Français. >>
Les 2 autres me fournissaient 2 traductionS brutes, et moi je rendais 2 versions françaises du meme texte latin. C'était déja gratuit puisque ça me permettait de générer une 3eme version FR pour moi avec qqs rares accès au dico quand même.

Bien sûr, depuis 2007, SEO oblige, j'ai parfois fait appel à des traducteurs de langues maternelles diverses (mais surtout anglais) ....
Au début des années 2000, quand Google nous fournissait des listes de mots-clés hiérarchisés, j'ai vu des traducteurs ouvrir des yeux ronds sur cet outil et se mettre avec enthousiasme à me livrer des TITLE SEO et des Métadescriptions robustes basés sur leur compétence mais aussi sur cette découverte du synonyme le plus utilisé/tapé.(site de tourisme à optimiser en 10 langues)

Je te raconte ça parce que je crois fortement (et j'attend ta contradiction) que ma MTPE quotidienne (et googlienne sur Chrome par flemme de déclencher Deepmachin) est basée sur ma compréhension, bien sûr, MAIS SURTOUT, mon amour de la langue française.
Mon SEO traducteur exclusif en anglais est depuis 8 ans : un français qui compose des chansons en anglais depuis l'âge de 15 ans (il en a 31, il a passé 1 an à animer des émissions de radio à Mac Gill Montréal en anglais).
Quand je lis un roman ou un essai traduit en FR, je regarde TOUJOURS le nom du traducteur-trice, c'est pour moi à 30% l'auteur du livre.
David

Jean-Marie Le Ray a dit…

Salut David,

Je crois que l'un des premiers champs d'application - méconnu - de la traduction automatique sur le Web a été les listes de mots clés, avec plus ou moins de bonheur...
Alors oui, la MTPE s'applique fort bien à ce domaine, en faisant corriger la traduction machine par un "SEO traducteur exclusif" pour chaque langue, mais combien de SEO le font ? That is the question :-)

Jean-Marie Le Ray a dit…

P.S. Maintenant, si on applique la traduction automatique à ça, ou mieux, si on fusionne TA et IA, ce serait intéressant de voir ce que ça donne : https://twitter.com/digitalquokka/status/1313038101342826497