jeudi 10 septembre 2020

Du traducteur mécanique à la robotique du traduire, fin de la biotraduction ?

Du traducteur mécanique, théorisé dès 1929 par Federico Pucci, à la "robotique du traduire" annoncée dans un colloque à venir (reporté à une date encore indéterminée pour cause de COVID), la présente décennie n'a pas encore bouclé un siècle de progrès en traduction et déjà certains experts nous prédisent que d’ici 2024 l’intelligence artificielle dépassera les humains dans la traduction des langues...

En gros, je diviserais ce siècle d'incroyables progrès de la manière suivante :

  • Une cinquantaine d'années (1954-2007) durant lesquelles la traduction automatique à base de règles est pratiquement la seule technologie utilisée à grande échelle, sans parvenir toutefois aux résultats espérés, en termes de fidélité et de qualité des traductions. Je prends le mois d'octobre 2007 pour référence, puisque c'est à ce moment-là que Google, qui continuait jusqu'alors d'utiliser l'outil RBMT Systran, bascule sur son système maison à base de statistiques, Google Translate, ce dont j'avais rendu compte à l'époque.

    En moins de 80 ans, Google réalise donc l'utopie de Federico Pucci, sans aucun doute le seul de son époque à avoir rêvé d’une machine simple (Temps nécessaire pour apprendre à traduire : une minute…), pratique, peu encombrante et abordable (il n'aurait quand même pas pu en concevoir la gratuité !), le seul à avoir envisagé ante litteram la démocratisation planétaire de la traduction automatique telle que nous la connaissons aujourd'hui !
  • Une décennie (oct. 2007 - nov. 2016) à peine pour que Google passe définitivement de la traduction statistique à son moteur de traduction neuronal !
  • Moins d'une décennie (2016-2024) au cours de laquelle la biotraduction (ou "traduction humaine" pour les intimes, mais il y en aura également pour les interprètes avec le Translatotron) devrait toucher à sa fin, selon certains experts...
Rassurons-nous, cette "fin annoncée" ne date pas d'aujourd'hui, puisque cela fait longtemps que l'espèce en voie d'extinction des traducteurs humains agite les esprits : voir ici par exemple.

*

Donc : la traduction automatique arrive en force sur le (les) marché(s) de la traduction, c'est une évidence. Dont j'ai eu l'occasion de parler en mai dernier (dès 6'42'' sur la vidéo) lors des "rencontres sur les rives de la traduction" (Encounters at the Shores of Translation) organisées via la plateforme Zoom par Hammouda Salhi (Director of the Master’s Program in Translation and Interpreting - University of Tunis El Manar) :


Or aujourd'hui, qui dit "traduction automatique" dit "post-édition de la traduction automatique", MTPE dans le jargon. À ce sujet, le contexte du futur colloque robotrad2020 nous dit ceci : 
Comme de surcroît la machine permet des gains de productivité de l’ordre de 150 à 200% (certains traducteurs atteignent des rendements de 6000 à 8000 mots par jour), la technique de la post-édition tend à s’imposer de plus en plus dans les industries de la langue, ce que confirme en 2017 la sortie de la norme ISO 18587 (Services de traduction — Post-édition d'un texte résultant d'une traduction automatique — Exigences). Cette technique de post-édition pose un cas de conscience au traducteur : accepter de ne pas être à l’origine de sa propre traduction au profit de la machine.

Ces quelques lignes suscitent en moi quantité de réactions, de points à soulever, de non-dits à exprimer autour de la MTPE, que je qualifie personnellement d'industrialisation du good enough... 

Ou en tout cas d'un coup de force censé faire table rase de l'effet Mozart, théorisé il y a quelques années par Rory Cowan, fondateur de Lionbridge Technologies, à l'époque n° 1 de la localisation dans le monde : 

Si, en 1790, il fallait cinq musiciens pour interpréter un quintette de Mozart durant tant de minutes, aujourd'hui, en dépit des progrès techniques considérables qui ont été accomplis depuis, rien n'a changé : il faut toujours autant de musiciens jouant pendant autant de temps pour restituer la même œuvre ! 

Ce que je commentais ainsi, il y a plus de 10 ans déjà :

Cette belle métaphore sur l'incompressibilité de certains délais d'exécution souligne implicitement les limites de la technologie galopante, qui ne pourra jamais répondre à tout sans intervention humaine, notamment au plan de la productivité.

Des traducteurs en ce qui nous concerne. D'où l'inutilité de toujours les presser ... comme des citrons trop mûrs, en leur demandant à tort et à travers la quadrature du triangle !

Car à force de véhiculer un tas d'idées préconçues sur l'activité des traducteurs, par exemple en assimilant toujours plus le résultat de leur travail à une "commodité", on en finit par perdre de vue combien est fausse et nocive cette notion de commoditisation de la traduction. D'abord, une commodité en français (agrément, avantage, confort, utilité, ...) n'a absolument rien à voir avec la "commodity" anglo-saxonne, qui désigne un produit de base, une matière première.

Nous y voilà : traduction = marchandise, et plus la quantité est importante, plus la remise doit être conséquente. Or c'est oublier un peu vite le fait que la traduction n'est pas un produit comme un autre, mais un service à haute valeur ajoutée d'autant plus spécialisé que le domaine est pointu, et que la seule matière première utilisée servant à la "fabriquer" est la matière grise du traducteur. Dont la logique objective est très exactement inverse à celle du client : plus la quantité est importante, plus ça va me demander de temps et d'efforts pour maintenir le même niveau de qualité de bout en bout. Une qualité qui n'est pas acquise par enchantement, mais conquise de haute lutte. Dans la durée.

Une réalité sur laquelle les clients - et les agences qui les secondent dans cette approche pour les conserver à tout prix (c'est le cas de dire) - font trop souvent l'impasse, ce qui contribue à ternir l'image d'une profession en vérité hautement spécialisée, exigeant des années et des années de pratique et de formation continues avant de donner de bons ouvriers. De plus en plus rares. Or tout ce qui est rare est cher, qu'on se le dise.

De fait, la MTPE tente vainement d'annuler cette incompressibilité des délais d'exécution, qui demeure pourtant, envers et contre tout. Donc, lorsque l'on parle de "gains de productivité de l’ordre de 150 à 200%" et de traducteurs pouvant atteindre "des rendements de 6000 à 8000 mots par jour", il faudrait aussi préciser les conditions de tels "gains" et de tels "rendements", or c'est là où le bât blesse...

Car ces ordres de grandeur renvoient à des situations "idéales", où la qualité du moteur de traduction serait extrêmement performante et permettrait de générer un résultat brut (raw output) quasiment irréprochable, d'où une post-édition légère...

Ce qui supposerait en premier lieu d'avoir des corpus bilingues très importants pour former les moteurs de TA, voire une pré-édition humaine pour "nettoyer" ces masses de texte et fournir des corpus de qualité, etc. etc.

Je vous rassure, cela n'est presque jamais le cas dans la pratique ! Ce qui précède relève davantage du discours marketing des grands fournisseurs de services linguistiques (LSP et autres) pour mieux faire passer la pilule, car c'est surtout un excellent moyen de faire baisser (d'environ 30% au minimum) les tarifs payés aux traducteurs en bout de chaîne, ainsi qu'une bonne excuse pour raccourcir les délais de livraison : avant on pouvait raisonnablement compter sur 2500 mots/jour ouvrable en moyenne, nous en sommes aujourd'hui à une fourchette d'au moins 4000/5000 mots/jour ouvrable avec la MTPE.

Donc c'est vrai, 150 à 200% de gains de productivité, mais dans des conditions de travail loin d'être idéales : des résultats générés par la TA le plus souvent médiocres, d'où des post-éditions lourdes, à faire plus vite vu les quantités de mots à traiter augmentées, et en étant payés moins cher : la totale !

Nous en sommes toujours là, chose dont je parlais déjà en 2003 (!), en tentant d'expliquer et de dénoncer l'impossible exigence, finissant toujours par retomber sur le dos des traducteurs, qui consistait concrètement (et vainement) à leur demander de réaliser la quadrature du triangle !

Imaginez un triangle équilatéral avec aux trois côtés les légendes - DÉLAIS - COÛTS - QUALITÉ - et au centre le terme RESSOURCES :


- où la « ressource Traducteur » (seule composante « humaine » des ressources, matérielles, logicielles, etc.) est broyée dans l’engrenage irréalisable de faire cadrer des nécessités incompatibles, liées à la triple exigence des coûts, des délais et de la qualité (cités par ordre d’importance selon les clients)
- où les délais de remise de la traduction (c’est pour hier, comme on dit en italien) sont inversement proportionnels aux délais de paiement (à la fronde, et le plus tard possible)
- où le niveau des prix reconnus au traducteur (tarifs plus bas possibles) est inversement proportionnel au niveau de qualité requis (toujours être ultra-spécialisé et omni-polyvalent) (la « multicompétence » selon Gouadec).

En fait, dans cette impossible équation de la quadrature du triangle, le concept était très simple : entre DÉLAIS, COÛTS et QUALITÉ, prenez-en deux et oubliez le troisième…

Or ce n'est pas pour autant que les choses se sont améliorées avec la post-édition de la traduction automatique, au contraire, puisque nous avons plutôt tendance à régresser !

On voit d'ailleurs fort bien le déplacement des pôles d'attraction pour les clients au fil des décennies, puisque de l'accent essentiellement mis sur la Qualité dans les années 80, l'intérêt s'est reporté sur les Temps de livraison dans les années 90, pour passer au facteur Coûts dans les années 2000.

Vingt ans plus tard, avec la MTPE le secteur a résolument et ouvertement fait son choix : miser sur COÛTS et DÉLAIS aux dépens de la QUALITÉ !

Que les clients le sachent et ne s'en étonnent point : car prétendre offrir les trois à la fois est toujours une chimère, raison pour laquelle je pense que la "biotraduction" a encore de beaux jours devant elle...

La "robotique du traduire" aussi, c'est certain, mais tant qu'elle ne sera pas capable d'intégrer automatiquement tous les "plus" des traducteurs humains, autrement dit tant qu'elle restera tributaire de leurs compétences, il faudra que tous les partisans et acteurs de la "robotraduction" reconsidèrent les conditions de travail imposées aux biotraducteurs, à commencer par revaloriser le rapport multifactoriel difficulté/quantité/qualité/délais/tarifs au profit des femmes et des hommes qui se forment des années durant pour exercer professionnellement leur métier et en tirer un niveau de rémunération suffisamment gratifiant pour pouvoir en vivre décemment... Ouf !


dimanche 17 mai 2020

Federico Pucci censuré par Wikipedia.it


*

En cette année du 124e anniversaire de la naissance de Federico Pucci, je publie ici la traduction française de l'article écrit pour Wikipedia.it en décembre 2019 par Oriana de Majo (petite-fille de Federico), avec son mari, que l’Encyclopédie libre a malheureusement refusé de manière tout à fait arbitraire.

Rien n’a été changé à l’original [si ce n’est quelques illustrations supplémentaires et quelques petites mises à jour en italique, insérées entre crochets], donc les lecteurs pourront se faire leur propre idée du bien-fondé - ou pas - de cette censure !

* * *

Federico Erminio Raniero Carmine Filiberto Pucci (Naples, 23 mars 1896 - Salerne, 6 mars 1973), plus simplement connu sous le nom de Federico Pucci, était un homme de génie et de culture, polyglotte et précurseur de la traduction automatique. C’est à lui que nous devons l'invention de la première méthode de traduction automatique à base de règles documentée au monde.

*

Sommaire

1 Biographie
1.1 Origines familiales et premières années
1.2 Le système de traduction mécanique, la participation aux expositions internationales et les années de la 2e guerre mondiale
1.3 L'après-guerre, les articles dans la presse internationale et les lettres au CNR
1.4 Les dernières années
2. L’invention
3. Honneurs
4. Notes

*

1 BIOGRAPHIE



1.1 Origines familiales et premières années

Federico Pucci naît à Naples le 23 mars 1896, via Foria n° 10. Son père, Arturo Enrico Emmanuele Pucci, né à Naples le 13 avril 1863, était le dernier enfant du capitaine de vaisseau Emmanuele Pucci, officier de la Marine Royale et, auparavant, de la Marine royale du Royaume des Deux-Siciles.

Issus d'une branche de la famille Pucci de Florence, les Pucci de Naples s’étaient installés en Sicile à la fin du XVIe siècle pour des raisons politiques. Le père d'Emmanuele, le vice-amiral Ferdinando Pucci, après avoir servi dans la Marine royale du Royaume des Deux-Siciles depuis les guerres napoléoniennes jusqu'en 1860, avait alors mis fin à sa carrière au rang de commandant du 1er district maritime du Royaume d'Italie et d’aide de camp du Roi.


L'épouse d'Emmanuele, Dame Agata Benzo & Sammartino dei Duchi di Verdura, était issue d'une famille de la haute aristocratie sicilienne, sœur de Giulio Benso della Verdura, préteur et premier maire de Palerme après l'unification de l'Italie, ainsi que sénateur du Royaume.

Enrico Pucci était veuf et père de deux enfants, Aurelio et Raffaele, lorsqu'il épousa la mère de Federico, Sofia Pisapia Fiore, descendante d'une famille de magistrats et d'hommes de loi du Royaume des Deux-Siciles. Federico prit le nom de son grand-père maternel, Federico Pisapia Fiore, officier du IIIe Chasseur du Royaume des Deux-Siciles. Orphelin de ses deux parents alors qu’il n’était qu'adolescent, il fut confié à ses oncles maternels, Gennaro et Emilia Pisapia Fiore.

[L'épouse de Federico Pisapia Fiore, grand-mère maternelle de Federico Pucci, s'appelait Maria Migliorini, dont les parents étaient Scipione Migliorini et Cristina Devaux, qui, sur certains certificats, est également indiquée Clarì, probablement en raison de la transcription italianisée à l’état civil : Clary.]

Inscrit à l'Institut de comptabilité, seul lycée à l'époque qui permettait une étude approfondie des langues étrangères ainsi que des mathématiques dans la formation des étudiants, Federico voulut étudier par lui-même plusieurs langues étrangères. L'amour extraordinaire pour la culture et les langues était une caractéristique de sa famille d'origine, de même que l'habitude de s'exprimer en français aussi dans la vie quotidienne, qu'il maintint tout au long de sa vie et transmit à ses filles.

Compte tenu de cette prédisposition extraordinaire aux langues étrangères, il s’inscrivit à l'Institut royal oriental de Naples, le plus ancien établissement de sinologie et d'études orientales du continent européen. C'est là qu'il apprit plusieurs langues orientales, dont le chinois et le coréen ; toutefois, il n'obtint pas son diplôme car injustement accusé, lors de l'examen écrit final, d'avoir laissé un autre candidat copier son travail. Profondément offensé par cette accusation indue, il refusa de répéter l'examen.

Afin de devenir financièrement autonome et ne plus dépendre de ses oncles, Federico concourut très jeune pour un poste de traducteur-interprète auprès de la société italienne des chemins de fer, se classant premier pour 15 langues, où il fut recruté, en 1915, en tant que dirigeant.

Après avoir déménagé à Salerne, il s’y maria le 13 janvier 1924, avec Gilda De Filippis, mère de ses quatre filles, dont Anna, maman d'Oriana et Marina de Majo, gardiennes de la mémoire de leur grand-père. [Début]

1.2 Le système de traduction mécanique, la participation aux expositions internationales et les années de la 2e guerre mondiale

En décembre 1929, Federico Pucci présenta à Salerne sa première étude sur la traduction mécanique, qui fut également présentée à la presse italienne en 1930.

Cette même année, il exposa pendant six mois (mars-novembre) le texte du « Traducteur mécanique français-italien » à la foire de Bolzano, section littéraire, en recevant la médaille d'argent.

Toujours en 1930, il participa à la foire commerciale de Coni, avec le même texte, récompensé là aussi par une médaille d'argent.

[En 1931, il publia le premier texte au monde sur le traducteur "mécanique" des temps modernes, ainsi que le premier, à notre connaissance, d'une dizaine de livres écrits en 30 ans sur son idée d'invention, encore totalement inconnue aujourd'hui.]

En 1934, il fut admis par le CNR à participer à la foire du Levant à Bari, première exposition internationale des inventions.

En 1935, il obtint la médaille d'argent à la foire de Paris pour « La methode à traduire les langues sans les connaître » puis, en 1936, il participa à l'Exposition internationale des inventions de la Foire de Leipzig. Sur proposition du ministre des Communications, en octobre 1936, il fut nommé chevalier de l'Ordre de la couronne d'Italie.


Il est très probable que cet honneur lui fût accordé en raison de sa brillante participation à ces foires, et plus particulièrement à celle de Paris.

En février 1936, pendant la guerre d'Éthiopie, Federico Pucci publia un court essai à visée géopolitique : « L’Europa non vuol morire » [1]. La motivation principale de cet ouvrage, manifestement de nature apologétique, résidait dans le désir d’éloigner de sa personne les accusations d'anglophilie et de proximité avec les milieux maçonniques (en réalité pas entièrement infondées), compte tenu également de sa réputation de libre penseur et d’intellectuel cosmopolite. En fait, ces années-là, il partait souvent à l'étranger, et particulièrement en France. Son amitié avec le juriste français Henri Demont, auteur du texte : « Pour supprimer ce crime: la guerre », et auteur, dès 1908, d'un projet de réalisation d'une « Société des Nations » [2] était notoire.


À cette époque, Pucci travailla au développement d'un traducteur mécanique à usage militaire. En 1940, il proposa au ministère de la Guerre un système de traduction basé sur un appareil émetteur C et un appareil récepteur D, également en vue de sa participation à l'Exposition de la technique en 1940.

Le ministère s'intéressa à ses recherches et envisagea de financer la construction d'un prototype mécanique par Pucci lui-même. Pour autant Federico renonça à cette possibilité, craignant qu'en devant s'appuyer sur un technicien pour la construction du prototype, celui-ci ne puisse garder le secret.

Après l’entrée en guerre en juin 1940, en raison de ses connaissances linguistiques, la préfecture de Salerne lui confia la censure de la correspondance civile et militaire dans 30 langues étrangères, tel qu’il résulte d’une attestation délivrée après le conflit par le Préfet Cenami, qui en certifiait les compétences en tant que membre de la Commission provinciale de Salerne.


Dans l'accomplissement de cette tâche, il utilisa ce qu'il définit lui-même comme le « traducteur mécanique E », ... « qui réussissait, grâce à un système d'abscisses et d'ordonnées cartésiennes, à déterminer la langue dans laquelle était écrit le texte source, de par les valeurs de chacune des lettres, à condition que le texte original fût écrit selon le système de substitution des constantes littérales ». [3]

En réalité, Pucci se voyait confier l'examen de la correspondance provenant non seulement de l'Italie centrale et du sud, mais aussi de l'étranger, en particulier d'Allemagne, car bien qu'il ne fût pas le seul à Salerne à maîtriser la langue allemande, il était le seul à pouvoir lire facilement les caractères gothiques.

En 1942, il réussit à effectuer « l'analyse grammaticale automatique », approuvée par le Conseil National des Recherches dans son avis n° 11095 du 30 octobre 1942. Cependant, ce même CNR – avec la même vision obtuse dont la bureaucratie italienne avait initialement fait preuve dans le cas de Guglielmo Marconi - ne considéra jamais les études théoriques de Pucci comme une invention, dès lors qu’elles ne s’étaient pas concrétisées par la construction d'une machine.

Fin juin 1943, en prévision d'un éventuel débarquement allié dans le golfe de Salerne (comme cela se produisit réellement le 9 septembre 1943), Pucci loua une maison dans un lieu situé à distance sûre, loin de la côte (Ajello di Baronissi), en interrompant son travail à la préfecture. Il y travailla comme traducteur-interprète auprès d’une unité allemande (la 16e Panzerdivision) où il eut l'occasion, selon le récit qu’il en fait dans une lettre au CNR [4], de voir le système de chiffrement électromécanique Enigma, qui présentait des analogies intéressantes avec son projet de traducteur mécanique.

La logique de l'appareil de chiffrement allemand qui, contrairement au traducteur mécanique, se basait sur des circuits électriques, apparaissait en fait similaire à celle de l'invention de Pucci. Après le retrait des troupes allemandes et le débarquement des Alliés, il reprit ses activités auprès de la société italienne des chemins de fer, tandis que ses deux filles aînées furent employées par l'administration militaire alliée. [Début]

1.3 L'après-guerre, les articles dans la presse internationale et les lettres au CNR

Fin 1949, du fait que sa qualification de traducteur ne lui fut pas reconnue et qu’il se vit donc refuser la possibilité d'être promu à niveau supérieur, en dépit de son ancienneté professionnelle et des services rendus à l'administration, Federico Pucci quitta la société italienne des chemins de fer. Sa préretraite lui permit de se consacrer à ses recherches sur le traducteur, dont l’appellation passa de « mécanique » à « dynamo-mécanique », en s'inspirant probablement de sa découverte d’« Enigma ».

Le 25 août 1949, l'agence de presse américaine United Press lança depuis Salerne une dépêche mentionnant l'invention de Pucci. Une nouvelle qui suscita grand intérêt dans le monde anglo-saxon puisqu’elle fut reprise dans la presse par les principaux médias, notamment le New York Times aux États-Unis, et le News Chronicle au Royaume-Uni (le 26 août).




L'étude sur le « traducteur dynamo-mécanique » fut présentée à l’exposition-concours d’inventions de la foire de Paris du 16 au 29 septembre. En cette occasion, bien que Pucci n’eut présenté aucun prototype mais le seul projet de son « traducteur », les autorités françaises lui accordèrent un « certificat de garantie » visant à en protéger la propriété intellectuelle.

La lettre au CNR par laquelle Pucci souhaita faire reconnaître son invention date du 10 juillet 1949. Il s’ensuivit une deuxième lettre, datée du 17 octobre 1949. Le CNR répondit à ces deux missives sur un ton bureaucratique, en l'invitant à contacter l'Institut italien pour l'éducation et les inventions du ministère de l'Industrie et du Commerce extérieur.


Dans son courrier du mois de juillet, Pucci informait le CNR des progrès réalisés aux États-Unis par le Dr Harry Huskey dans la construction d'un « cerveau électrique » devant servir à la traduction littérale des langues étrangères, qui aurait eu cependant un potentiel inférieur au système que lui-même avait conçu.

En réalité Huskey, pionnier de l'informatique, après avoir rencontré Alan Turing lors de ses études au Royaume-Uni, s’était convaincu de la possibilité d'utiliser l'ordinateur qu'il avait fabriqué à Los Angeles, le Standards Western Automatic Computer (SWAC), non seulement pour ses fonctions de calcul, mais aussi pour la traduction automatique de l'allemand vers l'anglais.

Selon Pucci, la production en série de son « traducteur » aurait entraîné des coûts inférieurs à ceux du « cerveau électrique » américain, qui bénéficiait en revanche de financements de la marine américaine. Dans cette même lettre, Pucci mentionnait la lettre qu’il avait envoyée au président Truman pour lui exposer son invention.

En 1953, il envoya d’ailleur un courrier similaire à l'ambassadrice américaine en Italie, Clare Boothe Luce.

En 1949, Pucci publia les ouvrages suivants :
  • Serie delle grammatiche dinamiche, pratiche, ragionate, storico-comparate: Parte I. Per coloro che in pochi giorni desiderano acquistare una conoscenza elementare della lingua straniera. [fasc. I.] Inglese” ; 
  • « Le traducteur dynamo-mécanique: L'invention pour traduire les langues de l'occident sans les connaitre presque sans dictionnaire. Op. I: anglais-français. Sous-titré : « Perfectionnement de l'invention primée (traduction mécanique) avec diplôme de médaille d'argent à l'Exposition Concours International des Inventions, Foire de Paris 1935 » 
  • Il traduttore dinamo-meccanico: Serie A. L'invenzione per la traduzione immediata e rapida nelle lingue dell'Occidente senza conoscerle e quasi senza vocabolario... [fasc. ] 1. francese – italiano” ; 
  • Il traduttore dinamo-meccanico: Serie A. L'invenzione per la traduzione immediata e rapida nelle lingue dell'Occidente senza conoscerle e quasi senza vocabolario... [fasc. ] 2. Inglese – italiano”. 
En 1950, Pucci participa au Concours d’inventions de la foire internationale mosane de Liège, où il reçut une médaille d'argent.

[Début]

1.4 Les dernières années

Dans les années 1950, Pucci poursuivit ses activités de recherches et d'études, même en l'absence de tout financement, en publiant les ouvrages suivants :
  • 1950: Grammatica dinamica della Lingua tedesca: (linee fondamentali); Il traduttore dinamo-meccanico: Tipo libro macchina. Serie A. L'invenzione per la traduzione immediata e rapida nelle lingue dell'Occidente senza conoscerle e quasi senza vocabolario. [fasc. ] 1. Italiano-Inglese 
  • 1952: Il traduttore dinamo-meccanico: Serie B. L'invenzione per la traduzione immediata e rapida nelle lingue dell'Occidente senza conoscerle e quasi senza vocabolario... [fasc. ] 1. Italiano – Francese
  • 1958: Vocabolario mobile italiano - francese: (parte Traduttore Meccanico).
Durant cette période, Pucci fit aussi quelques voyages à l'étranger, dont un en France, en 1950, où l’on sait qu’il rencontra son ami Henry Demont, et un en Israël, en 1954.

En 1960, il publie son dernier ouvrage :
  • Il traduttore dinamo-meccanico: Serie A. L'invenzione per la traduzione immediata e rapida nelle lingue dell'Occidente senza conoscerle e quasi senza vocabolario Tedesco – Italiano, à savoir le traducteur appliqué à l’allemand.
Les dernières années de sa vie, il fut atteint d'une maladie qui le conduisit progressivement à la cécité. Il meurt à Salerne le 6 mars 1973. [Début]

2. L’invention

Pour saisir la portée de l'invention de Federico Pucci, une brève introduction s’impose sur le sens de « traduction automatique », en particulier lors de la période précédant l'invention des ordinateurs.

Selon le consensus actuel, jamais remis en question depuis plusieurs décennies, le concept de traduction automatique (TA) fait référence à l’acte de traduire par un ordinateur sans intervention humaine.

Avant l’ordinateur, on ne parle que de « traduction mécanique », voire de « machine à traduire », un distinguo qui demeure dans l’appellation anglaise de la discipline : « Machine Translation », ou MT en abrégé.

Après l’ordinateur, parfois qualifié de « cerveau électrique », ou « cerveau électronique », les premiers « logiciels » de traduction automatique furent des systèmes dits « à base de règles ». On n’utilisera pratiquement que ces systèmes pendant une cinquantaine d’années, avant l’apparition de systèmes hybrides ou d’autres plus performants.

Et la première démonstration de l’histoire d’un système de traduction automatique à base de règles (RBMT, ou Rule-Based Machine Translation), est connue dans ses moindres détails : date, lieu, équipe, langues, déroulement, etc.

En fait, une anecdote plus qu’une véritable démonstration scientifique : nous sommes le 7 janvier 1954, à New York, au siège d’IBM, l’équipe est une collaboration entre la Georgetown University (M. Paul Garvin pour la partie linguistique) et IBM (M. Peter Sheridan pour la partie programmation), la paire de langues est le russe et l’anglais, un lexique de 250 mots choisis avec soin, quelques dizaines de phrases, 6 règles !

Le lendemain, IBM annonce dans un communiqué de presse :
And the giant computer, within a few seconds, turned the sentences into easily readable English. 
Ce même communiqué mentionnait cette phrase du professeur Leon Dostert, de l'Université de Georgetown, selon lesquel, en l’espace de quelques années la traduction automatique aurait pu devenir réalité :
Doctor Dostert predicted that “five, perhaps three years hence, interlingual meaning conversion by electronic process in important functional areas of several languages may well be an accomplished fact.” 
Le ton optimiste de cette déclaration eut surtout pour effet d'inciter le gouvernement américain à mettre à disposition d’importantes sommes pour la recherche. De ce point de vue, l'objectif fut atteint ! Pour autant, dans la réalité, l'expérience « Georgetown University – IBM » fut suivie d’une décennie que tous les spécialistes de l'histoire de la TA s'accordent à définir comme « la grande désillusion ».

Or cinq ans avant l'expérience américaine, dans sa première lettre au CNR datée du 10 juillet 1949, Federico Pucci faisait montre de claivoyance en prédisant à l'insu de la communauté scientifique internationale que :
« les sommes considérables allouées par le gouvernement américain pour la construction du cerveau électrique » concernaient un appareil « sans aucune utilisation commerciale et inadapté aux objectifs fixés », ce qui s'est très exactement produit par la suite.
Telle est, en résumé, l'expérience que la communauté scientifique considère à ce jour, en 2019, comme le début de la traduction automatique, un jugement qui devrait être revu à la lumière de l'invention de Pucci.


Car 25 ans avant l’expérience de Georgetown-IBM, en décembre 1929 (il y a donc 90 ans), M. Federico Pucci présenta sa méthode à Salerne, inventée de A à Z, qu’il conçut bien avant l’apparition de l’ordinateur, probablement dès la moitié des années 20, et que l’on peut parfaitement définir comme le premier système de « traduction mécanique à base de règles ».

Un système qui sera documenté de manière détaillée deux ans plus tard, dans un opuscule de 68 pages descriptives, publié en 1931, intitulé : « Il traduttore meccanico ed il metodo per corrispondersi fra europei conoscendo Ciascuno solo la propria Lingua : Parte I. » (« Le traducteur mécanique et la méthode pour correspondre entre européens, chacun en connaissant uniquement sa propre langue, 1e partie »), dont voici la couverture :


Une méthode extrêmement sophistiquée pour l’époque, n’ayant absolument rien à envier à l’expérience américaine qui sera réalisée un quart de siècle plus tard, et réunissant en un seul bloc les trois approches habituelles d’un système de TA à base de règles (elles seront distinctes par la suite, uniquement grâce à la puissance de calcul croissante des ordinateurs) ; pour simplifier :
  • Transfert direct : analyse morphologique, traduction mot à mot sur la base de dictionnaires bilingues, de compléments de vocabulaire et de tableaux de correspondances vocaliques et consonantiques entre les langues. Ex. italien-français :
  • Transfert indirect : analyse de la syntaxe et de la grammaire, représentations source et cible, et règles de transfert du texte source pour générer le texte cible… Entre autres, le livre propose 9 pages permettant de retrouver une entrée de dictionnaire en déterminant la valeur des modifications dues aux flexions (déclinaison, conjugaison, etc.). Ex. :

Chaque variation (voir troisièmes colonnes en partant de la gauche) exprime une flexion. Pucci nous donne l’exemple de la phrase italienne : l’uomo viene, où uomo est le mot fondamental, un substantif masculin singulier, et viene une déclinaison du verbe venire qui représente la modification du concept exprimé par l’infini en celui exprimé par la troisième personne du singulier de l’indicatif présent.

Donc, en utilisant la clé internationale X pour exprimer la variation du concept d'indéfini au concept de présent indicatif, nous obtenons :
- italien: L’uomo viene = l’uomo venire + X
- français: L’homme vient = l’homme venir + X
- allemand: Der Mann kommt = der Mann kommen + X
- anglais: The man comes = the man come + X
  • Transfert par pivot : le pivot peut être soit une interlangue naturelle (anglais, espéranto, etc.), soit une représentation symbolique, comme dans le cas de Pucci, faite de clés internationales et d’idéogrammes permettant une transmission des concepts par des éléments graphiques. Ex. :

Comme il le dit lui-même, les idéogrammes présentent plusieurs avantages :
  • de permettre au destinataire de percevoir les concepts plus rapidement (si un français veut communiquer l'idée d'un cheval et en dessine un, nous comprendrons plus rapidement que s’il se contente de nous dire ou d’écrire cheval) ;
  • de représenter par le graphisme des concepts grammaticaux et syntaxiques, voire d'expliquer dans une langue un concept grammatical manquant dans cette langue mais existant dans une autre.
Il précise enfin que quelques ajouts mineurs à ces clés fondamentales, valables pour les langues romanes, leur permettraient de servir également pour les langues slaves.

Du reste, dans le livre-machine que Federico Pucci publiera après la guerre, il nous montre une maquette de son invention intégrant les 4 modules suivants (son écriture) :
  • 1 vocabulaire mobile (A) 
  • 1 complément au vocabulaire mobile (B)
  • 1 correcteur syntaxique (C)
  • 1 correcteur morphologique (D) 
Maquette :

Chose incroyable : à chaque livre-machine publié il intégrera une maquette faite à la main et annotée de son écriture manuscrite, pour expliquer comment construire sa « machine à traduire » en respectant ses indications !


*

Imaginons pour conclure que Federico Pucci ait pu construire un prototype de son invention : il serait aujourd'hui rangé sur les mêmes étagères poussiéreuses de l’histoire que les machines de Georges Artsrouni et Petr Smirnov-Trojanskij, à savoir une sympathique curiosité totalement dépassée.

En revanche, il nous a légué bien plus qu'un dispositif obsolète, puisqu'il a consigné noir sur blanc à la postérité, dès 1931, le premier système documenté au monde de traduction automatique à base de règles, enrichi de deux trésors, à savoir les deux premiers textes traduits « mécaniquement » : un extrait de la Vita Nuova de Dante traduit de l'italien au français, et un extrait du Zadig de Voltaire traduit du français à l'italien, en avertissant dès l’avant-propos le lecteur sur l’apprentissage de sa méthode :
« Lire l'exemple de traduction en page 66 et vérifier, à l'aide du vocabulaire, la façon dont j'ai traduit. Puis après avoir traduit quelques lignes, lire les tableaux en page 36 pour éviter d'avoir trop souvent recours au dictionnaire.
L'érudit lira le tout en suivant l'ordre d’exposition, et qui ne parviendrait pas à comprendre les raisons de la disposition du livre en trouvera l’explication dans la deuxième partie. »

La découverte du personnage et de l'invention de Federico Pucci n'eut lieu qu'en 2017, grâce à Jean Marie Le Ray, blogueur et traducteur-interprète français [5].

Espérons que, tôt ou tard, une Université ou encore l’un des acteurs majeurs de la TA dans le monde puisse s’emparer des travaux et des intuitions de Federico Pucci, pour reconnaître enfin son rôle de précurseur dans l’histoire de la traduction automatique, voire pour finalement réaliser un prototype fonctionnel de sa « machine à traduire »… [Début]

3. Honneurs

Chevalier de l'Ordre de la Couronne d'Italie, 27 octobre 1936


[De nombreux honneurs reçus en France]

[Début]

4. Note 

1) L’Europa non vuol morire, Federico Pucci, Salerne, 1936
2) Pour supprimer ce crime: la guerre, Plan Henri Demont de 1908, développé et proposé aux Alliés en 1918, Henri Demont, Paris, 1938
3) Lettre au CNR du 10 juillet 1949
4) Lettre au CNR du 10 juillet
5) https://adscriptum.blogspot.com/p/federico-pucci.html

[Début]


Creative Commons License