lundi 21 octobre 2019

Réécrire l'histoire de la traduction automatique

La découverte de Federico Pucci bouleverse totalement l'histoire de la traduction automatique, qui doit être réécrite au XXIe siècle.

J'ai déjà fait une première tentative, qui s'est avérée être un échec total. Peu importe. Je vais essayer d'être plus précis.

Au siècle dernier, selon toutes les sources disponibles, l’histoire de la traduction automatique est relativement figée, avec une seule ligne de démarcation : l’apparition de l’ordinateur.

AVANT l'ordinateur, sur la période 1932-1935, nous avons la construction probable d’une première machine à traduire par Georges Artsrouni (1932), suivie en 1933 par le dépôt du brevet et la présentation aux autorités soviétiques de la machine de Petr Petrovič Smirnov-Trojanskij, et entre 1933 et 1935 la construction du « cerveau mécanique » de Georges Artsrouni.

En 1936, Alan Turing publie « On computable numbers »1 et imagine un modèle abstrait du fonctionnement des appareils mécaniques de calcul, tel un ordinateur, en vue de donner une définition précise au concept d’algorithme ou de « procédure mécanique », connu sous l’appellation de « machines de Turing ».

Il est l’un des principaux acteurs du déchiffrement d’Enigma durant la seconde Guerre mondiale, et ouvre la voie à l’informatique moderne en contribuant à la construction des premiers ordinateurs programmables au monde : les Colossus Mark 1 et Mark 2.

APRÈS l’apparition des premiers ordinateurs, il faudra attendre 1946 et la rencontre entre Andrew Booth et Warren Weaver, directeur de la Fondation Rockfeller, et, surtout, le 4 mars 1947, avec la lettre de ce dernier à Norbert Wiener évoquant la possibilité d’utiliser les nouveaux ordinateurs pour la traduction des langues naturelles :
... Also knowing nothing official about, but having guessed and inferred considerable about, powerful new mechanized methods in cryptography - methods which I believe succeed even when one does not know what language has been coded - one naturally wonders if the problem of translation could conceivably be treated as a problem in cryptography. When I look at an article in Russian, I say "This is really written in English, but it has been coded in some strange symbols. I will now proceed to decode. 
Norbert Wiener lui répond, pour le moins sceptique, le 30 avril 1947 :
Second—as to the problem of mechanical translation, I frankly am afraid the boundaries of words in different languages are too vague and the emotional and international connotations are too extensive to make any quasi mechanical translation scheme very hopeful. I will admit that basic English seems to indicate that we can go further than we have generally done in the mechanization of speech, but you must remember that in certain respects basic English is the reverse of mechanical and throws upon such words as get a burden which is much greater than most words carry in conventional English. At the present tune, the mechanization of language, beyond such a stage as the design of photoelectric reading opportunities for the blind, seems very premature… 
Warren Weaver formalisera son intuition deux ans plus tard, le 15 juillet 1949, avec la publication d’un mémorandum simplement intitulé : Translation, publié in Machine translation of languages: fourteen essays [ed. by William N. Locke and A. Donald Booth (Technology Press of the Massachusetts Institute of Technology, Cambridge, Mass., and John Wiley & Sons, Inc., New York, 1955), p.15-23], qui commence ainsi :
There is no need to do more than mention the obvious fact that a multiplicity of languages impedes cultural interchange between the peoples of the earth, and is a serious deterrent to international understanding. The present memorandum, assuming the validity and importance of this fact, contains some comments and suggestions bearing on the possibility of contributing at least something to the solution of the world-wide translation problem through the use of electronic computers of great capacity, flexibility, and speed.
C'est d'ailleurs après avoir eu vent d'un article publié aux États-Unis le 31 mai 1949 (notamment sur le New York Times et le New York Herald Tribune) sur le lancement de l'ordinateur SWAC (Standards Western Automatic Computer) et les déclarations de Harry Huskey rapportées par un quotidien italien (je n'ai pas encore identifié avec précision de quel Giornale il s'agit) du même jour :
Les surprenantes inventions (Los Angeles, 31/05/1949)

M. Harry Huskey, chercheur auprès de l’Institut pour les calculs analytiques, a annoncé l’invention d'un cerveau électrique capable de traduire des langues étrangères.

Sur le fonctionnement de l’appareil, initialement utilisé dans le cadre des recherches mathématiques, le scientifique a déclaré : « Pour réussir à traduire les langues, celles-ci doivent être saisies à la machine. Le service des recherches navales a déjà débloqué une somme d'argent considérable pour construire le cerveau. »

M. Huskey est certain du bon fonctionnement de sa merveilleuse machine, qui produira une traduction littérale, mot à mot, et il incombera ensuite à l'utilisateur d’interpréter le sens de la traduction.

Le cerveau électrique sera testé au plus tard d’ici un an.
que M. Pucci adresse son premier courrier au Conseil National des Recherches italien (en date du 10 juillet 49, seulement 5 jours avant la publication du mémorandum de Weaver !), intitulé : « Cerveau électrique nord-américain pour la traduction des langues étrangères et traducteur électromécanique italien participant à l'exposition-concours d’inventions qui se tiendra du 16 au 29 septembre 1949 à Paris », dans le seul but de revendiquer l'antériorité de son invention...

C'est probablement aussi pour cela qu'il fera en sorte que son annonce soit reprise sur ce même New York Times le 26 août 1949 :

On 26 August 1949, the New York Times reported (page 9) from Salerno: 
Federico Pucci announced today that he had invented a machine that could translate copy from any language into any other language. He said that the machine was electrically operated, but refused to disclose details. He said that he would enter it in the Paris International Fair of Inventions next month.  

Une annonce relayée presque un demi-siècle plus tard par John Hutchins, qui fut le point de départ de ma découverte. Mais malheureusement, comme je pense l'avoir clairement démontré, la "machine à traduire" de Federico Pucci n'a jamais vu le jour !

Cela étant, quand bien même Pucci aurait réussi à construire un prototype de son invention (dont il ne nous reste que la maquette), il serait rangé aujourd'hui sur les mêmes étagères poussiéreuses de l'histoire que les machines d'Artsrouni et de Smirnov-Trojanskij, à savoir une sympathique curiosité totalement dépassée.

En revanche, Federico Pucci nous a laissé bien plus qu'un dispositif obsolète, puisqu'il a consigné noir sur blanc le premier système documenté au monde de traduction automatique à base de règles (RBMT) dans son livre paru à Salerne en 1931 (An IX de l’ère fasciste !), dans la partie I de ce qui est vraisemblablement le premier ouvrage jamais publié sur un dispositif de « traduction mécanique » : « Le traducteur mécanique et la méthode pour correspondre entre européens, chacun en connaissant uniquement sa propre langue », dont voici la couverture :


Titre original : « Il traduttore meccanico ed il metodo per corrispondersi fra europei conoscendo Ciascuno solo la propria Lingua : Parte I. »

Cette première partie signifiant donc qu'il y en aurait eu au moins une autre à suivre, ce que l'auteur précise en italien sur la couverture : « En préparation : traduction de la langue nationale vers la langue étrangère (langue française) - Temps nécessaire pour apprendre à traduire : une minute ». Avec 68 pages descriptives, c'est non seulement le premier ouvrage, mais aussi le plus complet de la série : dix livres publiés pendant 30 ans, de 1931 à 1960, consacrés à « ses machines à traduire ».

Dans sa préface au lecteur, rédigée à Salerne le 10 décembre 1930, l'auteur entend démontrer qu'il serait possible de faire correspondre entre eux des étrangers ne connaissant respectivement que leur propre langue (Il presente lavoretto tende a dimostrare che sarebbe possibile corrispondersi fra stranieri, conoscendo ciascuno solo la propria lingua).

Donc, en 1929, M. Pucci présente à Salerno sa méthode pour la première fois, qu'il formalise l'année suivante dans un ouvrage publié début 1931. Dans sa première lettre au CNR, il évoque lui-même l'année :
Dès 1930, je me suis intéressé à la question de permettre aux gens ne connaissant que leur propre langue de traduire d'une langue à l’autre.
Or, vu l'élaboration sophistiquée d'une telle méthode (qui sera d'ailleurs primée avec une médaille d'argent dès le mois de mai 1935 par le Comité de la Foire de Paris), et avec tout le travail réalisé sur ses "tableaux symboliques", il est évident qu'il devait tenter de théoriser son invention déjà depuis la moitié des années 20, a minima, car il lui aurait été impossible d'écrire un tel ouvrage sans une longue et mûre réflexion au préalable.

Plus étonnant encore, il nous laisse un témoignage de ce que sont indubitablement les deux premiers textes au monde traduits "mécaniquement" : un extrait de la Vita Nuova de Dante traduit de l'italien au français, et un extrait du Zadig de Voltaire traduit du français à l'italien, où l'auteur nous expose très exactement - et de façon très détaillée - la méthode (de fonctionnement de sa machine telle qu'il souhaitait la concevoir) par laquelle il traduit "automatiquement" de l'italien au français, puis du français à l'italien :


En obtenant des résultats - pour un système mécanique conçu en 1930 - absolument remarquables ! À titre de comparaison, voici les traductions automatiques modernes de ce même extrait de Zadig, près de 90 ans plus tard...

Une dernière observation avant de conclure : l'approche unique de Federico Pucci anticipe aussi de près d'un siècle une autre caractéristique de ce qu'est devenue la traduction automatique aujourd'hui : sa dimension universelle, démocratique, abordable et à la portée de tous. Il n'aurait certes pas pensé à sa gratuité, quoique...

Conclusion

Que l'on observe l'histoire de la traduction automatique AVANT ou APRÈS l'apparition de l'ordinateur, dans le premier cas Monsieur Federico Pucci a précédé de quelques années les inventions de MM. Georges Artsrouni et Petr Petrovič Smirnov-Trojanskij, et dans le second d'au moins deux décennies (!) l'intuition de Warren Weaver... 

Donc indépendamment du fait que ni le passé ni le présent ne lui ont rendu justice jusqu'à maintenant, j'espère au moins que l'avenir lui apportera la reconnaissance qu'il mérite en tant que précurseur absolu de la traduction automatique, qui légua dès 1931 à la postérité le premier système connu et documenté de "traduction mécanique à base de règles".



Note : 1 ON COMPUTABLE NUMBERS, WITH AN APPLICATION TO THE ENTSCHEIDUNGSPROBLEM
By A. M. TURING.
[Received 28 May, 1936.—Read 12 November, 1936.]


Aucun commentaire: