lundi 21 octobre 2019

Réécrire l'histoire de la traduction automatique

La découverte de Federico Pucci bouleverse totalement l'histoire de la traduction automatique, qui doit être réécrite au XXIe siècle.

J'ai déjà fait une première tentative, qui s'est avérée être un échec total. Peu importe. Je vais essayer d'être plus précis.

Au siècle dernier, selon toutes les sources disponibles, l’histoire de la traduction automatique est relativement figée, avec une seule ligne de démarcation : l’apparition de l’ordinateur.

AVANT l'ordinateur, sur la période 1932-1935, nous avons la construction probable d’une première machine à traduire par Georges Artsrouni (1932), suivie en 1933 par le dépôt du brevet et la présentation aux autorités soviétiques de la machine de Petr Petrovič Smirnov-Trojanskij, et entre 1933 et 1935 la construction du « cerveau mécanique » de Georges Artsrouni.

En 1936, Alan Turing publie « On computable numbers »1 et imagine un modèle abstrait du fonctionnement des appareils mécaniques de calcul, tel un ordinateur, en vue de donner une définition précise au concept d’algorithme ou de « procédure mécanique », connu sous l’appellation de « machines de Turing ».

Il est l’un des principaux acteurs du déchiffrement d’Enigma durant la seconde Guerre mondiale, et ouvre la voie à l’informatique moderne en contribuant à la construction des premiers ordinateurs programmables au monde : les Colossus Mark 1 et Mark 2.

APRÈS l’apparition des premiers ordinateurs, il faudra attendre 1946 et la rencontre entre Andrew Booth et Warren Weaver, directeur de la Fondation Rockfeller, et, surtout, le 4 mars 1947, avec la lettre de ce dernier à Norbert Wiener évoquant la possibilité d’utiliser les nouveaux ordinateurs pour la traduction des langues naturelles :
... Also knowing nothing official about, but having guessed and inferred considerable about, powerful new mechanized methods in cryptography - methods which I believe succeed even when one does not know what language has been coded - one naturally wonders if the problem of translation could conceivably be treated as a problem in cryptography. When I look at an article in Russian, I say "This is really written in English, but it has been coded in some strange symbols. I will now proceed to decode. 
Norbert Wiener lui répond, pour le moins sceptique, le 30 avril 1947 :
Second—as to the problem of mechanical translation, I frankly am afraid the boundaries of words in different languages are too vague and the emotional and international connotations are too extensive to make any quasi mechanical translation scheme very hopeful. I will admit that basic English seems to indicate that we can go further than we have generally done in the mechanization of speech, but you must remember that in certain respects basic English is the reverse of mechanical and throws upon such words as get a burden which is much greater than most words carry in conventional English. At the present tune, the mechanization of language, beyond such a stage as the design of photoelectric reading opportunities for the blind, seems very premature… 
Warren Weaver formalisera son intuition deux ans plus tard, le 15 juillet 1949, avec la publication d’un mémorandum simplement intitulé : Translation, publié in Machine translation of languages: fourteen essays [ed. by William N. Locke and A. Donald Booth (Technology Press of the Massachusetts Institute of Technology, Cambridge, Mass., and John Wiley & Sons, Inc., New York, 1955), p.15-23], qui commence ainsi :
There is no need to do more than mention the obvious fact that a multiplicity of languages impedes cultural interchange between the peoples of the earth, and is a serious deterrent to international understanding. The present memorandum, assuming the validity and importance of this fact, contains some comments and suggestions bearing on the possibility of contributing at least something to the solution of the world-wide translation problem through the use of electronic computers of great capacity, flexibility, and speed.
C'est d'ailleurs après avoir eu vent d'un article publié aux États-Unis le 31 mai 1949 (notamment sur le New York Times et le New York Herald Tribune) sur le lancement de l'ordinateur SWAC (Standards Western Automatic Computer) et les déclarations de Harry Huskey rapportées par un quotidien italien (je n'ai pas encore identifié avec précision de quel Giornale il s'agit) du même jour :
Les surprenantes inventions (Los Angeles, 31/05/1949)

M. Harry Huskey, chercheur auprès de l’Institut pour les calculs analytiques, a annoncé l’invention d'un cerveau électrique capable de traduire des langues étrangères.

Sur le fonctionnement de l’appareil, initialement utilisé dans le cadre des recherches mathématiques, le scientifique a déclaré : « Pour réussir à traduire les langues, celles-ci doivent être saisies à la machine. Le service des recherches navales a déjà débloqué une somme d'argent considérable pour construire le cerveau. »

M. Huskey est certain du bon fonctionnement de sa merveilleuse machine, qui produira une traduction littérale, mot à mot, et il incombera ensuite à l'utilisateur d’interpréter le sens de la traduction.

Le cerveau électrique sera testé au plus tard d’ici un an.
que M. Pucci adresse son premier courrier au Conseil National des Recherches italien (en date du 10 juillet 49, seulement 5 jours avant la publication du mémorandum de Weaver !), intitulé : « Cerveau électrique nord-américain pour la traduction des langues étrangères et traducteur électromécanique italien participant à l'exposition-concours d’inventions qui se tiendra du 16 au 29 septembre 1949 à Paris », dans le seul but de revendiquer l'antériorité de son invention...

C'est probablement aussi pour cela qu'il fera en sorte que son annonce soit reprise sur ce même New York Times le 26 août 1949 :

On 26 August 1949, the New York Times reported (page 9) from Salerno: 
Federico Pucci announced today that he had invented a machine that could translate copy from any language into any other language. He said that the machine was electrically operated, but refused to disclose details. He said that he would enter it in the Paris International Fair of Inventions next month.  

Une annonce relayée presque un demi-siècle plus tard par John Hutchins, qui fut le point de départ de ma découverte. Mais malheureusement, comme je pense l'avoir clairement démontré, la "machine à traduire" de Federico Pucci n'a jamais vu le jour !

Cela étant, quand bien même Pucci aurait réussi à construire un prototype de son invention (dont il ne nous reste que la maquette), il serait rangé aujourd'hui sur les mêmes étagères poussiéreuses de l'histoire que les machines d'Artsrouni et de Smirnov-Trojanskij, à savoir une sympathique curiosité totalement dépassée.

En revanche, Federico Pucci nous a laissé bien plus qu'un dispositif obsolète, puisqu'il a consigné noir sur blanc le premier système documenté au monde de traduction automatique à base de règles (RBMT) dans son livre paru à Salerne en 1931 (An IX de l’ère fasciste !), dans la partie I de ce qui est vraisemblablement le premier ouvrage jamais publié sur un dispositif de « traduction mécanique » : « Le traducteur mécanique et la méthode pour correspondre entre européens, chacun en connaissant uniquement sa propre langue », dont voici la couverture :


Titre original : « Il traduttore meccanico ed il metodo per corrispondersi fra europei conoscendo Ciascuno solo la propria Lingua : Parte I. »

Cette première partie signifiant donc qu'il y en aurait eu au moins une autre à suivre, ce que l'auteur précise en italien sur la couverture : « En préparation : traduction de la langue nationale vers la langue étrangère (langue française) - Temps nécessaire pour apprendre à traduire : une minute ». Avec 68 pages descriptives, c'est non seulement le premier ouvrage, mais aussi le plus complet de la série : dix livres publiés pendant 30 ans, de 1931 à 1960, consacrés à « ses machines à traduire ».

Dans sa préface au lecteur, rédigée à Salerne le 10 décembre 1930, l'auteur entend démontrer qu'il serait possible de faire correspondre entre eux des étrangers ne connaissant respectivement que leur propre langue (Il presente lavoretto tende a dimostrare che sarebbe possibile corrispondersi fra stranieri, conoscendo ciascuno solo la propria lingua).

Donc, en 1929, M. Pucci présente à Salerno sa méthode pour la première fois, qu'il formalise l'année suivante dans un ouvrage publié début 1931. Dans sa première lettre au CNR, il évoque lui-même l'année :
Dès 1930, je me suis intéressé à la question de permettre aux gens ne connaissant que leur propre langue de traduire d'une langue à l’autre.
Or, vu l'élaboration sophistiquée d'une telle méthode (qui sera d'ailleurs primée avec une médaille d'argent dès le mois de mai 1935 par le Comité de la Foire de Paris), et avec tout le travail réalisé sur ses "tableaux symboliques", il est évident qu'il devait tenter de théoriser son invention déjà depuis la moitié des années 20, a minima, car il lui aurait été impossible d'écrire un tel ouvrage sans une longue et mûre réflexion au préalable.

Plus étonnant encore, il nous laisse un témoignage de ce que sont indubitablement les deux premiers textes au monde traduits "mécaniquement" : un extrait de la Vita Nuova de Dante traduit de l'italien au français, et un extrait du Zadig de Voltaire traduit du français à l'italien, où l'auteur nous expose très exactement - et de façon très détaillée - la méthode (de fonctionnement de sa machine telle qu'il souhaitait la concevoir) par laquelle il traduit "automatiquement" de l'italien au français, puis du français à l'italien :


En obtenant des résultats - pour un système mécanique conçu en 1930 - absolument remarquables ! À titre de comparaison, voici les traductions automatiques modernes de ce même extrait de Zadig, près de 90 ans plus tard...

Une dernière observation avant de conclure : l'approche unique de Federico Pucci anticipe aussi de près d'un siècle une autre caractéristique de ce qu'est devenue la traduction automatique aujourd'hui : sa dimension universelle, démocratique, abordable et à la portée de tous. Il n'aurait certes pas pensé à sa gratuité, quoique...

Conclusion

Que l'on observe l'histoire de la traduction automatique AVANT ou APRÈS l'apparition de l'ordinateur, dans le premier cas Monsieur Federico Pucci a précédé de quelques années les inventions de MM. Georges Artsrouni et Petr Petrovič Smirnov-Trojanskij, et dans le second d'au moins deux décennies (!) l'intuition de Warren Weaver... 

Donc indépendamment du fait que ni le passé ni le présent ne lui ont rendu justice jusqu'à maintenant, j'espère au moins que l'avenir lui apportera la reconnaissance qu'il mérite en tant que précurseur absolu de la traduction automatique, qui légua dès 1931 à la postérité le premier système connu et documenté de "traduction mécanique à base de règles".



Note : 1 ON COMPUTABLE NUMBERS, WITH AN APPLICATION TO THE ENTSCHEIDUNGSPROBLEM
By A. M. TURING.
[Received 28 May, 1936.—Read 12 November, 1936.]


dimanche 13 octobre 2019

Le décès de Brahim Bouarram

Il y a trois jours, je n'avais encore jamais entendu parler de Brahim Bouarram. Cela pourra sembler bizarre à des français qui vivent en France, mais cette affaire remonte au 1er mai 1995, et à cette date je vivais déjà en Italie depuis 13 ans.

Or je peux vous assurer que le début des années 90 a été extrêmement mouvementé en Italie, et, par ailleurs, à cette époque Internet n'en était qu'à ses premiers balbutiements, raisons pour lesquelles je n'étais pas vraiment au courant de ce qui se passait en France.

Mon attention était surtout accaparée par le tournant dramatique du début de la décennie 90 en Italie, avec les attentats mafieux à répétition, les assassinats politiques et l'arrivée de Berlusconi au pouvoir. Une période que je connais plus ou moins sous toutes ses coutures.

Du reste, c'est aussi le motif pour lequel j'ai acheté dès sa parution le livre de Fabrizio Gatti, intitulé "Educazione americana", parce qu'il promettait des révélations sur l'implication d'une équipe clandestine de la CIA opérant alors en Italie (et en Europe...) et sur la manière dont elle avait influencé des événements dont nous subissons aujourd'hui encore les conséquences.

D'où ma surprise en lisant le prologue, qui commence ainsi (je traduis) :
Brahim agite ses bras dans l'air comme des ailes. Il ne comprend pas ce qui s'est passé. La peur lui a coupé le souffle. Ses pieds recherchent un appui. Ses mains quelque chose à quoi s'accrocher. (...)
Brahim Bouarram a vingt-neuf ans. Il est né au Maroc. Deux enfants l'attendent à la maison. Or le fleuve emporte leur père au loin. Les eaux troubles comme les nues d'un orage l'ont pris en charge et, déjà, séparent sa vie de son corps...
Une chose totalement inattendue pour moi. J'avais déjà lu le prière d'insérer sans trop comprendre de qui et de quoi il s'agissait : « À Paris, ils jettent dans la Seine un jeune passant, Brahim Bouarram. »

"Ils", ce sont les agents clandestins de la CIA. En proie à la surprise la plus totale, je publie mon premier tweet :


En fait, la seule erreur de ce tweet, c'est d'avoir utilisé le verbe "orchestrer". Mais je n'avais pas encore lu les détails, et si je l'ai utilisé, c'est juste à cause de la phrase du prière d'insérer : « À Paris, ils jettent dans la Seine un jeune passant, Brahim Bouarram. »

Je dois placer ici un préambule, relatif à ma précision : « ...écrit selon la même technique que "Dernière sommation" de @davduf », à savoir qu'il se base sur des faits véridiques. J'avais été frappé par les explications de David Dufresne sur les raisons de son choix du "roman", qui lui a offert une certaine distance pour avoir une plus grande liberté de ton et d'écriture, pour utiliser les ressorts de la fiction afin d'expliquer ce qui s'est réellement passé.


* * *

De longue date Fabrizio Gatti est un journaliste d'investigation très connu en Italie, réputé pour son sérieux et pour la rigueur de ses enquêtes. Il a déjà publié deux livres en France, en 2008 Bilal sur la route des clandestins, ouvrage pour lequel il s'est infiltré plusieurs mois pour suivre les routes de l'immigration du continent africain vers l'Europe, et en 2014 Les routes de la mafia.

Dans le cas de Fabrizio Gatti, qui qualifie aussi son livre de "roman", celui-ci explique comment il a été contacté par sa "source" et quelle fut la genèse de son livre. Qui ne se base pas sur des faits connus mais sur un récit de "Simone Pace", un nom d'emprunt que je nommerai dès à présent Monsieur X pour les besoins de mon raisonnement. Un témoignage per relationem, donc, comme on dit en italien juridique, qui emprunte beaucoup au latin.

Par conséquent, la difficulté pour le journaliste tient à établir la fiabilité de Monsieur X et de sa parole, puisque rien de ce qu'il dit ne peut être documenté. Lorsque Fabrizio Gatti lui demande : « Est-ce que vous fournirez des preuves de ce que vous racontez ? », sa réponse est la suivante :
« Les preuves, c'est quelque chose que vous fabriquez. Les faits réels n'ont pas besoin de preuves. Je vous dirai juste la vérité. Dans toutes les opérations où les États-Unis sont impliqués, la CIA fait en sorte de ne laisser aucune preuve derrière elle. Et lorsqu'il y en a, elles sont éliminées. »
Je n'ai pas encore terminé le livre, j'en suis à la page 295 (sur 486), qui correspond à la fin du deuxième chapitre consacré à la mort de Brahim. Ce qui frappe dans toutes les pages précédentes, hors le cas de Brahim, c'est la précision des noms, des dates, des lieux... et la conclusion de tous les recoupements effectués par Fabrizio Gatti afin de vérifier l'exactitude des déclarations de Monsieur X : tout correspond !

Donc pourquoi douter de son témoignage sur les événements qui conduisent l'un des deux agents américains à pousser à l'eau Brahim Bouarram ? Mais laissez-moi vous résumer :
Il s'agit d'une opération orchestrée par la CIA sous contrôle des services secrets français qui avait comme cible Ali Belkacem afin de le retourner. Monsieur X était l'interlocuteur désigné pour convaincre Belkacem, y compris en l'achetant avec beaucoup d'argent. L'équipe américaine était composée de Monsieur X et de deux opérationnels, qu'il nomme Daniel et Adam, des ex-marines devant servir d'ange gardien au premier. Quant à l'équipe française, elle comprend un certain Monsieur Philippe, officier des services secrets responsable de la mission, Latifa et son père, Omar, un policier qui collabore depuis longtemps avec M. Philippe, ayant fait l'école de police ensemble. Ils hébergent l'équipe de la CIA à Bobigny.

Le lendemain Ali Belkacem se trouve en compagnie de Boualem Bensaïd, mais les consignes sont de ne contacter Belkacem que lorsqu'il sera seul. Monsieur X est surpris de constater qu'ils se trouvent en plein milieu d'une manifestation du FN, ce dont M. Philippe ne les a pas prévenus. Adam, Daniel et Latifa assis à une table, surveillent Belkacem et Bensaïd à la terrasse du café Voltaire, avant de les perdre ensuite dans la cohue, et de voir Belkacem prendre seul le pont du Carrousel. C'est là où le destin de Brahim Bouarram va basculer.

Une altercation aurait eu lieu entre Daniel, Adam et Brahim Bouarram, parce que ce dernier gênait leur passage. À un certain moment Brahim aurait donné un coup de pied dans le tibia à Daniel et se serait enfui. L'américain, fou de rage, l'aurait rattrapé et poussé à l'eau. Fin de l'histoire.
Vu sous cet angle, la première conclusion évidente est que jamais la mort de Brahim Bouarram au Pont du Carrousel ne fut voulue. Je crois même que dans l'esprit de Daniel, l'auteur du geste fatal, pas une seule seconde il n'a dû imaginer que sa "victime" ne savait pas nager. Brahim serait donc un "dommage collatéral", qui s'est juste trouvé au mauvais moment au mauvais endroit.

Ils découvriront ensuite les conséquences de leur acte lors d'un briefing dans l'appartement de Bobigny. M. Philippe reçoit un appel téléphonique l'avertissant que la police est au pont du Carrousel, qu'un jeune homme a été jeté à l'eau et que les témoins parlent de trois hommes aux crânes rasés vêtus de noir. M. Philippe annule immédiatement l'opération, en demandant à Latifa d'accompagner Monsieur X à la gare et aux deux américains de rentrer dare-dare dans leur pays, au cas où il y aurait eu des caméras ou quelqu'un aurait vu leur visage de près.

Au terme de son récit, Fabrizio Gatti demande à Monsieur X s'il ne s'est jamais préoccupé de savoir quelle fut la suite du décès de Brahim Bouarram. Réponse : "Non, j'étais juste un témoin."

Un témoin qui a décidé de ne pas témoigner, rétorque Gatti.

Réplique irritée de Monsieur X :
- « L’opération était coordonnée par un officier français. Monsieur Philippe était le plus élevé en grade. Nous nous trouvions en France, et c'était à lui de rendre son rapport aux autorités judiciaires.
- Mais un innocent a été tué.
- Je ne peux pas exclure que M. Philippe ait fait son devoir.
- Vous vous êtes revus ?
- Non, jamais.
- Et comment aurait-il son devoir ?
- Je l'ignore. Je ne pouvais pas poser de questions... »
Fabrizio Gatti lui montre alors une copie de trois coupures de journal, dont un article de Libération daté du 2 mai 1995. Extrait :
À midi tapante, sur le pont du Carrousel, trois hommes au crâne rasé se détachent de la masse des militants d'extrême droite et descendent rapidement vers les quais.
Il l'informe ensuite de la condamnation de Mickaël Fréminet, en obtenant juste une réaction sibylline :
« Un pauvre type. Je ne vois pas d'autre explication. Mais je ne critique pas pour autant la police judiciaire ou la magistrature. Tout début d'enquête est le moment le plus délicat. Une déclaration ou une information trompeuse peut porter l'enquête criminelle et le procès qui s'ensuit dans une direction ou dans l'autre. "Libération" avait toutefois la bonne info : trois hommes aux crânes rasés. »
M. Philippe a-t-il fait son devoir ? J'imagine que l'occasion était trop belle de faire porter le chapeau au FN ! Comme on dit en italien, oltre al danno, la beffa : non seulement Brahim Bouarram est mort pour rien, mais en plus, on s'est servi de son cadavre pour accuser des innocents (bien qu'il me soit très difficile d'associer les mots FN et innocents)... Je comprends toutefois pourquoi à l'époque Jean-Marie Le Pen dénonça une manipulation des médias et une provocation à l'égard de son parti !

victime du racisme...

* * *

Pour conclure, l'opération Ali Belkacem fut un échec total, puisque lui et Boualem Bensaïd seront impliqués dans les attentats parisiens moins de trois mois plus tard. Comme l'observe Monsieur X : « ...aujourd'hui encore, les français en paient les conséquences. Depuis lors, les terroristes n'ont plus cessé d'attaquer la France. »

Il oublie juste d'ajouter qu'un innocent est mort, un autre a été emprisonné pour un acte qu'il n'a pas commis, et leurs familles respectives ont été détruites par la douleur et l'incompréhension...

Ces nouveaux éléments seront-ils suffisants pour reprendre une enquête ayant probablement laissé derrière elle de nombreuses zones d'ombre ? L'avenir nous le dira...

Grazie a Fabrizio Gatti per il suo lavoro coscienzioso!