jeudi 17 avril 2025

Intelligence artificielle, ordinateurs et traduction automatique

L'intelligence artificielle est légèrement plus âgée que moi, et nous retrouvons pour la première fois le terme anglais dans le document préparatoire à la conférence de Dartmouth :

« Nous proposons d'organiser un séminaire de deux mois sur l'intelligence artificielle, impliquant dix personnes, durant l'été 1956 au Dartmouth College de Hanover, dans le New Hampshire. Le postulat de l'étude se base sur le principe que l'on peut décrire avec un un tel niveau de précision chaque aspect de l'apprentissage ou toute autre caractéristique de l'intelligence qu'une machine pourra le simuler. Nous tenterons de trouver comment les machines pourront utiliser le langage, formuler des abstractions et des concepts, résoudre des problèmes aujourd'hui réservés aux humains et s'améliorer. »

Tous les problèmes sont déjà posés ! Or cette déclaration date du 31 août 1955 ! Soixante-dix ans plus tard, je dirais que c'est chose faite, non ? Puisque désormais les machines ont une telle capacité de s'auto-améliorer qu'elles sont à deux doigts de s'affranchir de nous...

Quant au traitement du langage, et donc des langues, il a évolué en parallèle à celui de l'IA et des ordinateurs. Dès la moitié des années 40 apparaissent les premiers calculateurs électroniques à grande échelle, le Colossus britannique (1944) et l'ENIAC américain (1945). Or ces "ordinateurs" ante litteram n'avaient aucun programme en mémoire. Ainsi, pour configurer une nouvelle tâche, il fallait modifier une partie du câblage de la machine, réacheminer les câbles à la main et régler les commutateurs. 

C'est Alan Turing qui conçut le principe de base de l'ordinateur moderne : contrôler les opérations de la machine au moyen d'un programme d'instructions codées, stockées dans la mémoire de l'ordinateur, en contribuant à la construction des premiers ordinateurs programmables au monde : les Colossus Mark 1 et Mark 2. Il fut aussi l’un des principaux acteurs du déchiffrement d’Enigma durant la seconde Guerre mondiale et, last but not least, l'un des pionniers de l'Intelligence artificielle !

*

Côté traitement des langues, après l’apparition des premiers ordinateurs, il faudra attendre 1946 et la rencontre entre Andrew Booth et Warren Weaver, directeur de la Fondation Rockfeller, et, surtout, le 4 mars 1947, avec la lettre de ce dernier à Norbert Wiener évoquant la possibilité d’utiliser les nouveaux ordinateurs pour la traduction des langues naturelles :
... Je ne sais rien d'officiel sur les nouvelles méthodes de cryptographie, puissantes et mécanisées ...  des méthodes qui fonctionnent, j'imagine, même sans connaître la langue codée –, donc, naturellement, je me demande si le problème de la traduction pourrait être traité comme un problème de cryptographie. En lisant un article en russe, je pense : « En réalité, c'est écrit en anglais mais codé avec des symboles étranges. Je n'ai plus qu'à procéder au décodage. » 
Norbert Wiener lui répond, pour le moins sceptique, le 30 avril 1947 :
Franchement, concernant le problème de la traduction mécanique, je crains que les frontières entre les mots dans les différentes langues ne soient trop floues et les connotations émotionnelles et internationales trop étendues pour qu'un projet de traduction quasi-mécanique soit prometteur. (...) À l'heure actuelle, au-delà de la conception de dispositifs de lecture photoélectrique pour les aveugles, la mécanisation du langage semble très prématurée
Warren Weaver formalisera son intuition deux ans plus tard, le 15 juillet 1949, avec la publication d’un mémorandum simplement intitulé : Translation, publié in Machine translation of languages: fourteen essays [ed. by William N. Locke and A. Donald Booth (Technology Press of the Massachusetts Institute of Technology, Cambridge, Mass., and John Wiley & Sons, Inc., New York, 1955), p.15-23], qui commence ainsi :
Inutile de souligner l'évidence, à savoir que la multiplicité des langues entrave les échanges culturels entre les peuples de la planète et constitue un sérieux obstacle à la compréhension internationale. Le présent mémorandum, en partant de la validité et de l'importance de ce fait, contient quelques commentaires et suggestions sur la possibilité de contribuer, au moins en partie, à la solution du problème mondial de la traduction grâce à l'utilisation d'ordinateurs électroniques de grande capacité, flexibilité et rapidité.
Or le 31 mai 1949 était sortie une dépêche aux États-Unis (notamment sur le New York Times et le New York Herald Tribune), qui sera reprise également en Italie, annonçant la construction par le Bureau of Standards, à l'Université de Californie (Los Angeles), de l'ordinateur SWAC (Standards Western Automatic Computer), un "cerveau électrique" capable de traduire une langue étrangère... Vingt mathématiciens et techniciens travaillent sous la direction du Dr Harry Huskey, qui a déclaré :
« Pour réussir à traduire les langues, celles-ci doivent être saisies à la machine. Le service des recherches navales a déjà débloqué une somme d'argent considérable pour construire le cerveau. » 
M. Huskey est certain du bon fonctionnement de sa merveilleuse machine, qui produira une traduction littérale, mot à mot, et il incombera ensuite à l'utilisateur d’interpréter le sens de la traduction. Le cerveau électrique sera testé au plus tard d’ici un an...

Le hasard (!?) voulut que vingt jours plus tôt, M. Federico Pucci, un salernitain, avait adressé un courrier recommandé au président américain, Haary S. Truman, dans l'espoir de recevoir un appui financier pour la construction de ses électro-traducteurs.

M. Pucci, troublé d'apprendre cette nouvelle venant des États-Unis, décida d'envoyer le 10 juillet 1949 (soit seulement 5 jours avant la publication du mémorandum de Weaver !), son premier courrier au Conseil National des Recherches italien intitulé : « Cerveau électrique nord-américain pour la traduction des langues étrangères et traducteur électromécanique italien participant à l'exposition-concours d’inventions qui se tiendra du 16 au 29 septembre 1949 à Paris », dans le seul but de revendiquer l'antériorité de son invention...

Avant l’ordinateur, il n'était question que de « traduction mécanique », voire de « machine à traduire », un distinguo qui demeure dans l’appellation anglaise de la discipline : « Machine Translation », ou MT en abrégé. Après l’ordinateur, parfois qualifié de « cerveau électrique », ou « cerveau électronique », les premiers « logiciels » de traduction automatique furent des systèmes dits « à base de règles » (RBMT, ou Rule-Based Machine Translation), dont la première démonstration de l’histoire est connue dans ses moindres détails : date, lieu, équipe, langues, déroulement, etc.

En fait, une anecdote plus qu’une véritable démonstration scientifique : nous sommes le 7 janvier 1954, à New York, au siège d’IBM, l’équipe est une collaboration entre la Georgetown University (M. Paul Garvin pour la partie linguistique) et IBM (M. Peter Sheridan pour la partie programmation), la paire de langues est le russe et l’anglais, un lexique de 250 mots choisis avec soin, quelques dizaines de phrases, 6 règles !

Le lendemain, IBM annonce dans un communiqué de presse :
En quelques secondes, l'ordinateur géant a transformé ces phrases en un anglais facilement lisible. 
Ce même communiqué mentionnait cette phrase du professeur Leon Dostert, de l'Université de Georgetown, selon lequel, en l’espace de quelques années la traduction automatique aurait pu devenir réalité :
Dans cinq ans peut-être, voire dans trois, la conversion de sens entre différentes langues par processus électronique dans d'importants domaines fonctionnels pourrait bien être un fait accompli. 
Le ton optimiste de cette déclaration eut surtout pour effet d'inciter le gouvernement américain à mettre à disposition d’importantes sommes pour la recherche. De ce point de vue, l'objectif fut atteint ! Pour autant, dans la réalité, l'expérience « Georgetown University – IBM » fut suivie d’une décennie que tous les spécialistes de l'histoire de la TA s'accordent à définir comme « la grande désillusion ».

Sans rien enlever à Federico Pucci, créateur de la première RBMT documentée de l'histoire, inventée à partir de rien, qui présenta initialement son système en public en décembre 1929, soit 20 ans avant le mémorandum de Warren Weaver sur la traduction automatique, et 25 ans avant l'anecdote IBM - Georgetown University...

Sources :
*

En clair, sur les 70 dernières années, nous avons vu de front l'essor inarrêtable et conjugué du traitement automatique des langues, de la puissance de calcul des ordinateurs et de l'explosion de l'intelligence artificielle, mais nous atteignons aujourd'hui un point de bascule. Où le binôme suprématie quantique - superintelligence artificielle reléguera la traduction automatique sur les étalages des vide-greniers de l'histoire (not a failure anymore...) !

Pour faire le point de la situation, rendez-vous en 2029 (dans 4 ans !), date du centenaire de l'invention par Federico Pucci de sa méthode de traduction automatique à base de règles...


Aucun commentaire: