dimanche 30 mars 2025

L'obsolescence du contenu

Billet fleuve...

Sommaire

Introduction

Voici 20 ans que j'exerce en tant que blogueur : plus de mille (1000 !) billets globalement rédigés sur mes blogs (dont 850 sur Adscriptor) ou via d'autres vecteurs (une quarantaine sur Presse-Citron, dans une collaboration annoncée, 77 sur Translation 2.0, 7 sur l'Observatoire des médias, etc.), quelques articles, billets invités et autres mentions, plus de 3 millions de vues... Il fut même un temps où ce blog avait un PR 5, pour les spécialistes ;-)

Cela représente un contenu énorme, autour de 900 000 mots, si je me base sur une moyenne déjà analysée en 2009 (ce seul billet est 5 fois plus long que la moyenne en question). Certes, à l'époque, j'étais à 16 billets par mois, soit un tous les deux jours, alors que sur les dix dernières années, je tourne plutôt à 5... par an ! Pour autant, la longueur des billets n'a pas notablement varié.

Bon, il est clair que nombre d'entre eux ne sont plus au goût du jour, de même que nombre de liens ne fonctionnent plus, il n'empêche, beaucoup de billets importants restent significatifs, et il est fort dommage qu'ils soient tombés en désuétude.

La tâche est ardue, mais je me propose de rafraîchir ceux qui le méritent, selon moi, et il y en a ! 

Par rapport au bandeau du blog, bien qu'ayant évolué, les grands thèmes abordés n'ont pas changé au fil du temps, entre autres : Internet, ses acteurs, les noms de domaine, les noms tout court, l'Italie, l'écriture, le français, la traduction (dont Federico Pucci), parfois la poésie, le marketing, plus quelques digressions fruits de la sérendipité...

L'un des exemples les plus éclatants de cette sérendipité est la fameuse histoire des centaines de milliards de dollars ! Née par le plus grand des hasards le lundi 8 juin 2009, après avoir découvert une dépêche, confirmée par un communiqué officiel des douanes italiennes daté du 4 juin :


Il s'agissait de deux japonais, nommés Akihiko Yamaguchi et Mitsuyoshi Wanatabe, arrêtés au poste frontière de Chiasso en possession de titres probablement contrefaits, d'une valeur de ... 134,5 milliards de dollars. J'avais alors traduis cet extrait du communiqué :

Âgés d'une cinquantaine d'années, [ils] ont affirmé aux douaniers n'avoir rien à déclarer à leur descente du train en provenance d'Italie. Or un contrôle minutieux de leurs bagages a permis de trouver, cachés dans le double-fond d'une valise contenant leurs effets personnels, 249 « bonds de la Federal Reserve » d'une valeur nominale de 500 millions USD l'un, et 10 « bonds Kennedy » d'une valeur nominale de 1 milliard USD l'un, outre une importante documentation bancaire ORIGINALE...

J'ai rédigé au total 28 billets sur cette affaire, mais pour n'en citer qu'un, ce serait celui-là : 134 milliards de dollars - l'opération Lys d'Or et le Traité de Versailles !

Or à ma connaissance cette histoire avait été précédée deux mois plus tôt (6 avril 2009) par une autre saisie gigantesque, toujours à Ponte Chiasso, de 4 obligations japonaises d’une valeur de 500 milliards de yens  chacune, soit un total de deux mille milliards de yens japonais, environ 15 milliards d'euros...

Autre communiqué des douanes italiennes :


Tout comme elle avait été suivie en 2012 par une autre saisie de 6000 milliards de dollars, effectuée par la direction départementale anti-mafia de Potenza, une info reprise un peu partout dans le monde, en Italie bien sûr, connue sous le nom d'opération Vulcanica, mais aussi en France ou en Amérique (un chiffre à rapprocher aujourd'hui de l'enveloppe sur laquelle Elon Musk a la mainmise)...


Je me suis toujours demandé quel pouvait être le but de ces trafics, il me semble que ce billet fournit une bonne explication (en anglais). 

Je vous passe moult rebondissements de ces histoires, mais le hasard, toujours lui, a voulu que Benjamin Fulford, complotiste s'il en est, publie 13 ans plus tard un billet où il reparle de cette affaire, tout juste huit jours après le décès de Neil Keenan (impliqué lui aussi, avec qui j'avais échangé plusieurs fois en écrivant ma "saga"), le 24 mars dernier, jour de mon anniversaire !

Après ça, comment pourrais-je prétendre que le hasard ne fait pas bien les choses ? [Début]

*

Mais revenons-en aux grands thèmes abordés et recherchons les billets dignes d'être lus encore aujourd'hui pour chacun d'entre eux :

  1. Internet
  2. ses acteurs
  3.         le référencement (ancêtre du SEO)
  4. les noms de domaine
  5. les noms tout court
  6.         le travail
  7.         le marketing & le branding
  8.         la sémantique
  9.         la politique
  10. l'Italie
  11.         la poésie (et la musique)
  12. la traduction
  13.         le français et l'écriture
  14. Federico Pucci

*

1. Internet

Cela fait trente ans cette année que je navigue sur Internet : j'ai commencé en 1995 ! À l'époque j'avais un très beau bureau dans le centre de Rome, juste en face de l'Académie des Beaux-Arts, Via di Ripetta (l'une des rues du Trident avec Via del Corso et Via del Babuino). Et, vu mon métier, j'étais obsédé par les glossaires, toujours en quête de trouver une bonne ressource dans tel ou tel domaine et, surtout, dans mes trois langues de travail : l'anglais, l'italien et le français. Une fois installé Internet, ma première recherche fut "glossary", pour obtenir, en moins d'une seconde, 300 000 (trois cent mille !) résultats. C'était tellement énorme que j'ai dû me déconnecter pour réfléchir...

En tout cas, dans mon esprit il était tout à fait clair qu'Internet changeait la donne, et qu'il y aurait eu un avant et un après, ce qui n'est plus à démontrer. En parallèle à l'usage "professionnel", cela révolutionnait également l'usage "personnel", en donnant à chacun(e) la possibilité de s'exprimer comme jamais auparavant (or les réseaux sociaux n'existaient pas encore, ils n'étaient qu'en vue...). Même Google n'existait pas, juste Yahoo ! Et Microsoft était hors-jeu (les choses ont bien changé avec l'arrivée de Satya Nadella en février 2014)...

Toutefois il m'a fallu 10 ans pour que je commence à bloguer ! Le 6 février 2005, très exactement, sur Typepad, et mon premier blog s'appelait Site Log (le journal de mon site), j'y ai publié 15 billets avant de les intégrer dans Blogger...


Mes premières interventions étaient des traductions de spécialistes anglo-saxons du Web et du marketing : Bloguer, commenter : rédiger, impacter, captiver !, Marketing : manifeste de marque, Importance d'une stratégie de liens, ou encore Les travailleurs de la connaissance, par exemple...

Quand on commence, on se cherche, on se demande pourquoi bloguer ?, on tâtonne, jusqu'à ce qu'une ligne éditoriale plus personnelle se fasse jour, petit à petit, au fil des mois. Cela étant, je n'ai jamais cessé de m'interroger sur le sens de ma présence sur le Web : 

Les trois composantes de notre présence sur Internet : le sens, le contenant, le contenu

bien avant que le contenu ne se professionnalise, et d'analyser le Web sous toutes ses coutures, en m'intéressant tout particulièrement à ses principaux acteurs, GYM à l'époque (Google, Yahoo, Microsoft), plus un petit nouveau...

Dans ce cadre, l'Internet des objets occupe une place à part. [Début]

*

2. Les acteurs du Web

Sur 850 billets, j'en ai consacré au moins 350 (soit 41% du blog) à Google (plus de 130 billets), Microsoft, Yahoo (environ 80 billets chacun) et Facebook. À l'époque, au-delà du binôme Google-Traduction (automatique), j'ai décortiqué le fonctionnement de Google, avec quelques billets mémorables (mars 2006), dont les intemporels de Google (en guise de postface au Monde selon Google), analysé dans le détail la tentative avortée de Microsoft d'acheter Yahoo, l'absence de mission (en anglais) et de vision (en anglais) de Yahoo, pour en arriver à parler du dernier arrivé avec l'ambition de jouer dans la cour des grands : Facebook.

J'ai écrit une cinquantaine de billets sur Facebook, dont les deux principaux (Facebook et Facebook annonce Facebook Ads) ont été lus/vus plus de 210 000 fois ! Au point que mon blog était positionné en première page de résultats de Google sur la requête "Facebook"... 

Tous ces acteurs s'affrontant sans cesse dans une logique de bloc contre bloc, l'internaute au centre...

Avec pour objectif la conquête incessante de l'attention (ils en savent toujours plus sur nous), la présentation des résultats et le profilage pour une publicité toujours plus individualisée, invasive. Avec son corollaire : la monétisation. L'arrivée des portables n'a fait qu'empirer les choses. [Début]

*

3. Le référencement (ancêtre du SEO)

Dans le sillage de mes 7 conseils pour se positionner dans la première page de résultats de Google sur une requête donnée, il faut bien comprendre les deux faces de la médaille du positionnement : le contenant, et le contenu !

Le contenant, SERP pour les intimes, c'est l'habillage qui présente les résultats. Il dépend moins de vous que des moteurs de recherche et de leurs index, tandis que le contenu dépend essentiellement de vous, puisque c'est vous qui allez le créer, en apprenant à l'optimiser (ce que j'ai écrit pour les blogs vaut également pour tout autre type de vecteur, simple page Web, site complet, etc.) et à ne pas le dupliquer.

Les requêtes sur Internet se comptent en centaines de milliards par an (déjà en 2010...), avec entre 4 et 5 mots pour une prépondérance d'entres elles, donc apparaître dans les résultats organiques (je ne parle pas des stratégies d'achat de mots clés) d'une de ces requêtes pourrait sembler une gageure ! Quant à monétiser son contenu, y compris sur les réseaux sociaux, c'est encore plus compliqué.

Sans oublier la longue traîne et différentes stratégies de niche... Cela étant, les noms de domaine peuvent jouer aussi un rôle clé dans le référencement naturel. [Début]

*

4. Les noms de domaine

Il fut un temps où la rareté des extensions (les principales étant alors .com, .net et .org, dont je suivais l'évolution via le baromètre Verisign) conférait davantage de valeur aux noms de domaine. Et puis en 2009 l'ICANN a totalement changé la donne avec de nouvelles extensions (une opportunité pour les marques, pour Google certainement, mais pas toutes !), ce qui a provoqué un choc avec le gouvernement américain (qui tient absolument à conserver sa mainmise sur la gouvernance d'Internet), bouleversé le second marché, les spéculations juteuses et la longue traîne des noms de domaine, le parking, les IDN (c'est quoi, les IDN ?), etc.

Désormais, tout cela est loin derrière, mais les nombreux billets que j'ai écrits sur le sujet ont eu une conséquence plutôt inattendue ! Un jour, précisément le dimanche 4 novembre 2007 à 15h57', je reçois un courriel de trois lignes de quelqu'un qui demande à me rencontrer : « J'ai lu avec un très grand intérêt vos billets sur les noms de domaine et je souhaiterais avoir votre avis sur la curieuse situation qui est la mienne. Je vous remercie par avance. »

La distance Rome - Paris n'y fera rien, près de 2000 courriels d'échange suivront le premier, ce sera le début d'une amitié qui durera plus de 10 ans, jusqu'au départ prématuré de Jean-Philippe, et qui m'embarquera dans l'une des aventures professionnelles - et humaines - les plus étonnantes de ma vie, à savoir ma collaboration avec Quensis, société qui fut même citée dans le Wall Street Journal...

Pendant 20 ans Jean-Philippe et son ami Guy ont développé un puissant logiciel de création de noms de marque, le logiciel IDeeL, unique au monde et totalement génial ! Plus tard Jean-Philippe me demandera d'en écrire le manuel de l'opérateur, ce qui fut fait : 77 pages descriptives. [Début]

*

5. Les noms tout court

C'est ainsi que je passe des noms de domaine aux noms de marque, que je commence à m'intéresser à leur création (Kering, Meta) et, découverte fondamentale pour moi, au distributionnalisme ! En écrivant des poèmes depuis 50 ans, il est clair que je faisais déjà du distributionnalisme sans le savoir...

En bref, ça se résume à dire les mêmes choses avec d'autres mots. Ce que font toutes les langues : elles décrivent des situations identiques en employant des termes différents, des tournures différentes, des formes de sagesse ... idiomatiques (les proverbes, par exemple) et, pour en pénétrer les secrets, la simple compréhension des mots ne suffit plus, il faut aller plus loin dans la culture, approfondir les relations entre les personnes, et ainsi de suite.

La traduction le démontre : le mot à mot fausse le sens, il n'est d'aucune utilité (en plus d'être ridicule)...

En négatif, c'est ce que font aussi les politiques et les "communicants", ils remplacent constamment les mots pour en détourner le sens, pour confondre leurs publics, ils désinforment sciemment, voire scientifiquement, ils déguisent la tromperie en sincérité, la manipulation en sympathie, la propagande en vérité, ni le mensonge ni la responsabilité de leurs actes et de leurs déclarations n'ont plus aucune prise sur eux, etc. Il y a aujourd'hui une énorme asymétrie de crédibilité dans l'information.

Mais je m'égare... Les noms ! Les mots. On n'écrit plus pour le Web comme on écrivait pour le papier. Les temps changent ! L'antique palimpseste est devenu un moderne palimptexte, nous sommes passés de Welcome in the World Century à Welcome to the Word Century, puis de l'hypertexte au palimptexte et au palimptexte terminologique, l'homme est un animal social (de même que l'est le traducteur), ses mots, ses discours, son langage, ses codes et ses modes de communication (multilingue) (en anglais) évoluent sans cesse, l'information est liquide !

Le problème est que tout va très vite mais que nous sommes lents. Ça me fait d'ailleurs beaucoup penser à Paul Virilio et à sa tyrannie de la vitesse...

Ce qui s'applique aussi au travail ! [Début]

*

6. Le travail

Dans un récent billet, je me demande si traducteur-interprète, toujours plus soumis à la concurrence de la traduction/interprétation automatique conjuguée à l'IA, est un métier d'avenir ? Ma réponse est : - « J'en doute ! »

La question d'exister professionnellement sur Internet devient désormais celle d'exister professionnellement tout court... Beaucoup de professionnels en sont au « nouveau maintenant » de leur métier :

Le travail a été continuellement déconstruit et reconstruit à travers les siècles : sa durée, sa productivité, sa rémunération ou sa localisation ont été sans cesse repensées, transformant en conséquence les métiers et les compétences. La mondialisation des échanges et le développement des technologies numériques ont achevé de bouleverser le temps, l’espace et les modalités du travail qui, du salarié à l’auto-entrepreneur, a désormais mille visages.

Le travail en solo se généralise de plus en plus, mais est-ce une progression ? ou une régression ? S'adapter coûte que coûte, télétravail, créer son propre emploi, certes, mais après ? Qualité de la vie ? Individuelle, sociale, professionnelle, familiale ? Recréer son identité, sa réputation ? Aujourd'hui, le cœur du réseau, c'est vous, qu'ils disaient ! L'Internet of Me ! Branding & Marketing sont les deux mamelles de la modernité... [Début]

*

7. Le marketing et le branding

Je réfléchis depuis des années au binôme Branding & Marketing. Ou Marketing & Branding, comme vous préférez, le but étant le même : se faire connaître. Mais aussi savoir ce que l'on dit de soi.

J'ai fait plusieurs formations et organisé des présentations.

Ma conclusion :

Branding & Marketing sont les deux faces de la même médaille : vous !

Autrefois la médaille était une pièce de métal frappée en l’honneur d’une personne illustre, ou en souvenir d’un fait remarquable, voire le signe distinctif d’un prix, d’une récompense honorifique, ou encore, à Paris, une plaque de métal portée par ceux qui exerçaient certaines professions dans, les rues : médaille de porteur aux Halles, médaille de commissionnaire.

Aujourd’hui, la personne illustre, c’est vous, le fait remarquable, c’est votre carrière, la médaille du traducteur et de l’interprète, c’est votre prix et votre récompense, celle que vous porterez partout avec honneur pour raconter à toutes et à tous la beauté et l’amour de votre métier, sur lequel vous remettrez votre ouvrage, non pas vingt fois, mais cent, mille, autant que de besoin. Polissez-la sans cesse, et la repolissez, aurait dit Boileau : avec patience et longueur de temps, il vous incombe de la forger !


Changez traducteur-interprète par votre métier, et le tour est joué... Juste une question de sémantique :-) [Début]

*

8. La sémantique

Définir le Web n'a jamais été simple, a fortiori le Web sémantique ! Perso, ce qui m'intéresse davantage, c'est la sémantique. Non pas la sémantique formelle des langages de programmation, mais l'étude du sens, de la signification des signes, à travers les langues. Surtout l'étude du sens. Notamment à travers la statistique et la fréquence des mots. 

C'est ainsi que j'ai créé de nombreux "nuages sémantiques" au hasard de mes envies et de mes humeurs. Mon préféré est sans aucun doute celui sur Les Misérables. Et découvrir que le nuage d'un de mes recueils de poèmes et celui de Hugo étaient semblables à 43% !!!

J'ai également utilisé ces nuages pour Adscriptor ou la politique (Sarkozy, Obama, ici et , Macron...). [Début]

*

9. La politique

Je n'avais aucune envie de parler politique sur ce blog. Mais lorsque la politique devient injustice, criante, alors c'est plus fort que moi, il faut que je parle. Et lorsque je m'exprime sur ce sujet, malheureusement, ce n'est presque jamais en positif.

Dans dix questions à Emmanuel Macron, j'apostrophais le gamin (j'aurais bien aimé - et je voudrais encore - le défier sur un plateau télé) sur les violences policières que lui et ses bras cassés faisaient subir gratuitement et cruellement aux françaises et aux français, en abusant impunément du droit et des mensonges d'état. Et des mensonges d'état au terrorisme d'état, il n'y a qu'un pas, vite franchi !

Dans l'une de ses déclarations, encore plus nulle que les autres, il nous dit le 7 mars 2019 : « Ne parlez pas de répression ou de violences policières, ces mots sont inacceptables dans un État de droit. »

Cette phrase est incroyable ! Il n'y a pas eu un seul journaliste pour lui répondre que puisque ses "forces de l'ordre" se rendaient allègrement (je les vois encore défiler en rigolant et en se foutant de la gueule de celles et ceux qu'ils avaient éborgnés et mutilés à vie) coupables de répression et de violences policières, alors cela signifiait que la France n'était plus un État de droit. CQFD ! 

Pauvre Macron ! Bien qu'il ait autant d'empathie qu'une porte de prison, je ne pense pourtant pas qu'il soit aussi malfaisant et délétère que ne l'a été Berlusconi... [Début]

*

10. L'Italie

Je ne peux pas reprendre ici la centaine de billets écrits en français sur l'Italie, pour celles et ceux qui souhaiteraient approfondir je vous renvoie au site Bungalandia dans lequel j'en ai rassemblé une bonne partie...

Pas plus que je ne peux résumer plus de 200 billets écrits sur mon blog italien, entre 2008 et 2018 (plus de 200 000 pages vues...), année où je l'ai retiré du Web. 

Intitulé "Journal d'un étranger", dans mon premier billet, daté du 16 octobre 2008, je disais ceci :

Je n'ai pas la moindre idée d'où cela va me mener, mais vu les choses qui se produisent actuellement en Italie et que nous subissons, avec des millions d'italiens, je ne peux plus éviter d'avoir mon mot à dire. Cela pourrait toujours s'avérer utile... Et si cela ne sert pas aux autres, à moi ça me servira. Ainsi qu'à mon fils, trop jeune pour parler (il fêtera ses 7 ans le mois prochain), car vu toutes les saloperies qui se passent aujourd'hui dans ce pays, il est évident qu'il en paiera les conséquences lorsqu'il sera grand, si personne ne s'oppose aux oppressions quotidiennes de celles et ceux qui nous gouvernent. Mal, et en ne pensant qu'à leur propres affaires. En clair, je crois que l'arrivée de Berlusconi en politique - en 1994 - marque la fin de la démocratie. Non pas d'une certaine idée de la démocratie, mais de la démocratie tout court. Et pas seulement en Italie.

Je l'ai supprimé par désespoir, de voir les années passer sans que rien ne change, sinon que les choses empiraient, lentement mais sûrement. Par contre j'ai continué de bloguer en français sur le cloaque italien, en tentant d'expliquer à mes compatriotes ce qui se passait dans ce pays et, si possible, en tirer les enseignements pour éviter d'en faire autant. C'est bien raté...

Il y a donc quelques billets que j'aimerais vous signaler en particulier, notamment sur les relations étroites entre mafia et politique, encore et toujours ! Du reste l'actuel gouvernement Meloni est en train de réaliser à la lettre le "plan de renaissance démocratique" prévu par Licio Gelli, au-delà des espérances du maître lui-même. Comme disait Giovanni Falcone, « on se rendra compte que la mafia a pénétré les institutions lorsque celles-ci attaqueront la justice », difficile d'être plus explicite.

Or nous y sommes en plein. Pourtant, de nombreuses voix se sont élevées contre la corruption, mais sans vouloir être pessimiste, le combat me semble un peu perdu. Il y a surtout un aspect que la politique ignore complètement, c'est l'aspect environnemental. Voici une galerie des horreurs :

Et allez savoir depuis : 15 ans ont passé sans jamais aucun jugement, aucune enquête approfondie, et qui s'approche trop près de la vérité meurt, Ilaria Alpi et Miran Hrovatin, Natale De Grazia...

Tout cela est déprimant, le moment est venu de changer de sujet. [Début]

*

11. La poésie (et la musique)

La poésie est mon jardin secret depuis mon adolescence, je m'y réfugie dans les moments de doute, de solitude, pour y retrouver le sens et la valeur des mots, pour retrouver la paix, en moi et chez les autres, quand c'est possible.  

Dès 2006, dans Adscriptor, c'est quoi ?, j'annonçais déjà vouloir développer la poésie comme centre d'intérêt. En fait, je voulais le faire sur un site dédié, je n'ai jamais eu le temps. J'ai dû attendre novembre 2024 pour publier mon premier recueil à compte d'auteur, intitulé 70 nuances de sonnet... 

L'une des très rares personne qui m'a lu (je ne le cite pas par respect), a réagi ainsi:

Je viens de parcourir ton livre de poésie, et wow ! C’est à la fois puissant, drôle et léger, avec un style qui me parle bien...

Or tout a commencé par une dédicace sur une plaque de marbre blanc (une plaque à la fois silencieuse et pleine de musique), et fini par la publication de mes palimptextes poétiques...

La musique étant l'un de mes autres refuges, surtout le blues, les poèmes musicaux gravés dans ma mémoire, et la découverte de l'histoire de Roger Waters, dont la dépouille du père a été identifiée après des décennies à quelques kilomètres de chez moi !


Ici avec mon fils.

Quant à traduire la poésie, cela signifie re-créer (billet en italien) l'original avec des mots étrangers, selon sa propre sensibilité et le génie de sa langue... [Début]

*

12. La traduction

Un exemple parfait est celui de Gianni Rizzoni, qui a su re-créer, non pas des mots, mais une langue : celle de San-Antonio ! Et traduire San-Antonio, croyez-moi, c'est pas du gâteau. C'est maousse costo...

Autre exemple : Le petit Prince !

Victor Hugo disait des traducteurs qu'ils « ont une fonction de civilisation. Ils sont des ponts entre les peuples. Ils transvasent l’esprit humain de l’un chez l’autre. Ils servent au passage des idées. C’est par eux que le génie d’une nation fait visite au génie d’une autre nation. Confrontations fécondantes. Les croisements ne sont pas moins nécessaires pour la pensée que pour le sang. »

Ce sont des ponts dans la voie lactée. Leur tâche gigantesque les honore. Exactement comme les poètes :-)

Sans revenir sur l'aspect "traduction professionnelle", récemment traité ici, et , tous utilisent les mots dans un esprit de fidélité au message, que le message vienne d'autrui ou de soi-même. Or cette fidélité exige une parfaite maîtrise de sa langue et de l'écriture. [Début]

*

13. Le français et l'écriture

Bien plus que la France, le français est ma patrie. Comprenne qui pourra...

J'ai un rapport charnel à la langue, profond. Quant à l'écriture, tantôt caresse tantôt rhétorique, elle peut donner lieu à des batailles épiques. Comme celle qui m'a opposé à Maître Eolas autour de l'affaire Olivier Martinez. Plus d'une centaine de commentaires, ce sont les billets les plus commentés de l'histoire de mon blog :

Conclusion, 3 ans plus tard : Eolas, désolé, mais le juge avait tort, et vous aussi par la même occasion. Ça arrive parfois, même aux meilleurs. [Début]

*

Sur les 29 billets consacrés à Federico Pucci (19 en français, 6 en italien et 4 en anglais), je n'en citerai qu'un : Federico Pucci censuré par Wikipedia.it, si vous souhaitez vous faire une opinion, il devrait suffire... [Début]

*

Voilà. J'ai commencé par une note de sérendipité, je conclurai de même, avec d'autres billets, inclassables mais tout aussi importants :

Etc. etc. etc. 

Il y eut un temps où je fus tenté d'arrêter de bloguer : trop chronophage, trop d'espace pris sur ma vie professionnelle et familiale. Cela dit, en voyant tout ce que le blogging m'a apporté (participation au Web 2008, grâce à Eric Dupin), rencontre avec Jean-Philippe et d'autres, découverte de Federico Pucci, etc., j'estime que la richesse de cette aventure fera toujours pencher la balance du côté positif... [Début]

*  

Je terminerai cette longue (mais indispensable, quoique partielle) récapitulation de 20 ans de blogging par les 10 billets ayant été lus/vus plus de 10 000 fois (données actualisées à la date de publication d'Obsolescence du contenu) :

Nom du billet (date) Nombre de vues
Facebook (8/10/2007) 122 103
Facebook annonce Facebook Ads (6/11/2007) 89 642
Halloween : Trick or Treat (31/10/2008) 19 852
Bunga Bunga (29/10/2010) 17 496
Bilan 2009 de l'entreprise MAFIA SA (28/01/2010) 16 965
Le Château Trompette à Bordeaux (9/09/2010) 15 122
Lettre ouverte à Michel-Édouard Leclerc (6/02/2007) 12 812
Qu'est-ce que la mafia ? (20/12/2010) 12 358
GYM : une analyse (10/05/2007) 12 020
134 milliards de dollars - L'opération Lys d'Or et le Traité de Versailles ! (2/10/2010) 10 452

BONNE LECTURE ! [Début]


jeudi 20 mars 2025

Google et la traduction automatique : 20 ans de progrès

Dès avril 2006, j'ai été l'un des premiers à m'intéresser au cheminement impressionnant de Google dans la traduction automatique.

Le mois précédent, une présentation aux analystes financiers d'Eric Schmidt, alors CEO de Google, avait fuité et dévoilait la "stratégie définitive de Google" (voir également la stratégie de portail de Google), notamment en matière de mondialisation et de grands problèmes :

Chez Google, nous avons conscience de n’être qu’au début du chemin vers la réalisation de notre mission, qui consiste « à organiser l'information mondiale et faire en sorte qu’elle soit universellement accessible et utilisable »...

Nous consacrons actuellement plus de 500 millions de $ en investissements corporels et incorporels (hors investissements financiers), et nous innovons dans des produits tels que la traduction automatique pour que les projets susmentionnés puissent se réaliser.

Or il est clair que si vous voulez rendre l'information mondiale universellement accessible et utilisable, vous devez d'abord résoudre l'énorme problème causé par la barrière des langues !

Nous savons maintenant que le précurseur absolu de la traduction automatique (TA pour les intimes, ou MT en anglais), Federico Pucci, avait présenté sa propre méthode à traduire les langues sans les connaître 77 ans plus tôt, et publié dès 1931 « Le traducteur mécanique et la méthode pour correspondre entre européens, chacun en connaissant uniquement sa propre langue », premier texte documenté au monde sur une traduction automatique (mécanique à l'époque) à base de règles, ou RBMT (Rule-Based Machine Translation), 25 ans avant l'expérience d'IBM et de l'université de Georgetown, un système de TA qui dominera le marché pendant plus d'une cinquantaine d'années.

D'ailleurs, à ses débuts dans la TA (que l'on peut classer de bon droit dans les intemporels de la société), Google utilisait Systran (RBMT), avant de basculer sur son propre système, basé sur la statistique (approche où les traductions sont générées sur la base de modèles statistiques, dérivés de l'analyse de corpus de textes bilingues), la statistical machine translation déjà à l'essai depuis... avril 2006, et adoptée en octobre 2007 !

Google a pu passer de RBMT à l'hybride (RBMT + statistique) puis à l'approche statistique pure, en s'appuyant sur les masses gigantesques de données indexées grâce à son moteur de recherche. Juste pour illustrer mon propos :

Selon E. Schmidt, en 2006 Google indexait moins de 5 % de toute l'information potentiellement disponible sur l'Internet. Donc, en faisant un simple calcul, si les 9 390 000 000 de documents indexés (voir le nombre de résultats qui s'affiche en tapant "the" dans le champ de recherche) ne représentent que 5 % de l'ensemble, ça nous donne pas loin de 200 milliards de documents sur le réseau des réseaux, allez, on va pas chipoter...

Donc si en 2006 Internet abritait environ 200 milliards de documents, imaginez la progression sur 20 ans et multipliez ça par un chiffre compris entre 10 et 106 (nombre de mots potentiels par document)...

Cela dépasse l'entendement ! Mais revenons à ma chronologie :

Après je me suis arrêté, parce que ça devenait difficile à suivre tellement les innovations étaient fréquentes et nombreuses ! Au fil du temps, j'ai toutefois consacré plusieurs billets à la traduction en général et à la TA en particulier, en dehors de Google :

Bien qu'il y en ait d'autres (notamment sur la communication multilingue, y compris en anglais), tels sont les principaux billets publiés durant mon parcours professionnel.

*

Or nous avons désormais basculé dans une nouvelle dimension de la TA ! En novembre 2016, Google est passé à la traduction automatique neuronale, associée à un auto-apprentissage et à sa propre interlangue, pour une plus grande efficacité dans ses résultats. C'était il y a déjà presque 10 ans...

Aujourd'hui nous en sommes à l'intelligence artificielle appliquée à la traduction automatique, notamment avec Gemini (mais les concurrents ne manquent pas, sans parler de ChatGPT ou autres...) et aux grands modèles linguistiques (IBM, toujours présent...), mais je n'ai plus trop l'envie, ni le temps, d'y consacrer autant d'efforts et d'énergie que je l'ai fait ces 20 dernières années !

Une conséquence bien concrète de tout ce chambardement : après 40 ans de métier, j'ai de moins en moins de travail...

De quoi se demander si traducteur-interprète est un métier d'avenir ?

J'en doute !


vendredi 28 février 2025

LSPs = Low Service Providers

À l'heure où il est très fortement question que l'IA remplace un certain nombre de professions, les métiers de l'écriture sont parmi ceux susceptibles de disparaître :
Secrétariat, rédaction web, traduction, journalisme : l’intelligence artificielle pourrait remplacer la plume humaine.
Humainement parlant, je pense que nous en sommes encore loin, mais commercialement parlant nous nous en rapprochons chaque jour un peu plus à la vitesse grand V. La grève des scénaristes de Hollywood en est un bon exemple... À mon niveau de simple traducteur lambda, je vais tenter une analyse aussi objective que possible.

*

Depuis que j'ai rédigé mon billet, voici déjà 2 ans, Des bienfaits et des méfaits de la traduction automatique (TA) (à noter que j'ai commencé à écrire sur la traduction automatique il y a près de 20 ans...), la situation ne s'est guère arrangée, loin de là. Du reste, il faut savoir que derrière cette stratégie galopante du déploiement à tout-va de la TA, maintenant couplée avec l'IA, se trouvent les premiers acteurs du marché (des marchés) des services linguistiques dans le monde : les LSP. 


Or cela fait déjà des années, des décennies, même, que l'on assiste à une concentration toujours plus poussée des LSPs, ces Language Service Providers, ou parfois Localization Service Providers, ces fournisseurs de services linguistiques au sens large qui sont devenus au fil des ans de véritables mastodontes (le premier, Transperfect, a fait plus de 1 milliard de $ de CA en 2023...). 

Des mastodontes face à qui le traducteur / la traductrice ne compte individuellement presque plus rien, et quoi qu'il en soit de moins en moins au fil des ans, quand bien même c'est lui/elle qui assure la finition de chaque travail, finition sans laquelle les textes résultant de traductions automatiques n'auraient qu'un sens partiel, incomplet, voire faussé...

Une traduction professionnelle, comme tout produit/service au niveau professionnel, ne vaut rien si elle n'est pas finie à 100%. Or c'est l'humain qui assure la finition, certainement pas le moteur de traduction automatique, qui se contente le plus souvent de produire au mieux un contenu fade et impersonnel, au pire inexact.

Ces derniers jours, j'ai vu passer un tweet fournissant une traduction "humaine" qui me donne l'occasion d'illustrer mon propos :
J'ai soumis ensuite la phrase « Council was concerned the modifications would AFFECT the character of an important heritage structure in the city » à trois moteurs de TA : Google, DeepL et ChatGPT. Voici les résultats. 
Google Translate : « Le Conseil craignait que les modifications affectent le caractère d’une importante structure patrimoniale de la ville. » 
DeepL : « Le conseil s'est inquiété du fait que les modifications auraient pour effet d'altérer le caractère d'une structure patrimoniale importante de la ville. »
ChatGPT : « Le conseil était préoccupé par le fait que les modifications affecteraient le caractère d'un bâtiment patrimonial important de la ville. »

Par conséquent, en dépit des formidables progrès de la traduction automatique depuis près d'un siècle (je rappelle ici que, dès 1929, Federico Pucci le premier a eu l'intuition de ce que serait devenue la TA), la traduction automatique de cette simple phrase fait aisément comprendre qu'elle n'atteindra JAMAIS, selon moi, la traduction humaine. 

Pour la simple raison que cette dernière a davantage à voir avec le distributionnalisme, une approche dont j'ai eu l'intuition en m'intéressant à la création de la langue san-antonienne en italien. De fait les unités de texte ne sont pas seulement définies par leur contenu (...), mais par leur comportement à l’égard d’autres unités :

« ... la tâche du traducteur ne va pas du mot à la phrase, au texte, à l'ensemble culturel, mais à l'inverse : s'imprégnant par de vastes lectures de l'esprit d'une culture, le traducteur redescend du texte, à la phrase et au mot. Le dernier acte, si l'on peut dire, la dernière décision, concerne l'établissement d'un glossaire au niveau des mots ; le choix du glossaire est la dernière épreuve où se cristallise en quelque sorte infine ce qui devrait être une impossibilité de traduire. »

  Paul Ricœur 

Une interaction que seul le cerveau humain peut saisir dans toute sa complexité, mais certainement pas un moteur de traduction, aussi perfectionné soit-il...

*

De plus en plus la traduction se transforme en MTPE : Machine Translation Post-Edition ! Autrement dit le traducteur devient post-éditeur de traduction automatique (concept normalisé depuis déjà 8 ans), ce qui n'est plus le même métier... 

Autrefois on partait d'un texte source, que le cerveau humain rendait avec plus ou moins de bonheur, plus ou moins d'expertise, en texte cible traduit.

Aujourd'hui on part d'un texte bilingue, où les deux versions sont en regard l'une de l'autre : à gauche le texte source, et à droite le texte cible pré-traduit qu'il faut corriger (pardon : éditer).

Ce n'est pas, du tout, la même démarche. Dans le premier cas, le traducteur est libre de choisir les mots et la construction de phrase qu'il veut. Dans le second, il est contraint de s'adapter au texte de départ en le rendant le plus lisible possible. Pour autant, en partant de l'un des trois exemples de TA donnés plus haut (disons « Le conseil s'est inquiété du fait que les modifications auraient pour effet d'altérer le caractère d'une structure patrimoniale importante de la ville »), jamais il n'arrivera à « Les élus ont estimé que ces aménagements risquaient de dénaturer ce bâtiment emblématique du patrimoine municipal »...

À moins d'éliminer totalement la phrase proposée par la TA pour saisir sa propre solution. Or c'est là où le bât blesse ! Car en plus de la contrainte linguistique que nous venons d'évoquer, le traducteur fait face à une double contrainte supplémentaire, encore plus prégnante que la première : 1) la contrainte de la productivité, et 2) la contrainte du tarif.

1) La contrainte de la productivité

Il n'y a pas si longtemps encore, la productivité moyenne d'un traducteur "humain" se situait autour de 2500 mots/jour. C'était la valeur jugée raisonnable pour fournir une traduction de qualité. Avec l'introduction de la TA, tout change : les donneurs d'ordre prétendent une production au minimum doublée (env. 5000 mots/jour), voire plus encore : 7500 mots/jour, jusqu'à 10000 mots/jour dans les cas d'urgence.

Concrètement, pris au piège de la productivité, il ne peut - et ne doit (sous peine de travailler à perte) - consacrer qu'un temps (très) réduit à chaque segment à traiter. Fini les envolées lyriques, juste une intervention chirurgicale, la plus brève et indolore possible.

Si, d'un côté nous avons une productivité multipliée par 2, 3 ou 4 par rapport à hier, de l'autre, proportionnellement, nous avons un tarif divisé par 2, 3 ou 4 dans un même temps. Cherchez l'erreur... 

2) La contrainte du tarif

Je viens de l'écrire : au fil des ans les tarifs payés n'ont cessé de baisser, les LSP répercutant sur les traducteurs leurs coûts de développement de solutions automatisées, aussi bien en TA qu'en IA. Je vous donne l'exemple perso de ce que j'ai expérimenté.

Premier point : le LSP vous oblige à baisser votre tarif. Si vous ne le faites pas, c'est simple, il ne vous confie plus aucun travail... Ces dernières années, j'ai été contraint de baisser tous mes tarifs, faute de quoi je n'aurais plus eu aucune traduction à faire. J'ai bien sûr tenté de résister, avec des bras de fer épiques ayant duré parfois plus de 6 mois, mais en gros, le LSP tient le couteau par le manche !

Deuxième point : le tarif ainsi fixé s'applique aux grilles tarifaires toujours plus défavorables aux traducteurs. En gros, chaque texte est analysé au mot par mot, segment par segment, en déterminant les répétitions (totales ou partielles). Exemple :

  • Correspondance totale (exact match) à 100 % + répétitions = 30 % du tarif plein 
  • Correspondance partielle (fuzzy match) de 95 à 99 % = 30 % du tarif plein 
  • Correspondance partielle de 75 à 94 % = 60 % du tarif plein 
  • Correspondance partielle de 0 à 74 % = 100 % du tarif

Où la valeur de 0% correspond aux mots nouveaux, pour être clair. 

Tout cela sur le texte source. Donc, lorsque l'on traduit de l'anglais vers le français, c'est déjà une première perte sèche autour de 17%, vu que le français est plus long d'environ 17% par rapport à l'anglais (coefficient de foisonnement). Raison pour laquelle hier j'appliquais mon tarif sur le texte cible, traduit, et non sur le texte source. Chose devenue impossible aujourd'hui. Concrètement, sur un texte de 1000 mots payés 0,12€ le mot, au tarif source anglais ça me donne 120€, au tarif cible français 140,4 €, une différence très sensible. Imaginez ça sur un gros boulot (idem pour les relectures)...

Pire encore, le tarif de 100 % reconnu hier sur les mots nouveaux n'est plus valable aujourd'hui, chaque LSP considérant que la traduction automatique qu'il fournit a déjà fait le gros du travail. Donc on arrive à des pourcentages totalement fantasques, jusqu'à 45 % !

Cela signifie que sur les 10000 mots nouveaux/jour que je serais censé produire, le donneur d'ordre ne m'en paierait que 4500... Les autres 5500, c'est pour mes pieds ! 

Au final, si vous ajoutez 1) baisses répétées du tarif, 2) tarif source au lieu du tarif cible et 3) pourcentages irréalistes dus au binôme TA/IA, sur un travail pour lequel j'aurais gagné 1000€ hier, je n'en touche aujourd'hui plus qu'un tiers dans le meilleur des cas, voire un quart dans le pire !

Pour le dire crûment, en 10 ans, le pouvoir d'achat d'un traducteur a été divisé par 3 ou 4, ce qui n'est pas vraiment l'orientation des prix dans tous les domaines. Déjà que le métier de la traduction souffrait d'un profond déficit en termes d'image, cela n'est pas prêt de s'arranger...

*

Mais tout cela ne finit pas là : nous allons maintenant être confrontés à ce qu'on appelle pudiquement la "traduction augmentée"... Explications. 

D'emblée, il y a deux approches à ce type de traduction : l'approche orientée traduction humaine, et l'approche orientée traduction machine, ou, mieux encore, orientée technologie (où la traduction machine n'est qu'une brique de l'ensemble). Inutile de dire que les LSP se concentrent bien davantage sur la seconde et que, dans ce contexte, le traducteur est relégué au rang de simple spectateur n'ayant pas son mot à dire. Toujours davantage la dernière roue du carrosse...

Certains partent du principe qu'une grande partie des résultats de la traduction automatique est si bonne qu’elle n’a pas besoin d’être révisée ni post-éditée par un humain, ce qui est diamétralement à l'opposé de mon expérience de terrain. Où les mémoires de traduction sont le plus souvent approximatives et sans grande cohérence interne, voire totalement farfelues : c'est toujours le cas en juridique italien --> français, par exemple... 

Selon Jaap Van Der Meer, fondateur de TAUS, le problème sera résolu (facilement à le lire, mais c'est normal, lui il vend sa came) en conjuguant estimation de la qualité de la TA et post-édition AU-TO-MA-TI-QUE (EPIC !). Selon le brave homme, il suffit d'adopter une perspective différente sur le fonctionnement des modèles d’évaluation quantitative, qui s’appuient sur une représentation mathématique universelle de la langue, connue sous le nom d’incorporations. J'avoue que je n'ai pas fouillé cet aspect, je me réserve de le faire dans un avenir plus ou moins proche...

[Mise à jour - 31/03/2025] En cherchant à comprendre ce concept d'incorporations, je suis tombé sur un billet de ce même Jaap Van Der Meer parlant de l'étiquetage des données :

In natural language processing (NLP), data labeling entails tagging texts with labels beforehand. NLP classification tasks can consist of identifying text in images, sentiment, files, sounds, etc. Once these labels are generated, they can be incorporated into a training set which can then be used to either repeat the same task or be fed into a different task.  

Autrement dit : « Dans le traitement automatique du langage naturel (TALN), l'étiquetage des données consiste à apposer au préalable des étiquettes sur des textes. Les tâches de classification TALN peuvent consister à identifier du texte dans des images, des sentiments, des fichiers, des sons, etc. Une fois ces étiquettes générées, elles peuvent être incorporées à un ensemble d'apprentissage, que l'on peut ensuite utiliser pour répéter la même tâche ou pour l'intégrer à une autre. »

J'ignore si je tiens là la réponse définitive à mon interrogation, mais je devrais être sur la bonne voie...

*

Ce qui est clair pour moi, c'est que la dernière traduction qu'il a dû faire lui-même doit remonter à Mathusalem ! Il est vrai que cela peut parfois marcher pour les couples de langue les plus courants et dans certains domaines particulièrement documentés, mais ça reste marginal et n'est en aucun cas généralisable. Il reconnaît d'ailleurs que les moteurs de traduction automatique et les LLM (grands modèles linguistiques) ne seront jamais parfaits à 100 % (ni même la future TA basée sur les LLM, ajouterais-je). Ce que je qualifierais au mieux d'understatement...

*

Nous voici donc en plein dans l'industrialisation du good enough...

Autrement dit, les clients se satisfont de ce niveau qualitatif, inférieur mais suffisant, ils semblent même s'en accommoder parfaitement dès lors qu'ils payent moins sur chaque traduction : derrière le combo productivité accrue / baisse des prix, la qualité passe résolument en arrière-plan.

Le seul problème étant que la solution vendue comme "idéale", automatisée à 100 %, arrive à passer grâce - et uniquement grâce - à la finition du traducteur. Qui travaille toujours davantage dans une optique de plain translation, sur le modèle du plain english, donc en langue simple, où il s'agit de trouver autant que faire se peut des mots courts, clairs et familiers, avec le moins de syllabes possible, en évitant jargon et termes techniques, en transformant les verbes en noms ou adjectifs, pour faire en sorte que tout le monde comprenne bien le message.

La plain translation, une traduction qui n'a de simple que le nom...

*

En gros, en 2025 les clients voudraient avoir « Les élus ont estimé que ces aménagements risquaient de dénaturer ce bâtiment emblématique du patrimoine municipal » au prix du résultat d'une TA fournie par Google, DeepL, ChatGPT ou qui que ce soit d'autre, ce qui nous ramène bien des années en arrière à la quadrature du triangle !

Fini l'effet Mozart. Entre productivité accrue, faibles tarifs et qualité supérieure, ils ont vite fait leur choix : pick two aux dépens de la qualité... Il suffit de le savoir !

Or après 40 ans de métier où j'ai vu mes conditions de travail se dégrader lentement mais sûrement, je me demande ce qui pourra désormais redorer le blason de notre profession ?

Si vous avez des idées, je suis preneur...


P.S. Welcome to the Machine (Translation)...