mardi 24 juin 2025

La remise en question des LLM et leurs évolutions probables

page IA

Nous découvrons à peine la « merveilleuse puissance » des grands modèles de langage (LLM), mis au goût du jour par les IA (via leurs moteurs de réponse, on pose n'importe quelle question en n'importe quelle langue dans n'importe quel domaine et l'IA répond comme un "simple" agent conversationnel...), qu'ils sont déjà remis en question par des pointures comme IBM ou Yann LeCun, voire carrément décrits comme obsolètes par ce dernier !

Selon ses dires, David Cox, vice-président Modèles d'IA chez IBM Research et responsable du développement et de la formation des grands modèles de langage d'IBM, a inventé le terme « informatique générative » pour décrire l'évolution qu'il observe dans le développement de l'IA, désormais de l'ingénierie logicielle, où les grands modèles de langage devraient être traités comme des éléments programmables, plutôt que comme des interlocuteurs intelligents.

Il s'agit de passer de l'invite à la programmation : « Les LLM ne remplacent pas la programmation », a-t-il déclaré, « ils deviennent une nouvelle forme de programmation primitive. »

Aujourd'hui, interagir avec un vaste modèle linguistique s'apparente souvent à invoquer un oracle capricieux, « vous tapez quelque chose et vous obtenez une réponse différente selon la façon dont vous le formulez », a déclaré Ruchir Puri, directeur scientifique d'IBM Research. « Comme aux débuts de la recherche, nous en sommes encore à l'ère où une virgule peut modifier le résultat. Impossible de gérer une entreprise de cette façon. »

Pour IBM, le postulat consiste à considérer les LLM comme des infrastructures programmables, à définir une nouvelle approche de l'utilisation des modèles d'IA, à repenser l'intégration de ces modèles dans les systèmes comme des composants logiciels modulaires et contrôlés. Selon Cox, « le prompt engineering n’est pas de l’ingénierie, c’est du bricolage. Nous avons besoin d’un système où nous n’avons pas à espérer que le modèle comprenne ce que nous voulions dire, mais où nous pouvons le programmer pour qu’il fasse ce que nous voulons. »

Le principe du generative computing est simple : traiter le modèle comme une fonction. Au lieu d’enfouir des instructions dans des textes verbeux, les développeurs doivent utiliser un environnement d’exécution – une couche d’orchestration – qui découpe les prompts en parties atomiques, les achemine, vérifie les conditions et réécrit les échecs. La logique n’est plus seulement implicite, elle est appliquée. Le contrôle devient explicite. 

« Pensez à Internet », explique Cox. « Vous n’envoyez pas des données brutes en espérant qu’elles arrivent intactes. Il y a des protocoles, des relances, du routage. C’est ce que nous ajoutons à l’IA. »

Concrètement, cela signifie construire des systèmes en couches qui décomposent les tâches complexes en instructions plus petites, vérifiables étape par étape. « Vous pourriez avoir une vingtaine de petits prompts ciblés plutôt qu’un seul long et complexe », indique Puri, « mais vous pouvez désormais les journaliser, les relancer, construire des solutions de secours. C’est ce dont les entreprises ont besoin. »

*

Selon Yann LeCun, pionnier de l’intelligence artificielle et lauréat du prix Turing, les gens qui ont toute leur tête n’utiliseront plus les LLM : « Ma prédiction est que personne sain d’esprit ne va utiliser les LLM, peut-être d’ici 5 ans. Ils seront dépassés. » Il défend une vision ambitieuse pour l’avenir de l’IA. Pour lui, l’intelligence artificielle véritablement avancée – bien au-delà des modèles actuels de type GPT – ne se limite pas à manipuler du langage, mais repose sur 1) une modélisation et une compréhension profondes du monde réel, sur 2) la mémoire, 3) le raisonnement, 4) la planification et, surtout, sur 5) l’apprentissage autonome à partir d’expériences.

1) Compréhension du monde réel : l'IA de demain doit avoir un modèle du monde. Elle doit comprendre comment le monde fonctionne au-delà des données qu'on lui fournit. Les modèles actuels (LLMs comme GPT-4) n'ont pas de compréhension causale du monde ; ils associent des symboles mais ne "comprennent" pas leur signification physique ou logique. Or les IA doivent être capables d’apprendre des représentations du monde de manière autonome à partir de perceptions sensorielles (images, sons, interactions…). Ce modèle du monde serait predictif, capable d’anticiper les conséquences d’actions, un peu comme un enfant apprend par exploration.

2) Mémoire persistante : un système intelligent doit se souvenir des faits, des événements, de ses expériences. Il doit accumuler des connaissances sur le long terme. Les IA actuelles n’ont qu’une mémoire de travail très limitée (souvent une fenêtre de contexte). Une mémoire structurelle et permanente permettrait de se rappeler des états passés, d'apprendre de manière cumulative et de créer une "connaissance" dynamique sur le monde, les agents, les objets, etc.

3) Raisonnement : le système doit être capable de raisonner, de relier des concepts, de faire des inférences. Le raisonnement n’est pas seulement logique, il est aussi spatial, temporel, analogique. Les approches purement symboliques (logiques formelles) doivent laisser la place à un raisonnement différentiable, basé sur les représentations apprises. L’objectif est une forme de raisonnement intuitif, similaire à celui des humains, intégré dans l’architecture du système.

4) Planification : un agent intelligent doit être capable de planifier ses actions dans le futur, en fonction de ses objectifs et de son environnement. La planification implique d’explorer mentalement plusieurs futurs possibles. Cela nécessite une modélisation interne du monde, permettant de simuler et d’évaluer différentes séquences d’action, ce qui va bien au-delà des IA réactives ou probabilistes.

5) Apprentissage auto-supervisé (self-supervised learning) : l’avenir de l’IA réside dans l’apprentissage auto-supervisé, comme chez les humains. Le système apprend en observant le monde, sans étiquettes. Contrairement à l'apprentissage supervisé (qui dépend de données labellisées), le système doit observer, prédire, corriger, sans supervision explicite, apprendre comme un bébé : par exploration, imitation, prédiction d’états futurs.

De manière simplifiée, l'architecture proposée par Yann LeCun se compose de ces différents modules, qui coopèrent ensemble :
  • Perception : encoder l'environnement à partir de données sensorielles.
  • Représentation latente : créer un modèle interne du monde.
  • Mémoire persistante : stocker les faits et les expériences sur le long terme.
  • Réseau de prédiction : anticiper les évolutions du monde.
  • Raisonnement/planning : simuler et planifier les actions selon les objectifs.
Ainsi, chez Meta, l’entité en charge de la recherche fondamentale en IA (FAIR, the Fundamental AI Research) oriente part de ses travaux vers une intelligence incarnée, structurée, et plus autonome que les modèles linguistiques.

*

Les grands modèles de langage basés sur l'architecture des transformateurs ont bouleversé le paysage de l'intelligence artificielle, en particulier dans le traitement du langage naturel (NLP). Dans ce contexte, une seule chose est sûre : les LLM tels que nous les découvrons et expérimentons aujourd'hui sont amenés à connaître des évolutions rapides et de profondes transformations, tant sur le fond que sur la forme. Il est probable qu'ils resteront au cœur de nombreuses applications, mais les alternatives comme les small language models (SLM), l'IA orientée raisonnement ou des systèmes hybrides gagneront du terrain.

Les préoccupations liées aux coûts, à l'efficacité énergétique et à leurs limites (comme les hallucinations) poussent vers des innovations : ils continuent à être améliorés, mais leur rôle pourrait devenir plus spécialisé face à des technologies émergentes. À moyen-long terme, ils sont en transition vers des versions plus efficaces et des paradigmes complémentaires, avec des débats sur leur durabilité et leur pertinence.

Des approches émergentes, comme celles prônées par IBM ou Yann LeCun, promettent d'ores et déjà de nouvelles évolutions vers des agents intelligents, multimodaux, interactifs, planificateurs, insérés dans des architectures plus complexes, tout en étant contraints par des enjeux d’éthique, de gouvernance et de soutenabilité.

Nous n'en sommes qu'au début...

dimanche 22 juin 2025

OpenAI et Microsoft

page IA


Cette frise chronologique retrace le partenariat né en 2019 entre Microsoft et OpenAI (créée en 2015), qui commence à battre de l'aile en 2024 après 5 années d'une collaboration - très - fructueuse : Microsoft, qui a investi massivement dans l'entreprise (un total d'environ 14 milliards de dollars depuis 2019), est le fournisseur exclusif du cloud d’OpenAI via Azure. Toutes les API d’OpenAI tournent sur Microsoft Azure, et Microsoft intègre dans ses produits les technologies d'OpenAI pour améliorer ses services avec des capacités d'IA avancées.

Au mois de juin 2024, Microsoft, dans le dépôt réglementaire de ses comptes annuels auprès de la SEC (Securities and Exchange Commission) américaine, a qualifié pour la première fois OpenAI de concurrente :
Nos offres en matière d’intelligence artificielle sont en concurrence avec les produits d’IA proposés par des hyperscalers tels qu’Amazon et Google, ainsi qu’avec ceux d’autres concurrents émergents, notamment Anthropic, OpenAI, Meta et d’autres solutions open source, dont beaucoup sont également des partenaires actuels ou potentiels.

Ainsi que dans le binôme recherche-publicité :
Nos activités de recherche et de publicité liée à la recherche et à l’actualité sont en concurrence avec Google, OpenAI, ainsi qu’avec une grande variété de sites web, de plateformes sociales comme Meta, ou de portails qui fournissent du contenu et des services en ligne aux utilisateurs finaux.
La société énumère ensuite toute une série de risques liés à l'intelligence artificielle, auxquels OpenAI pourrait ne pas être étrangère (je résume) :
Microsoft utilise de plus en plus l’intelligence artificielle (IA) dans ses produits et services, et permet aussi à ses clients d’y avoir accès pour leurs propres usages. Une partie de cette IA est développée par Microsoft, l’autre par des partenaires comme OpenAI. L’IA est prometteuse, mais elle présente aussi des risques : les algorithmes peuvent contenir des erreurs ou des biais ; les données utilisées pour entraîner l’IA peuvent être incomplètes ou problématiques ; les contenus générés peuvent être inexacts, choquants ou même illégaux.

Ces problèmes peuvent nuire à l’image de Microsoft, entraîner des plaintes, des régulations, ou empêcher les produits de fonctionner comme prévu. Il peut aussi être nécessaire qu’un humain vérifie ce que produit l’IA. Il y a également des risques juridiques, notamment liés aux droits d’auteur, à la vie privée, à la sécurité des données ou aux nouvelles lois sur l’IA comme le AI Act européen ou les décrets américains. Enfin, certains usages de l’IA peuvent poser des questions éthiques (emploi, surveillance, liberté…) et avoir des impacts sur la société. Si Microsoft propose des solutions mal encadrées ou mal utilisées, cela pourrait nuire à sa réputation, à ses clients ou à ses activités.

*

Cette alliance technologique permet à Microsoft de rester à la pointe du marché de l'IA en bénéficiant des innovations d’OpenAI, tout en fournissant à cette dernière les ressources et la puissance de calcul nécessaires pour entraîner et déployer ses modèles d'IA. Mais disons que leurs propres ambitions les positionnent de plus en plus comme concurrents réels plutôt que comme partenaires, chacune étant amenée à jouer un rôle distinct dans l'IA et l'IQ à l'avenir.

Pour l'heure, Microsoft intègre les technologies d'OpenAI dans ses produits, comme Copilot, Office 365 ou Bing, afin d'améliorer ses services avec des capacités d'IA avancées, tout en développant ses propres technologies d'IA et modèles d'apprentissage automatique, notamment via Azure AI, et ses propres initiatives de recherche, susceptibles de concurrencer les offres d'OpenAI dans le futur. 

Bien que leur partenariat soit solide, Microsoft diversifie ses efforts en IA pour réduire sa dépendance à l'égard d'OpenAI, ce qui pourrait créer une concurrence à long terme, surtout si OpenAI commercialise ses modèles directement à grande échelle. En résumé, ils collaborent étroitement pour l'instant, mais leurs intérêts pourraient diverger à mesure que le marché de l'IA évolue.

OpenAI et Microsoft, partenaires et/ou concurrents ?

Voyons le contexte initial de ce partenariat stratégique clé et les circonstances ayant conduit à la situation actuelle.

Le partenariat est né d'un besoin mutuel, les deux organisations partageant la nécessité d'accélérer l'innovation en IA : OpenAI avait besoin de ressources financières et informatiques, tandis que Microsoft cherchait à se positionner comme leader dans l'IA face à une concurrence croissante. 

En juillet 2019, dans un contexte de besoins financiers croissants pour OpenAI et d'ambitions stratégiques en IA pour Microsoft, cette dernière a annoncé son investissement d'1 milliard de dollars dans OpenAI. L'accord stipulait que Microsoft fournirait des ressources cloud via Azure pour entraîner et déployer les modèles d'IA d'OpenAI. En retour, OpenAI a accepté de collaborer avec Microsoft pour intégrer ses technologies dans les produits Microsoft, comme Azure AI et, plus tard, des outils comme Copilot.

Objectifs initiaux d'OpenAI : à l'époque, OpenAI, Organisation à but non lucratif fondé en 2015 par Elon Musk, Sam Altman et d'autres, cherchait à accélérer ses recherches sur l'intelligence artificielle générale (AGI). Cependant, les coûts croissants de développement des modèles d'IA (comme GPT) nécessitaient des ressources financières et informatiques importantes, dépassant les capacités d'une organisation à but non lucratif ou autofinancée.

Transition d'OpenAI : en 2019, OpenAI a évolué d'une structure à but non lucratif vers une entité hybride, avec la création d'une branche à but lucratif (capped-profit) pour attirer des investissements. Cela a permis de financer des projets ambitieux tout en restant aligné sur sa mission de développer une IA sûre et bénéfique.

Rôle de Microsoft : en cherchant à renforcer sa position dans l'IA et à concurrencer des géants comme Google et Amazon, Microsoft a saisi une opportunité stratégique en investissant dans OpenAI, en obtenant un accès privilégié à des technologies d'IA de pointe et en renforçant son offre cloud Azure, qui est devenue la plateforme exclusive pour les besoins informatiques d'OpenAI.

Évolution du partenariat : en 2020, Microsoft a obtenu une licence exclusive pour intégrer GPT-3 dans ses produits. Après le succès de ChatGPT fin 2022, Microsoft a renforcé son engagement avec un investissement supplémentaire de 10 milliards de dollars en janvier 2023, consolidant le partenariat. Ce partenariat a permis à Microsoft d'intégrer des technologies comme ChatGPT dans Bing, Teams, et Office 365, tandis qu'OpenAI a bénéficié d'une infrastructure cloud robuste pour ses recherches.

Résumé des évolutions majeures et des développements récents (jusqu'en juin 2025)

Consolidation en 2023

En janvier 2023, Microsoft a annoncé un investissement pluriannuel de 10 milliards de dollars dans OpenAI, renforçant son rôle de fournisseur cloud exclusif via Azure et intégrant les modèles d'OpenAI (comme ChatGPT, DALL-E, GPT-4) dans ses produits (Bing, Copilot, Office 365). Cet accord a permis à OpenAI d'accéder à des supercalculateurs Azure pour accélérer ses recherches, tandis que Microsoft a bénéficié d'un accès exclusif à certaines technologies.

Ce partenariat a suscité des inquiétudes concurrentielles, attirant l'attention des régulateurs, notamment la Competition and Markets Authority (CMA) britannique et la Federal Trade Commission (FTC) américaine, qui ont enquêté sur un possible contrôle déguisé de Microsoft sur OpenAI.

Crise de gouvernance en novembre 2023

Le licenciement temporaire de Sam Altman, PDG d'OpenAI, par son conseil d'administration a révélé la dépendance d'OpenAI envers Microsoft. Microsoft a soutenu Altman, proposant de l'embaucher avec une équipe de recherche IA, ce qui a poussé 738 des 770 employés d'OpenAI à menacer de rejoindre Microsoft si Altman n'était pas réintégré. Altman a été rétabli cinq jours plus tard, avec un nouveau conseil d'administration. Cet épisode a renforcé l'influence de Microsoft, qui a obtenu un siège d'observateur (sans droit de vote) au conseil d'OpenAI.

Tensions et renégociations (2024-2025)

Restructuration d'OpenAI : OpenAI cherche à transformer sa structure hybride (à but non lucratif et lucratif) en une "public benefit corporation" pour faciliter une éventuelle introduction en bourse. Cette transition nécessite l'accord de Microsoft, qui détient 49 % d'OpenAI Global, LLC, et pourrait perdre ses droits sur les profits futurs (plafonnés à environ 120 milliards de dollars). Les négociations, entamées fin 2024, sont tendues, avec des désaccords sur la définition de l'intelligence artificielle générale (AGI), qui permettrait à OpenAI de cesser de partager ses technologies avec Microsoft dès lors qu'elle serait atteinte.

Diversification d'OpenAI : OpenAI réduit sa dépendance à Azure en signant des accords avec d'autres fournisseurs cloud, comme Google Cloud (mai 2025) et Oracle, et en développant ses propres infrastructures, notamment le projet "Stargate" avec Oracle, SoftBank et MGX. OpenAI envisage également de produire ses propres puces IA avec Broadcom et TSMC d'ici fin 2025.

Conflits anticoncurrentiels : OpenAI a envisagé de porter plainte contre Microsoft pour pratiques anticoncurrentielles, notamment en raison de l'exclusivité Azure et des demandes de Microsoft d'accéder à la propriété intellectuelle de Windsurf, une startup IA qu'OpenAI souhaite acquérir pour 3 milliards de dollars. Google a également poussé la FTC à examiner l'accord exclusif Azure, intensifiant les pressions réglementaires.

Concurrence croissante : Microsoft développe ses propres modèles IA (par exemple, un modèle concurrent de GPT en 2024) et teste des alternatives à OpenAI, comme les modèles de xAI, Meta et DeepSeek pour Copilot, signalant une volonté d'indépendance. OpenAI, de son côté, commercialise ses modèles directement, entrant en concurrence avec les produits Microsoft comme Copilot.

Retrait de Microsoft du conseil d'OpenAI (juillet 2024)

Sous la pression des autorités antitrust (CMA, FTC, Commission européenne), Microsoft a renoncé à son siège d'observateur au conseil d'OpenAI pour éviter une enquête approfondie sur un possible contrôle déguisé. Cette décision a marqué un recul symbolique de l'influence directe de Microsoft, bien que son investissement et son partenariat technique restent intacts.

État actuel (juin 2025)

Les négociations entre Microsoft et OpenAI sont dans une phase critique, avec des enjeux autour de l'exclusivité Azure, des droits sur les profits futurs, et de l'accès aux technologies post-AGI. OpenAI propose à Microsoft 33 % de sa future entité en échange de concessions majeures, mais un refus pourrait compromettre 20 milliards de dollars de financement pour OpenAI.

Les deux entreprises affirment publiquement leur volonté de maintenir un partenariat à long terme, mais les tensions suggèrent un possible "divorce structuré". OpenAI se positionne pour une plus grande autonomie, tandis que Microsoft diversifie ses efforts en IA pour réduire sa dépendance à OpenAI.

Le partenariat reste sous surveillance réglementaire, avec des enquêtes en cours en Europe, aux États-Unis et au Royaume-Uni, ce qui pourrait forcer une redéfinition des termes.

*

Initialement synergique, le partenariat OpenAI-Microsoft est devenu plus complexe et concurrentiel. Les investissements massifs de Microsoft (près de 14 milliards de dollars au total) et l'intégration des modèles d'OpenAI dans Azure et Copilot ont renforcé leur collaboration, mais la quête d'autonomie d'OpenAI, les ambitions concurrentielles de Microsoft, et les pressions réglementaires ont engendré des frictions. Les négociations en cours pourraient soit redéfinir un équilibre, soit mener à une séparation progressive, marquant un tournant dans la course à l'IA, dont OpenAI et Microsoft resteront quoi qu'il en soit des acteurs majeurs.

samedi 21 juin 2025

Intelligence artificielle et emploi

Ou « Pourquoi parle-t-on d'ingénierie de prompts ? » #PromptEngineering

page IA

*

Par curiosité j'ai visité le site du Haut-commissariat à la Stratégie et au Plan, qui a publié le rapport Les Métiers en 2030, en recherchant plus spécialement les références à l'intelligence artificielle. Une déception totale ! Le peu de documents qui en parlent remontent tous, pour la plupart, aux années 2017-2018, en alignant des poncifs sans tenir aucun compte des évolutions et de l'impact actuel de l'IA sur l'emploi dans absolument tous les secteurs. Il faut dire que le haut commissaire au plan était Bayrou, en plein sommeil jusqu'à ce qu'il devienne le pire premier ministre de toute l'histoire de France, ceci explique cela...

Le rapport lui-même, totalement anachronique, ne mentionne l'intelligence artificielle que deux fois (sur 198 pages !) sans rien en dire, en fait :

Le contexte économique a changé depuis l’exercice précédent. Il est plus favorable, avec des résultats encourageants en matière de créations d’emplois et de réduction du chômage, mais aussi plus incertain, marqué par l’impact de la crise sanitaire, par l’urgence des changements environnementaux, par le déploiement des technologies numériques (robotisation, numérisation, intelligence artificielle, etc.) et par les effets démographiques, liés au vieillissement de la population et aux besoins de remplacement des postes qu’il induit.

Les investissements continus de ce secteur [bancaire et assurantiel], en particulier dans le cloud mais également dans des technologies plus spécifiques comme l’intelligence artificielle, seraient susceptibles d’accélérer les gains de productivité et donc d’amplifier les destructions d’emplois.

C'est tout, circulez y a rien à voir ! Pour un rapport censé parler des métiers en 2030, c'est vraiment la honte...

D'autres sources nous signalent les 15 métiers qui recruteront le plus d’ici 2030 :

  • Agents d’entretien
  • Enseignants
  • Aides à domicile
  • Conducteurs de véhicule
  • Aides-soignants
  • Cadres des services administratifs, comptables et financiers
  • Cadres commerciaux et technico-commerciaux
  • Infirmiers, sages-femmes
  • Ouvriers qualifiés de la manutention
  • Ingénieurs de l’informatique
  • Ouvriers qualifiés du second œuvre du bâtiment
  • Vendeurs
  • Médecins et assimilés
  • Techniciens et agents de maîtrise et de la maintenance
  • Ingénieurs et cadres techniques de l’industrie

ou se veulent plus optimistes :
85% des emplois de 2030 n'existent pas encore, et 400 000 nouveaux talents devraient être formés au numérique d’ici à 2030 !

Top des "talents" les plus recherchés sur le marché du numérique :

Etc. etc. Des rapports dépassés, des discours politiques encore plus inutiles, le panorama est déprimant au possible. Bien que d'autres sources se veulent plus réalistes, notamment sur le site du Centre pour l'éducation aux médias et à l'information, qui propose également ses orientations stratégiques 2024-2030, ou un site du ministère du Travail guère plus encourageant, malgré des appels à projet, des séminaires ou un programme de travail exposant les grands projets de 2025 pour explorer les transformations du monde du travail, le tableau d'ensemble ne porte pas trop à l'optimisme.

*

Le constat de tout ce qui précède est l'incroyable décalage entre la réalité des faits en 2025 et le contenu des documents censés les analyser...

Les faits, un exemple parmi tant d'autres, c'est le PDG d'Amazon qui annonce :

Le déploiement de l'IA générative et des agents devrait transformer nos méthodes de travail. Nous aurons besoin de moins de personnes pour certaines des tâches actuelles, et de plus de personnes pour d'autres. Il est difficile de prédire précisément les conséquences à long terme, mais nous prévoyons que cela réduira le total de nos effectifs au cours des prochaines années, grâce aux gains d'efficacité que nous réaliserons avec l'utilisation généralisée de l'IA.

Et d'ajouter : « Nous n'en sommes qu'au tout début... ». Reid Hoffman, cofondateur de LinkedIn, estime en revanche que l'arrivée de l'IA sur le marché du travail ne provoquera aucun « bain de sang », aucune disparition des métiers, mais plutôt une transformation radicale de l’emploi, et que l’avenir proche reposera sur le modèle « une personne + une IA ». Ce qui correspond aujourd'hui au discours dominant, à savoir que l’intelligence artificielle est loin d'être autonome à 100%, qu'elle doit rester sous la surveillance et l'intervention humaines, s'ajouter aux compétences des personnes et ne pas les remplacer (AI should supplement, not supplant).

C'est un problème bien connu en traduction, celui de la finition :

Une traduction professionnelle, comme tout produit/service au niveau professionnel, ne vaut rien si elle n'est pas finie à 100%. Or c'est l'humain qui assure la finition, certainement pas le moteur de traduction automatique, qui se contente le plus souvent de produire au mieux un contenu fade et impersonnel, au pire inexact.

Idem pour les moteurs d'intelligence artificielle... La problématique consiste donc à inventer des modes de collaboration IA-humains, une dynamique clé pour l’avenir du travail. Au lieu de se susbstituer aux humains, l'IA va redéfinir et transformer les métiers existants (les professions évoluent vers des modèles collaboratifs), créer de nouveaux rôles et de nouvelles opportunités, amplifier les capacités des personnes et augmenter leur productivité, etc.

*

Voici une analyse stratégique en plusieurs dimensions (merci ChatGpt :-) :

🧭 1. Vision : vers une société du « travail augmenté »

L’intelligence artificielle transforme profondément :

les outils (plus intelligents, prédictifs, automatisés),

les tâches (reconfigurées selon ce qui est le mieux accompli par l’humain ou la machine),

les rôles (plus transversaux, hybrides, spécialisés dans la coordination ou la supervision de systèmes d’IA).

🔹 Objectif : créer des équipes mixtes où l’IA est un coéquipier numérique, pas un concurrent.

________________________________________

⚙️ 2. Nouvelles formes de collaboration IA-humain

a. Copilote opérationnel

L’IA soutient l’humain en temps réel : suggestions de rédaction, pré-analyse de données, génération d’idées.

Ex. : un juriste aidé par une IA pour repérer des clauses à risque.

b. Mise à l’échelle des compétences

Un expert peut démultiplier son impact grâce à des assistants IA, sans être limité par le volume ou la complexité.

Ex. : en médecine, l’IA aide à trier les cas urgents ou à repérer des anomalies.

c. Cocréation

Les IA génératives participent à la création de contenu, de code, de maquettes, etc.

L’humain reste l’arbitre, le concepteur, le garant du sens.

________________________________________

🧠 3. Compétences humaines à valoriser

🔑 Soft skills critiques :

Curiosité numérique, pour tester et adopter de nouveaux outils IA.

Esprit critique, pour interpréter et valider ce que l’IA propose.

Communication augmentée, pour formuler des prompts clairs et réexploiter les réponses.

🧩 Méta-compétences :

Prompt design (savoir interroger une IA efficacement).

Hybridation métier-tech : comprendre les limites de l’IA appliquée à son métier.

Collaboration interspécifique (entre humains et IA, mais aussi humains et robots).

________________________________________

📊 4. Impact sectoriel

Secteur Exemples de collaboration IA-humain

Santé IA de diagnostic + supervision humaine

Finance Analyse prédictive + validation experte

Éducation Tutorat personnalisé + enseignant-mentor

RH Tri de CV + entretien et décision humaine

Création Co-écriture, design assisté, prototypage rapide

________________________________________

🛠 5. Recommandations pour les entreprises

🔄 Refondre les processus pour intégrer l’IA comme un levier d'efficacité, pas une couche supplémentaire.

📚 Former tous les niveaux hiérarchiques à l’usage responsable de l’IA.

🧩 Nommer des “chefs de coopération IA” (AI copilots managers, IA ops leads).

⚖️ Encadrer juridiquement la co-création homme-IA (droits d’auteur, responsabilité, auditabilité).

❤️ Inclure l’IA dans les stratégies RSE : acceptabilité, éthique, sobriété numérique.

*

J'ai souligné la partie « prompt design » (sous-entendu « prompt engineering ») pour souligner le fait de savoir, et donc d'apprendre à, interroger - et instruire - une IA efficacement.

En fait, une IA se présente comme un simple robot conversationnel, où vous posez des questions, et l'IA vous répond. La question, ou le prompt, la requête / l'instruction / l'invite, est une entrée texte donnée à l’IA pour générer une réponse. Plus la question est précise, voire complexe, plus la réponse est précise, voire complexe.

C'est ce que l'on appelle le prompt engineering, à savoir la conception / l'ingénierie de prompts, aurement dit l’art de formuler efficacement des requêtes. Exemple de prompt complexe en matière de BTP, fourni par Grok :

Tu es un expert en droit de la construction, en gestion de projet BTP et en réglementation cadastrale franco-italienne. Je suis un promoteur immobilier basé en France, planifiant un projet de construction d’un immeuble résidentiel de 10 appartements à Florence, en Italie, dans le cadre d’une succession transfrontalière où les terrains ont été hérités. Rédige une réponse détaillée et structurée répondant aux points suivants :

  • Analyse réglementaire : décris les principales étapes administratives et réglementaires pour obtenir un permis de construire (permesso di costruire) en Italie, en tenant compte des contraintes urbanistiques locales (ex. Piano Regolatore Generale di Firenze) et des normes sismiques italiennes. Compare brièvement les démarches nécessaires pour obtenir un permis de construire en France.
  • Cadastre et succession : explique comment intégrer les données cadastrales italiennes (Catasto dei Terreni et Catasto dei Fabbricati) dans la gestion du projet, notamment pour effectuer une voltura catastale après la succession. Précise les documents nécessaires et les éventuelles divergences cadastrales à anticiper. Inclus l’utilisation du Certificat Successoral Européen (CSE) pour faciliter les démarches transfrontalières.
  • Fiscalité : détaille les implications fiscales du projet en Italie, en incluant les taxes liées à la voltura catastale (imposta ipotecaria et catastale), l’IMU pour le terrain, et les taxes sur la construction (ex. oneri di urbanizzazione). Compare avec les taxes équivalentes en France (ex. taxe d’aménagement, taxe foncière).
  • Gestion de projet BTP : proposez un plan simplifié de gestion de projet pour la construction, incluant les étapes clés (études préalables, choix des matériaux, coordination des corps de métier) et des recommandations pour respecter les normes environnementales (ex. certification CasaClima en Italie ou RT 2020 en France).
  • Exemple concret : fournis un exemple chiffré d’un budget prévisionnel pour ce projet (terrain de 1 000 m², immeuble de 1 200 m² habitables), incluant les coûts cadastraux, fiscaux et de construction. Mentionne les risques potentiels (ex. retards administratifs, litiges sur la succession).

Contraintes :

  • La réponse doit être concise mais complète, avec un maximum de 2000 mots.
  • Utilise un langage technique mais accessible, adapté à un promoteur immobilier non juriste.
  • Intègre des références aux réglementations italiennes et françaises actuelles (2025), en tenant compte du Règlement européen sur les successions (650/2012).
  • Fournis des exemples concrets et des recommandations pratiques.
  • Si des informations manquent (ex. données locales spécifiques à Florence), propose des hypothèses réalistes basées sur des pratiques courantes.

Sortie attendue : une réponse structurée avec des sections claires pour chaque point (réglementation, cadastre, fiscalité, gestion, budget), des tableaux comparatifs pertinents et une conclusion avec des recommandations pour minimiser les risques transfrontaliers.

*

En clair, la complexité du prompt est multidisciplinaire [le prompt combine des aspects juridiques (succession, cadastre, fiscalité), administratifs (permis de construire, urbanisme) et techniques (gestion de projet BTP, normes environnementales)], elle prend un contexte transfrontalier en considération [en intégrant la France et l’Italie, le prompt demande une analyse comparative des réglementations, des systèmes cadastraux (Catasto italien vs cadastre unifié français) et des cadres fiscaux, tout en tenant compte du Règlement européen sur les successions], de même que certaines spécificités techniques [la référence à des normes précises (Piano Regolatore Generale, normes sismiques, CasaClima, RT 2020) et des processus administratifs (voltura, oneri di urbanizzazione) exige une connaissance approfondie du BTP et du droit immobilier], des exemples chiffrés [la demande d’un budget prévisionnel avec des coûts cadastraux, fiscaux et de construction ajoute une dimension pratique et quantifiable, obligeant l’IA à produire des estimations réalistes] et des contraintes claires [les limites de longueur, le langage accessible et l’exigence de recommandations pratiques structurent la réponse pour qu’elle soit utilisable par un promoteur immobilier].

Vous comprenez pourquoi on parle d'ingénierie de prompts ?

*

En conclusion, dans le binôme « Intelligence artificielle et emploi », quels sont - aujourd'hui, dans tous les domaines - les professionnels suffisamment formés (et par qui ?) pour être prêts à collaborer avec l'IA ?

Dans un rapport de 198 pages sur les métiers en 2030, signé du Haut-commissariat à la Stratégie et au Plan, on aurait aimé, pour le moins, une tentative de réponse à ces questions primordiales ! Pas un traître mot...

mardi 17 juin 2025

NVIDIA et DeepL

Ou « Comment traduire 60 millions de mots en 2 secondes chrono ?! »

page IA

*

Nvidia est l'une des 3 plus grosses capitalisations au monde, avec Microsoft et Apple, qui totalisent ensemble plus de 10000 milliards de $ ! Et ça va continuer de grimper...

Lors de la rédaction de mes billets sur l'intelligence artificielle, j'ai constamment retrouvé Nvidia durant mes recherches sur tel ou tel secteur. Jusqu'alors, pour moi, Nvidia c'était les cartes graphiques et le gaming. Grave erreur ! Due à une méconnaissance totale de cette société. Nvidia, c'est aussi les véhicules et la conduite autonomes, la robotique, les data centers, le calcul haute performance (CHP) et, surtout, l'intelligence artificielle. D'où mes fréquentes rencontres avec la société en écrivant à ce sujet.

Fondée en 1993 par Jensen Huang, Nvidia s’est d’abord fait un nom grâce à ses processeurs graphiques (GPU), qui ont transformé l’industrie du jeu vidéo. Les GPU GeForce, lancés dans les années 1990, ont redéfini les standards du graphisme en offrant des performances inégalées pour les jeux et les applications visuelles. Mais la société ne s’est pas arrêtée là. En comprenant le potentiel de ses GPU au-delà du gaming, l’entreprise a pivoté vers des secteurs stratégiques, notamment le calcul scientifique et l'IA. Au point de devenir l’épine dorsale de l’intelligence artificielle mondiale. 

Dernier coup de maître en date : l’annonce de la création du premier cloud IA industriel souverain d’Europe, en Allemagne, en partenariat avec Deutsche Telekom. Plus qu’un simple projet technologique, c’est un signal géopolitique, économique et écologique. Du reste, l’entreprise se poisitionne désormais comme une infrastructure centrale de l’économie numérique, en évolution constante, à l’instar d’Amazon pour le e-commerce ou de Google pour la recherche.

En 2025, Nvidia vise surtout à développer un écosystème complet, verticalement intégré, un empire technologique allant du silicium au cloud, en passant par le matériel, les frameworks logiciels, les plateformes IA, la robotique, le gaming et la simulation industrielle, la santé, la 6G ou le métavers, etc. Cet écosystème s’articule autour de plusieurs piliers interconnectés, chacun renforçant les autres pour créer une synergie unique, une chaîne complète d’innovation IA : calcul, logiciels, outils, services, modèles, cloud…

1. Le matériel (hardware) est le métier historique de Nvidia, au cœur de l’offre de la société, la fondation de tout l’écosystème. Ce sont les processeurs graphiques (GPU) et les systèmes spécialisés alimentant une vaste gamme d’applications. Inutile d'énumérer ici tous les matériels de Nvidia, je m'intéresserai juste aux unités GPU NVIDIA Blackwell de la série RTX 50, embarquant chacune 92 milliards de transistors, ou GB200, GTC 2024, offrant jusqu’à 208 milliards de transistors et une efficacité énergétique 25 fois supérieure pour les modèles IA à grande échelle... 

Soit des performances inégalées pour les jeux vidéo, le streaming, les data centers, l'entraînement et l'inférence de grands modèles de langage (LLM), les simulations scientifiques, le calcul haute performance, la cryptographie, la conduite autonome et la mobilité, la robotique et les systèmes embarqués (drones, robots industriels, chiens-guides robotisés)...

2. La couche logicielle, qui connecte le matériel et les applications, représente un écosystème robuste pour maximiser les performances de son matériel et faciliter l’adoption par des millions de développeurs, en fournissant un framework de programmation et des bibliothèques IA permettant d'exploiter la puissance des GPU Nvidia dans des applications variées (IA, simulation, cryptographie).

  • CUDA (Compute Unified Device Architecture) est le langage propriétaire pour la programmation des GPU, la base de tout l’écosystème IA de Nvidia
  • RAPIDS : traitement des données en GPU (dataframe, ML)
  • NIM (Inference Microservices) : conteneurs d’inférence IA prêts à l’emploi, par exemple pour la traduction automatique, les avatars IA, ou des outils comme Triton Inference Server
  • Modulus : Simulation par réseaux neuronaux physiques (PINNs)
  • NVIDIA AI Enterprise : suite logicielle pour déployer, gérer et optimiser des workflows IA en entreprise
  • Omniverse : plateforme collaborative pour la création et la simulation 3D en temps réel, la conception de mondes virtuels, l'architecture, le cinéma (utilisé par Pixar, ILM), l'intégration de l’IA générative pour accélérer la création de contenus 3D
  • DLSS (Deep Learning Super Sampling) : technologie IA pour améliorer les performances et la qualité graphique dans les jeux. DLSS 4 (2025), avec Multi Frame Generation, génère jusqu’à trois images supplémentaires par image calculée
  • Isaac et Cosmos : plateformes pour la robotique et les systèmes autonomes. Isaac GR00T N1 (2025) pour les robots humanoïdes et Cosmos (2025) pour les simulations IA physiques, utilisées par Uber et Wayve
  • RTX Remix : outil servant à remastériser des jeux classiques avec ray tracing et DLSS. Concours ModDB (2025) pour encourager les développeurs à moderniser des jeux

3. Les plateformes logicielles verticales proposent des services cloud pour démocratiser l’accès à ses technologies et élargir son écosystème en créant des plateformes par industrie, adaptées à des secteurs entiers.

  • Industrie & manufacturing : jumeaux numériques, automatisation, maintenance prédictive, simulation collaborative 3D en temps réel à distance (Omniverse)
  • Santé / Pharma : modèles biologiques, imagerie médicale (BioNeMo), découverte de médicaments
  • Automobile : voiture autonome, cockpit IA, simulation routière (Drive / DriveSim)
  • Télécoms : IA dans la 5G, détection d’anomalies réseau
  • Finance : modélisation, prédiction, accélération de calculs
  • Robotique et simulation de robots, perception, contrôle (Isaac)
  • Cloud gaming (GeForce NOW), intégration de DLSS 4 et prise en charge de la série RTX 50 pour des graphismes ultra-fluides (2025)
  • IA générative, IA en entreprise, avec NVIDIA DGX Cloud pour l'entraînement et l'inférence IA, basé sur les superordinateurs DGX (en partenariat avec AWS, Google Cloud, Microsoft Azure), DGX Cloud (IA-as-a-service dans le cloud), NVIDIA AI Foundry, pour aider les entreprises à créer des modèles IA personnalisés (collaboration avec SAP et Salesforce pour intégrer l’IA dans les workflows d’entreprise en 2025), NeMo (développement, tuning et déploiement de LLM), Nvidia AI Enterprise (suite logicielle certifiée pour déploiement IA en entreprise), etc.

4. Collaborations, partenariats stratégiques et intégrateurs. Nvidia ne travaille plus seule, tout son écosystème repose sur un vaste réseau de partenariats stratégiques qui en amplifient l'impact.

  • Automobile : partenariats avec Tesla, Mercedes-Benz, Volvo, BYD, et Aurora pour la conduite autonome.
  • Technologie : collaborations avec Arm (pour DRIVE Thor), MediaTek, Qualcomm (NVLink Fusion, 2025), et Nintendo (puce personnalisée pour la Switch 2, 2025).
  • Recherche et santé : coopération avec Novo Nordisk (superordinateur Gefion), le Royaume-Uni (Cambridge-1) et des universités pour la recherche en IA.
  • Sport et médias : partenariats avec la NHL et La Liga pour l’analyse de données via IA, ou avec Disney pour des robots animatroniques.
  • Cloud : Microsoft Azure, Google Cloud, Oracle, AWS (via DGX Cloud ou collaborations)
  • Collaborations industrielles : Siemens, SAP, Foxconn, BMW, TSMC, ASML
  • Open source : participation à PyTorch, Kubernetes, Hugging Face (via intégrations)

5. Domaines d’application. L’ensemble de l'écosystème s’étend à de nombreux secteurs, chacun bénéficiant de ses technologies matérielles et logicielles.

  • IA et Deep Learning : entraînement de grands modèles de langage (LLM), génération de contenu (texte, image, vidéo) et applications comme la traduction automatique via NIM.
  • Gaming : expériences immersives avec RTX, GeForce NOW, et NVIDIA ACE pour des PNJ IA interactifs.
  • Automobile : conduite autonome et systèmes ADAS (Advanced Driver Assistance Systems) via DRIVE.
  • Robotique : développement de robots humanoïdes et industriels avec Jetson et Isaac.
  • Santé : découverte de médicaments, analyse d’images médicales (collaboration avec GE Healthcare).
  • Métavers et création : Conception 3D et simulations virtuelles via Omniverse.
  • Télécommunications : Recherche sur la 6G avec le programme 6G Developer (Sionna).

6. Communauté et développeurs. Nvidia soutient une communauté mondiale de développeurs pour élargir l’adoption de ses technologies.

  • NVIDIA Developer Program : fournit des outils, SDK, et des formations pour les développeurs (par exemple, CUDA, Omniverse, Isaac).
  • NVIDIA Inception : programme pour les startups IA, offrant des crédits cloud et un accès à DGX Cloud.
  • Open source : contributions à des projets comme Llama-Nemotron-Nano-VL-8B-V1 et Sionna pour la recherche 6G.

7. Vision et impact global. Sous la direction de Jensen Huang, Nvidia se positionne comme un architecte de l’avenir technologique, avec une vision centrée sur l’IA physique (robots, véhicules autonomes) et l’IA générative. L’écosystème vise à :

  • Démocratiser l’IA : avec des outils comme DIGITS et NIM, Nvidia rend l’IA accessible aux créateurs individuels et aux petites entreprises, aussi bien en mode cloud que edge (IA embarquée sur les dispositifs divers, smartphones, etc.)
  • Optimiser les performances : l’intégration matériel-logiciel (par exemple, GPU Blackwell + CUDA) maximise l’efficacité
  • Innover dans tous les secteurs : de la santé au gaming, en passant par la 6G et le métavers.
Enfin, le Nvidia-powered cloud (nouvelle génération) ambitionne de devenir « la fabrique mondiale de l’IA ».

  • Centres de données ultra-performants (SuperPODs), refroidissement par immersion / basse énergie
  • Déploiement de clouds IA locaux (Europe, Japon, Inde, etc.)
  • Standardisation avec Nvidia AI Factory : des fermes IA clé en main, de véritables usines d'IA.

*


Pour en venir au cœur de métier de la société, les puces de Nvidia ont des performances phénoménales : sur un nœud de 2 nm (nanomètres), la GPU NVIDIA Blackwell annonce 30 petaFLOPS FP8, soit 50 % de plus que H100, une latence de ~3-5 ms, de 15 à 20 % d'efficacité énergétique gagnée, des coûts réduits de 20 %, une précision accrue (95 % vs. 80 %) et une confidentialité renforcée, sur des pipelines optimisés (TensorRT). Cela signifie qu’une puce ou un système comme le GPU NVIDIA Blackwell peut effectuer 30 petaflops (30 millions de milliards) d’opérations par seconde, en utilisant le format de calcul à virgule flottante FP8 (8 bits), optimisé pour les calculs d’intelligence artificielle (IA) comme l’entraînement et l’inférence des grands modèles de langage (LLM), en accélérant à la fois l’entraînement (60-70 jours pour mille milliards - 1T - de paramètres) et l’inférence (3-5 ms). 

En termes simples, l'inférence désigne la phase d’exploitation d’un modèle entraîné, à savoir l'utilisation du modèle pour générer une prédiction, une classification, une action à partir de nouvelles données, ou une traduction automatique (TA).

Ce sont ces caractéristiques qui ont probablement séduit DeepL, société concurrente de Google Translate et des autres acteurs majeurs de la TA (Microsoft, Facebook, ChatGPT, etc.) : le troisième SuperPOD NVIDIA DGX déployé devrait lui permettre de traduire l'ensemble du Web (environ 25 milliards de milliards de mots, soit 50 milliards de pages Web estimées à 500 mots chacune) en 20 jours, contre 200 jours auparavant (c'est mon calcul), soit une capacité de production de textes 30 fois plus élevée que les systèmes précédents !

Pour citer des chiffres plus représentatifs, le taux de traduction mots par seconde est de 14,4 millions/s (par comparaison, en quarante ans de métier, à la louche, j'ai traduit environ 2 millions de mots...), soit 866 millions de mots à la minute, 52 milliards de mots à l'heure, etc. Déjà, au vu de ces quelques stats, on comprend bien que le traducteur humain n'est plus compétitif, quantitativement parlant !  

Ne lui reste plus que la qualité : le taux d'erreur admis sur ce niveau de traduction automatique étant de 5%, cela définit assez bien la marge de manœuvre persistante, pour l'instant... Soit environ 1250 milliards de mots toujours à traduire et à corriger !

Courage, traductrices, traducteurs, gardons l'espoir, il y a encore du taf !

lundi 9 juin 2025

L'intelligence artificielle et les mafIAs

page IA

Cela fait longtemps que je m'intéresse à la mafia ou à qui en parle, Italie oblige : si vous recherchez "mafia" sur ce blog, vous allez trouver une trentaine de résultats. Plus récemment, j'ai commencé à approfondir la question "intelligence artificielle (IA)", mais je n'avais pas encore pensé associer ces thèmes dans mes quatre blocs sur l'IA. Jusqu'à ce que je tombe sur cette déclaration de Nicola Gratteri, l’un des magistrats antimafia les plus respectés d’Italie (sauf par la politique...) :

« Les mafias commencent à s'intéresser à l'intelligence artificielle » !

Pour qui comprend l'italien :

Selon lui, l’intérêt de la mafia pour l’IA n'est plus un danger hypothétique, mais bien une évolution logique du crime organisé qui cherche, comme toujours, à exploiter les technologies émergentes plus rapidement que les régulations ne les encadrent :

« L'intelligence artificielle accélérera le monde, elle fournira des réponses en une nanoseconde, contrairement aux jours que ça prend pour une analyse humaine, même avec des ordinateurs puissants », ou encore « Nous aurons un monde gouverné par trois/quatre centres de pouvoir, pas plus, qui géreront et mettront en œuvre l'intelligence artificielle. »

Au profit de qui ? Et qui sont ces centres de pouvoir ?

Nicola Gratteri n'en mentionne pas explicitement la nature, ne précise pas s’il s’agit d’organisations mafieuses spécifiques, d’entités étatiques ou d’acteurs technologiques influencés par des réseaux criminels. Il semble juste évoquer une concentration du pouvoir technologique dans quelques entités globales, supérieures aux états et aux multinationales, qui pourraient inclure des organisations criminelles ou des groupes infiltrés par elles, exploitant l’IA pour maximiser leurs profits et leur influence. Ces centres ne sont pas nécessairement des mafias au sens classique ('Ndrangheta, Camorra, etc.), mais pourraient représenter des coalitions de pouvoir mêlant crime organisé, technologies et acteurs économiques ou politiques. Au plan technologique, il est tout à fait probable que ces centres de pouvoir (sans nommer les entités qui les contrôlent et les manœuvrent dans l'ombre) sont les suivants :

  1. Experts technologiques (ingénieurs informaticiens, hackers)
  2. Plateformes numériques, banques en ligne et sociétés fintech
  3. Réseaux digitaux et plateformes digitales (dark web, réseaux sociaux)
  1. Les mafias embauchent aujourd’hui des ingénieurs informatiques et des hackers de toutes nationalités, en faisant appel à leurs compétences numériques pour renforcer leurs capacités dans le cyberespace, notamment en termes de ransomware, de phishing ou d'exploitation de la blockchain...
  2. La mafia a recours à des banques en ligne et des sociétés fintech, capables de manipuler et de blanchir des milliards via des structures invisibles, parfois hébergées ou opérant dans des pays "discrets". Ce nouveau pouvoir financier a la capacité de transformer, gérer et dissimuler d’énormes flux monétaires numériques. Par exemple, les cartels sud-américains acceptent d'être payés en cryptomonnaies...
  3. L’infiltration croissante des mafias dans le dark web, les messageries chiffrées, les réseaux sociaux, les plateformes de streaming ou même le métavers crée un énorme pouvoir de communication et de visibilité, qui leur permet de recruter, coordonner des actions, diffuser des menaces ou influencer l’opinion via le Web. Ce pouvoir communicationnel s’appuie sur le contrôle de tous ces canaux.

Concernant le dark web, Gratteri souligne que la Camorra est déjà pleinement intégrée à ce réseau pour gérer des flux de drogue : « Avec un simple téléphone portable, grâce à un logiciel dédié, un camorriste peut acheter 2 000 kilos de cocaïne en restant assis sur sa chaise », voire commander l'assassinat d'une personne ou des millions de bitcoins, cela signifie que le monstre évolue, et qu'il évolue rapidement. 

Gratteri nous décrit ainsi une mafia à l'avant-garde, en phase avec son temps. Dès la naissance de Facebook, les premières mafias à utiliser le réseau social pour se forger une image et communiquer furent les cartels mexicains, qui étalaient leur richesse et leur puissance, leurs voitures de luxe, leurs montres en or et leurs montagnes d'argent tout en envoyant des messages de mort aux cartels adverses. Puis la Camorra s'y est mise aussi, en suivant la même méthode que les mexicains. Ensuite les jeunes se sont tournés vers TikTok, et toutes les mafias ont migré vers TikTok. 

Car elles se comportent exactement comme une entreprise : pour être efficaces, performantes et augmenter leurs profits, elles ont besoin de faire leur publicité : « Vu que les jeunes représentent le groupe social le moins riche mais aussi celui qui dépense le plus, les entreprises se tournent vers TikTok. Et les mafias adoptent le même modèle en allant sur TikTok et en suivant les jeunes. C'est là qu'elles se font connaître », selon Nicola Gratteri.

Je me suis quand même fortement interrogé sur la façon dont les mafias peuvent utiliser l'IA et, en bon prompt engineer, j'ai posé directement à quatre IA (ChatGPT, Gemini, Grok et DeepSeek) la question suivante :

Nicola Gratteri, un grand juge italien, a déclaré que la mafia s'intéressait à l'utilisation de l'intelligence artificielle ! Comment est-il possible qu'une mafia puisse utiliser l'intelligence artificielle sans aucun contrôle ni signalement d'utilisation suspecte à une autorité de surveillance ?

Les réponses sont éclairantes ! Je résume.

ChatGPT

Question à la fois préoccupante et très pertinente. Comment la mafia peut-elle utiliser l’IA sans contrôle ?

  • Aucune obligation d’identification pour l’usage de l’IA en ligne

Il est possible d’utiliser ou de créer des IA (notamment en open source ou via des API) sans vérification d’identité stricte, surtout dans des pays où la régulation est faible. Des modèles open source (type LLM, vision, génération vocale) peuvent être hébergés localement, donc hors du radar des autorités.
  • L’IA est un outil, pas une entité traçable
Contrairement à un compte bancaire, une arme ou une plaque d’immatriculation, l’IA ne laisse pas toujours de trace directe, surtout si elle est utilisée hors ligne ou dans des circuits illégaux. Les activités peuvent être disséminées dans des réseaux chiffrés, anonymisés ou via des intermédiaires, comme le dark web.
  • Les applications criminelles sont difficiles à distinguer de cas d’usage légitimes. Ainsi l'IA peut servir à :
générer de faux documents (deepfakes, identités synthétiques), automatiser des fraudes en ligne (phishing avec génération de texte ou de voix), optimiser des flux logistiques de trafics illicites, surveiller ou manipuler des marchés légaux via des algorithmes... le tout en imitant des fonctions commerciales classiques, ce qui rend leur détection extrêmement complexe.
  • Vide réglementaire et coordination limitée
Aujourd’hui, la régulation de l’IA (y compris l’AI Act européen) n’est pas encore pleinement en vigueur, et les autorités de surveillance ne sont ni centralisées ni interconnectées internationalement. Les mafias savent exploiter les failles transnationales là où les polices ou agences fiscales ne peuvent pas encore agir.
  • Faible culture numérique dans certains organismes publics
Les mafias peuvent avancer plus vite technologiquement que certains corps policiers ou judiciaires, souvent à court de moyens humains et techniques spécialisés. Les alertes sur des activités suspectes sont parfois manquées, faute d’expertise en cybercriminalité. À titre d'exemple, une mafia peut entraîner un modèle de génération vocale pour imiter un banquier, appeler une victime, déclencher un transfert de fonds… Le tout en quelques minutes, sans intervention humaine directe, sans signalement automatique, et avec peu de traces numériques.
  • Que faudrait-il faire ?
Créer des unités spécialisées en IA criminelle dans les services de renseignement, imposer une traçabilité et une déclaration d’usage pour certains outils d’IA, renforcer la coopération internationale et la cybersurveillance, éduquer les juges, les policiers et les citoyens sur les risques liés à l’IA...

*

Grok identifie plusieurs facteurs liés à la nature de l’IA, à l’opacité des activités criminelles et aux lacunes dans les cadres réglementaires et technologiques actuels, en raison desquels la mafia réussit à utiliser l’IA sans contrôle ni détection :

1. Nature décentralisée et accessible de l’IA
  • Accessibilité des outils d’IA : les technologies d’IA, comme les modèles de machine learning, les outils de traitement du langage naturel (ex. : ChatGPT, resemble.ai) ou les algorithmes d’analyse de données, sont de plus en plus accessibles au grand public. Les criminels peuvent se procurer des logiciels open source ou des services commerciaux via des plateformes légales sans attirer l’attention. Par exemple, des outils comme TensorFlow ou des API de reconnaissance faciale sont disponibles sans restriction stricte.
  • Marchés illégaux : les organisations criminelles peuvent acquérir des outils d’IA avancés ou des services personnalisés sur le dark web, où les transactions sont anonymisées (ex. : via des cryptomonnaies). Cela rend la traçabilité par les autorités extrêmement difficile.
  • Absence de signature évidente : contrairement à des activités physiques (ex. : trafic de drogue), l’utilisation d’IA peut être discrète. Par exemple, l’entraînement d’un modèle d’IA pour analyser des données ou générer du contenu synthétique (deepfakes) peut se faire sur des serveurs privés sans laisser de traces visibles pour les autorités de surveillance.
2. Applications criminelles de l’IA
  • Fraudes et usurpation d’identité : les mafias peuvent utiliser l’IA pour créer des deepfakes (voix ou vidéos clonées) afin d’usurper l’identité de personnes de confiance (ex. : PDG d’entreprise) pour des escroqueries. Un exemple notable est une fraude de 243 000 USD en 2019 au Royaume-Uni, où des criminels ont utilisé l’IA pour imiter la voix d’un dirigeant.
  • Blanchiment d’argent et gestion des opérations : l’IA peut optimiser les opérations criminelles, comme la gestion des chaînes d’approvisionnement illégales ou l’analyse des risques pour éviter la détection. Une étude de 2024 montre que des modèles d’apprentissage automatique peuvent prédire les vulnérabilités des municipalités italiennes à l’infiltration mafieuse, une technologie que la mafia pourrait elle-même exploiter pour identifier des cibles faibles.
  • Évasion des systèmes de sécurité : les criminels peuvent utiliser l’IA pour contourner les systèmes de détection biométrique (ex. : reconnaissance faciale) ou attaquer les infrastructures numériques (ex. : piratage de bases de données). Les drones autonomes pilotés par IA, déjà utilisés par des cartels au Mexique, permettent des opérations de surveillance ou d’attaque sans intervention humaine directe.
  • Désinformation et manipulation : l’IA peut générer du contenu synthétique (ex. : fake news, faux profils sur les réseaux sociaux) pour manipuler l’opinion publique ou détourner l’attention des autorités.
3. Lacunes dans la surveillance et la régulation
  • Retards réglementaires : les cadres légaux pour réguler l’IA sont encore en développement. Par exemple, l’EU AI Act, proposé en 2021, vise à promouvoir une IA "fiable", mais il est critiqué pour son incapacité à couvrir pleinement les usages dans des contextes sensibles comme les migrations ou le crime organisé. Les criminels exploitent ce vide juridique pour opérer sans contraintes.
  • Manque de transparence : les systèmes d’IA, en particulier ceux développés sur le dark web ou par des acteurs non réglementés, ne sont pas toujours traçables. Les autorités peinent à surveiller les serveurs privés ou les transactions cryptées.
  • Limites des technologies de détection : les outils de surveillance (ex. : caméras IA, reconnaissance faciale) sont souvent conçus pour des usages spécifiques (ex. : contrôle des foules) et ne détectent pas les activités criminelles numériques complexes, comme l’entraînement d’un modèle d’IA pour des fraudes.
  • Complexité des enquêtes : les enquêtes sur les activités mafieuses utilisant l’IA nécessitent des compétences techniques avancées et une coordination internationale, souvent absentes ou insuffisantes. Par exemple, une opération de blanchiment d’argent découverte à Londres en 2021 impliquait des réseaux russes et des criminels interconnectés, rendant la traque complexe.
4. Absence de contrôle dans les environnements criminels
  • Opacité des opérations : les mafias opèrent dans des environnements clandestins, en utilisant des infrastructures numériques privées (ex. : serveurs cryptés, VPN), ce qui limite la capacité des autorités à détecter l’utilisation d’IA en temps réel.
  • Corruption et infiltration : comme nombre d'études le mentionnent, les mafias infiltrent souvent les institutions territoriales locales. Une étude de 2024 montre que l’IA peut prédire ces infiltrations, mais les criminels pourraient également utiliser ces outils pour identifier des cibles vulnérables, contournant ainsi les autorités.
  • Manque de ressources des autorités : les forces de l’ordre, en Europe mais pas seulement, manquent souvent de moyens ou de formation pour surveiller l’utilisation de l’IA par des criminels. Les budgets limités et le manque d’expertise technique entravent les enquêtes.
*
DeepSeek et Gemini concordent sur le fait que les mafias exploitent déjà l'IA de manière clandestine, et que la menace s'aggrave chaque jour davantage en raison de l'accessibilité des technologies, de la sophistication des méthodes d'occultation et des graves problématiques liées à la surveillance d'outils aussi puissants et évolutifs :
  • L'IA n'est pas l'apanage des États ou des grandes entreprises. De nombreux outils et modèles d'IA sont librement modifiables et accessibles sans vérification stricte de l'utilisateur final, y compris via des services cloud grand public. La mafia pourrait utiliser ces ressources sans laisser de trace évidente menant à une activité criminelle spécifique. Différents frameworks permettent de développer des systèmes d'IA sans supervision. Des groupes criminels pourraient aussi entraîner leurs propres modèles pour analyser des données illégales (optimisation du blanchiment de capitaux), automatiser des attaques, contourner la surveillance (communications cryptées et générées par l'IA), etc.
  • L'IA n'est qu'un outil pouvant être utilisé pour des tâches qui, en soi, ne sont pas illégales : analyse de données, optimisation logistique, reconnaissance de motifs. La mafia peut donc intégrer l'IA dans des activités d'affaires légales (façades d'entreprises, investissements) pour mieux masquer des opérations illicites, comme le blanchiment d'argent, le financement du terrorisme ou la gestion de chaînes d'approvisionnement clandestines.
  • L'utilisation de protocoles de communication cryptés et de réseaux anonymes permettrait à la mafia de partager des informations, des modèles d'IA ou des données traitées par l'IA sans être facilement interceptée ou identifiée. Les criminels utilisent des faux comptes, des VPN et ainsi de suite pour masquer leur identité. Certaines applications (comme la génération de textes ou de voix) peuvent être détournées sans alerter les plateformes.
  • La mafia, comme toute organisation sophistiquée, peut recruter ou contraindre des individus ayant des compétences pointues en informatique et en IA. Ces experts pourraient développer des solutions sur mesure ou adapter des outils existants pour les besoins spécifiques de l'organisation criminelle. L'IA peut ainsi être utilisée pour automatiser et améliorer les cyberattaques (rançongiciels, usurpation d'identité), ou encore servir à créer de faux documents (passeports, contrats), à perfectionner le hameçonnage sophistiqué (messages plus convaincants grâce au TALN), repérer des vulnérabilités (piratage automatisé via IA), autant d'activités difficiles à tracer lorsque les criminels utilisent des serveurs offshore ou des réseaux anonymes (Tor).
  • L'IA pourrait rendre toutes ces activités encore plus efficaces, complexes et difficiles à tracer. La législation autour de l'IA est encore en développement dans de nombreux pays. Les autorités de surveillance peinent à suivre le rythme des avancées technologiques et à comprendre toutes les implications des utilisations malveillantes de l'IA.
  • De plus, la nature même de l'IA, avec ses "boîtes noires" (où le fonctionnement interne des algorithmes est opaque), peut rendre difficile la détection d'une utilisation suspecte. Afin de recycler l'argent sale, les mafias se servent de startups légales créées ad hoc pour réaliser des investissements opaques ou des transactions cryptographiques combinées à l'IA pour en rendre le traçage complexe, voire quasi impossible.
  • Enfin, pour éviter d'attirer l'attention, la mafia pourrait utiliser l'IA pour traiter de petits volumes de données ou des opérations très ciblées, rendant leur détection par des systèmes de surveillance massifs plus difficile. Des dizaines d'exemples de scénarios réalistes sont possibles, inspirés des capacités actuelles de l’intelligence artificielle et des modes opératoires observés dans les organisations mafieuses modernes, en matière :
- de fraudes bancaires orchestrées par l’IA et de disparition de fonds : l’argent est immédiatement redirigé via plusieurs comptes-écrans, converti en cryptomonnaies et transféré hors d’atteinte (pays non coopératifs).

- de collectes de données via l’IA : les cybercriminels utilisent une IA d’analyse linguistique pour passer au crible des centaines d’appels d’entreprises disponibles en ligne (interviews, webinaires, messages vocaux professionnels). Ils peuvent extraire la voix d'un PDG ou d'un directeur financier (via des vidéos sur YouTube, LinkedIn, etc.) pour faire croire à leur interlocuteur qu'il parle directement avec son supérieur hiérarchique.

- de génération de deepfakes vocaux : avec ces extraits, ils génèrent une voix synthétique réaliste du PDG, capable de simuler une conversation téléphonique. L’IA peut imiter le ton, les pauses, les hésitations naturelles, ce qui rend la supercherie crédible.

- de préparation de scripts conversationnels : une IA conversationnelle (de type LLM) est entraînée à répondre en temps réel à un interlocuteur sur des sujets financiers ou RH. Elle est nourrie avec des mails volés (phishing ciblé) pour intégrer les éléments internes à l’entreprise (projets, noms, jargon).

- d'appels ciblés aux services comptabilité ou administratif d'entreprises : à 8h du matin, un employé reçoit un appel vocal du faux PDG lui demandant d’effectuer en urgence un virement international, en invoquant un rachat d’entreprise confidentiel. L’IA répond en direct aux questions de l’employé, avec assurance et détail, jusqu’à l’exécution du virement.

*

Comme on le voit, il suffit de mixer ces activités ensemble pour dégager d'immenses possibilités. Cela peut coûter très cher à développer, certes, mais s'il y a bien un problème que les mafias n'ont pas, c'est celui du manque de fonds : leurs ressources financières sont pratiquement illimitées... Aucun obstacle de nature économique ne saurait les arrêter. 

Comment contraster cela ? Quelques axes d'intervention :
  • Renforcement des cadres réglementaires : l’EU AI Act pourrait être renforcé pour inclure des contrôles stricts sur les outils d’IA à haut risque, comme ceux utilisés pour la reconnaissance faciale ou la génération de contenu synthétique. Les autorités pourraient exiger une transparence accrue sur l’utilisation des API d’IA par des entités privées.
  • Amélioration des capacités de détection : développer des outils d’IA pour détecter les usages criminels, comme des algorithmes de détection de deepfakes ou d’anomalies dans les flux financiers. Utiliser des modèles prédictifs, comme celui proposé pour identifier l’infiltration mafieuse dans les municipalités italiennes, pour anticiper les activités criminelles.
  • Formation et ressources : former les forces de l’ordre à l’utilisation et à la détection des technologies IA, en partenariat avec des entreprises technologiques. Allouer des budgets pour des unités spécialisées dans la cybercriminalité liée à l’IA. Sensibiliser l'opinion publique...
  • Coopération internationale : les mafias opèrent à l’échelle mondiale (ex. : réseaux russes et italiens). Une coordination entre Europol, Interpol et les autorités nationales est essentielle pour traquer les réseaux transnationaux.
  • Etc.
Le problème est que, de plus en plus souvent, la politique fait exactement le contraire de ce qu'il faudrait faire, et semble travailler pour les mafias au lieu de les combattre ! En Italie, l'actuelle réforme Nordio (à laquelle et auquel Nicola Gratteri est farouchement opposé) interdit par exemple l'utilisation des chevaux de Troie pour infiltrer les organisations mafieuses, de même qu'elle restreint très fortement les écoutes en prétextant que les mafias modernes n'utilisent plus le téléphone !!!

Comme le dit si bien Gratteri, l'incompétence de certaines personnes qui occupent le pouvoir et des postes de responsabilités est gênante ! Lorsqu'ils se regardent dans la glace chaque matin, ils n'en croient pas leurs yeux ni leur cerveau de se dire : mais c'est vraiment moi qu'on a choisi pour ce poste ? Des complices, corrompus jusqu'à la moelle...

jeudi 5 juin 2025

Plateformes dédiées aux technologies linguistiques

Dans le premier billet de ce diptyque consacré aux ambitions de Slator, nous avons abordé les intégrateurs de solutions linguistiques et nous sommes interrogés sur quelle autorité épistémique leur accorder. Cette question "épistémique" est de première importance en ce qu'elle touche à un enjeu éthique et professionnel majeur dans les flux de traduction hybrides IA + expertise humaine : comment répartir autorité épistémique et responsabilité finale entre les parties prenantes (IA, LSP, traducteurs humains) ?

À première vue l'autorité épistémique (à savoir la capacité d’un acteur à être reconnu comme source légitime de savoir dans un domaine donné) réside principalement dans l’expertise humaine, et donc la responsabilité finale est portée soit par le LSP, soit par le traducteur, soit par les deux. En dépit de toute sa puissance, l'IA ne peut (encore) assumer seule ni l’autorité ni la responsabilité. Une IA ne comprend pas ce qu’elle traduit : elle fonctionne par prédiction, sans intention ni conscience contextuelle. Elle peut fournir un contenu plausible mais erroné ou biaisé.

En d'autres termes, qui porte réellement la charge morale, légale ou professionnelle du contenu livré ? Qui est comptable d’une erreur (juridique, technique, communicationnelle) ? Dans le cas des plateformes techno-linguistiques, le problème ne se pose pas, puisque selon Slator, elles ne fournissent aucun service de vérification ou d'amélioration de la qualité linguistique, ni ne garantissent la qualité du contenu produit. Ce rôle incombe aux utilisateurs ou aux prestataires externes impliqués.

Or, pour en revenir à la présentation de Slator :

Nous faisons nos adieux aux Fournisseurs de services linguistiques (LSP / Language Service Providers) et aux Systèmes de gestion des traductions (TMS / Translation Management Systems) (...), et souhaitons la bienvenue aux Intégrateurs de solutions linguistiques (LSI / Language Solutions Integrators) et aux Plateformes techno-linguistiques (LTP / Language Technology Platforms).

Sous-entendu : les LSI remplacent les LSP, et les LTP les TMS. Pour autant TMS et LTP ne sont pas interchangeables. Tandis que les systèmes de gestion des traductions étaient - sont - internes aux LSP, les plateformes techno-linguistiques fonctionnent en mode SaaS, ou mieux, PaaS, Platform as a Service, une espèce de boîte à outils à laquelle vous vous abonnez et utilisez comme bon vous semble, tout en gardant la main et la responsabilité de ce que vous produisez avec.

De même, si vous souhaitez analyser les sentiments de 10 000 avis clients multilingues ou résumer des documents légaux et les classifier par type, vous ne le ferez pas avec un TMS, mais avec une LTP si. En outre, les deux sont interopérables, par exemple en connectant un TMS à une LTP, ou en soumettant les données d'un TMS (mémoires, glossaires, etc.) à une LTP pour entraîner un grand modèle de langage (LLM) sectoriel.

C'est l'une des raisons pour lesquelles je pense que le quart actuel des LSP qui développent et personnalisent déjà leurs propres LLM (28% en 2025 selon Nimdzi), est destiné à augmenter notablement dans les mois et années à venir. L'IA révolutionne vraiment TOUT, à TOUS les niveaux !

Selon Benjamin Faes, CEO de RWS, cette révolution du contenu multilingue se traduit par le fait qu'en seulement 18 mois, avec l'émergence de l'IA générative, nous avons produit une quantité de contenu équivalente à celle créée sur Internet au cours des 30 dernières années ! Qui était déjà exponentielle par rapport à l'ensemble du contenu créé durant TOUT le passé de l'humanité...

D'où les difficultés des entreprises, qui peinent à suivre le rythme des chamboulements en cours et à prendre les bonnes décisions sur la manière de générer leur contenu, les étapes à automatiser et la manière d’interagir avec leurs publics. Exemple : 20 % des utilisateurs d’Internet sont chinois, mais seul 1 % du contenu en ligne est en chinois.

Toutefois, le passage qui me frappe le plus, dans l'intervention de Benjamin Faes, est celui sur la nécessité de faire évoluer le langage (RWS is prompted to adopt some new terminology) ! RWS n'est plus un LSP, mais un partenaire de solutions de contenu (content solution partner), pour générer un meilleur contenu, plus intelligent et évolutif, pour transformer le contenu existant afin qu'il résonne et se connecte avec les publics du monde entier, et enfin pour le protéger, de même que les données et les idées. Là encore, "solutions"...

Partie qui me touche de plus près : 

Formerly known as translators (!), these professionals are now referred to as “language specialists” or “linguistic specialists,” which Faes said better represents the work they do, which includes reading, changing, and adapting content.

Je traduis : 

Anciennement connus sous le nom de traducteurs (!!!), ces professionnels sont désormais des « spécialistes de la langue », des « experts linguistes », ce qui reflète mieux leur travail, qui comprend la lecture, la modification et l’adaptation de contenu.

Petit bémol : promouvoir leur qualification, c'est bien, mettre à jour leur rémunération (qui a déjà été divisée par 3 ou 4...) ce serait mieux ! Et cohérent...

D'autant plus que la langue est l'origine du contenu, selon Faes, qui conclut ainsi : « It is not the translation that’s important. It’s the connection that we make around the globe. »

Que j'adapterais ainsi : « L’essentiel n’est pas la traduction, mais les liens que nous créons partout dans le monde, les ponts que nous construisons entre les langues et les cultures. »

*

Après Phrase, RWS est le deuxième grand groupe qui reprend les idées de Slator et met en avant la nécessité de refondre le contenu et le langage en surfant sur l'onde puissante de l'IA. Probablement à suivre...

P.S. Liens connexes :

mercredi 4 juin 2025

Intégrateurs de solutions linguistiques et autorité épistémique

Ceci est un premier billet, consacré aux intégrateurs de solutions linguistiques. Un deuxième suivra, sur les plateformes dédiées aux technologies linguistiques.

*

Selon la définition originale donnée par Slator, les intégrateurs de solutions linguistiques (LSI en anglais), idéalement destinés à remplacer les fournisseurs de services linguistiques (les fameux LSP), sont censés orchestrer la mise en commun de technologies linguistiques, d'intelligence artificielle et d’expertise humaine afin de fournir des solutions de contenu multilingue adaptées aux exigences de leurs clients.

Pour l'heure, tout juste une semaine après leur acte de naissance, les LSI (Language Solutions Integrators) sont encore totalement interchangeables avec les LSP (Language Service Providers), et il n'y a aucune raison objective pour laquelle les petits derniers devraient faire un meilleur travail que les premiers. Changer d'appellation est purement et simplement un acte de volonté qui, à lui seul, ne suffit certes pas pour faire évoluer une industrie !

Il faut d'abord comprendre si l’implantation du sigle et du concept - à savoir leur capacité à s’ancrer durablement dans l’usage - prendra et correspondra à une réalité sous-jacente : combien des actuels LSP jugent-ils ce changement pertinent et partagent-ils le constat qu'ils sont devenus obsolètes, combien d'intervenants du secteur des langues et de la traduction adopteront-ils l'idée d'un tel nouvel acteur - ou d'un autre - sur le marché et d'un repositionnement majeur indispensable pour refléter les avancées technologiques en cours ?

Du reste, pourquoi réinventer un secteur industriel ? D'emblée, on change un nom qui en donne une image vieillie, dépassée, pour sortir des clichés, voire redonner de la légitimité, refléter une réalité en pleine évolution, attirer de nouveaux talents (ou investisseurs), accompagner la diversification ou la mutation du métier et de ses modèles économiques, stimuler la curiosité, renforcer la communication stratégique, raconter un nouveau storytelling, fédérer une communauté autour d'un nouveau projet, etc., autant d'élements qui sont souvent la condition sine qua non pour redevenir audible, pertinent et crédible auprès de toutes les parties prenantes de l'écosystème.

Condition nécessaire mais pas suffisante, toutefois ! Il faudrait déjà faire consensus, à la fois sur le constat et sur les moyens de faire évoluer les choses dans le bon sens. Or entre les trois principales sociétés d'études de marché en traduction : Slator, CSA Research et Nimdzi Insights (ces deux dernières ayant été créées avec la contribution décisive de l'ami Renato Beninatto), les avis divergent sur comment nommer cette "nouvelle" réalité.

Pour Slator, nous l'avons vu :

Nous faisons nos adieux aux Fournisseurs de services linguistiques (LSP / Language Service Providers) et aux Systèmes de gestion des traductions (TMS / Translation Management Systems) - en vigueur depuis environ deux décennies mais désormais dépassés, vu les progrès considérables du secteur au cours des trois dernières années, notamment depuis l’avènement de l’IA, et, par conséquent, l'exigence d'opérer un repositionnement majeur pour refléter ces avancées -, et souhaitons la bienvenue aux Intégrateurs de solutions linguistiques (LSI / Language Solutions Integrators) et aux Plateformes techno-linguistiques (LTP / Language Technology Platforms).

Pour Nimdzi, l'évolution du contracted language professional (CLP) au massive multiple language services provider (MMLSP) reste quand même centrée autour des LSP :

Quant à CSA, nous nous dirigeons plutôt vers des Content-Focused Knowledge Processing Outsourcers (KPOs) et des Global Content Service Providers (GCSPs), où la notion de langue s'intègre dans celle de contenu global, mondialisé, à l'horizon 2030 :


Pour autant, le projet le plus ambitieux me semble celui de Slator (en supposant qu'ils auront la force de leurs ambitions...), vu qu'il se propose de relancer toute l'industrie par un rebranding global, en remplaçant les LSP (jugés obsolètes) (à raison selon moi) par les intégrateurs de solutions linguistiques (LSI) et en repositionnant l'industrie par rapport à l'intégration toujours plus poussée IA-expertise humaine. Nous verrons quelles seront leurs prochaines initiatives pour faire vivre leur idée, si elles sont suivies d'effets, et la façon dont elle sera accueillie et promue par les parties prenantes, dont les traducteurs eux-mêmes.

*

En attendant, une petite analyse du changement de nom s'impose :

  • « Fournisseur » devient « Intégrateur »
  • « Services linguistiques » devient « Solutions linguistiques »

Intégrateur

L'intégrateur de solutions linguistiques - voire le concepteur-intégrateur -, s'apparente davantage à un architecte plutôt qu'à un simple fournisseur de services linguistiques, en mettant l'accent sur le côté ingénierie et la portée stratégique de ce qu'il propose à son client, dont il évalue les besoins linguistiques complexes (multilinguisme, conformité, accessibilité, SEO, etc.), pour concevoir une solution sur mesure combinant technologies (TAO, TMS, IA), ressources humaines (traducteurs, réviseurs, spécialistes métiers) et workflows (publication, gestion documentaire, ...) ; puis il intègre ces éléments dans les systèmes du client (CMS, CRM, plateformes e-commerce, etc.) et pilote la performance linguistique en termes de qualité, cohérence, délais, budget, évolutivité...

Dans ce contexte, comme nous l'avons déjà vu pour la localisation, la traduction n'est qu'une brique - quand bien même essentielle - de l'ensemble de la solution offerte, mais une brique où l'intégration, à son tour, joue un rôle primordial. Et notamment l'intégration de l'IA tant dans le processus d'automatisation de la traduction que dans le contrôle qualité de la post-édition, d'une part, et l'intégration IA-expertise humaine de l'autre.

Lors d'une post-édition de traduction automatique pilotée par l’IA (AI-Driven MTPE), le processus 
combine les capacités de la traduction automatique (TA) avec des outils d’intelligence artificielle avancée, dans un flux de traduction hybride où l’IA génère une première version traduite automatiquement (éventuellement via un moteur IA entraîné sur un corpus spécifique), encore mieux si la TA s'applique à un contenu source ayant fait l'objet d'un prétraitement automatisé (normalisation, segmentation, extraction de balises et d’éléments non traduisibles, application de règles de pré-édition automatisées [regex, heuristiques métier]). 

Le rapport Nimdzi 2025 sur l'état de l'industrie des services linguistiques nous donne une indication de la manière dont les LSP utilisent actuellement l'IA :


  • 68% ont recours à des solutions génériques comme ChatGPT, Claude.ai, Gemini, Copilot ou autres
  • 55% se connectent à des grands modèles de langage (LLM) via des API
  • 51% utilisent des solutions d’IA générative sous forme de plug-ins et/ou intégrées nativement à leurs plateformes 
  • 29% font appel à des prestataires tiers pour des services pilotés par l’IA
  • 28% développent et personnalisent eux-mêmes des grands modèles de langage (LLM)
C'est ce dernier pourcentage qui m'interpelle : en gros, un quart des LSP développent déjà leurs propres LLM, un chiffre destiné à progresser notablement dans les mois et années à venir. 

*
À ce stade, dès lors qu'ils seraient opérés par les mêmes acteurs, je suis contraint de faire un parallèle entre TM (mémoires de traduction) et LLM (grands modèles de langage), deux technologies totalement différentes mais avec plusieurs points communs, dont un, primordial, le concept GIGO : Garbage In, Garbage Out ! En clair, aussi bien les TM que les LLM sont fortement dépendants du choix et de la qualité des données d'origine, car dans les deux cas, des données d’entrée erronées, biaisées ou mal structurées produisent des résultats erronés, biaisés ou mal structurés (en gros, c'est la traduction parlante et odorante de GIGO : si tu as de la merde en entrée, tu as de la merde en sortie).

Dès 1864, à la question « Si vous saisissez des chiffres erronés dans la machine, en obtiendrez-vous de bonnes réponses ? », Charles Babbage, polymathe et pionnier de l'informatique, s'étonnait face à une telle incompréhension logique de base : une machine, ou tout système formel, ne peut pas corriger une erreur conceptuelle ou factuelle dans les données d’entrée. Elle ne fait qu’exécuter un traitement déterministe sur ce qu’on lui donne. Ainsi, de façon intemporelle, il nous rappelle que ni l’intelligence artificielle ni aucun système algorithmique ne peut réparer une erreur conceptuelle humaine en amont. La qualité des sorties dépend directement de la qualité des entrées. (Source, p. 67 du PDF, Curious questions)

Cela fait des années que je travaille avec des TM fournies par les LSP, et je n'en ai jamais trouvé aucune d'une qualité irréprochable, c'est le moins qu'on puisse dire : incohérences à tous les niveaux... Donc si c'est cette "expertise" qu'ils comptent répliquer sur les LLM, on n'a pas le cul sorti des ronces ! 

Il y a un deuxième point commun, probablement encore plus important que le premier, auquel il est cependant étroitement lié : quelle valeur épistémique leur accorder !? Selon l’approche la plus courante dans la littérature philosophique contemporaine, l’adjectif « épistémique » désigne ce qui a trait à la représentation juste ou fidèle de la réalité

Tariq Krim nous rapporte dans sa récente conversation avec Meredith Whittaker, présidente de la fondation Signal, que celle-ci appelle à lutter contre « l’autorité épistémique » des plateformes qui prétendent en savoir plus que nous sur nous-mêmes, écrivent nos récits, fixent les cartes sur lesquelles se construisent nos vies...

Or reconnaître aux plateformes une autorité épistémique signifie qu’elles façonnent la perception de ce qui est crédible en jouant un rôle central dans la manière dont les gens accèdent au savoir (non pas parce qu’elles produisent directement du savoir, mais parce qu’elles en organisent la visibilité et la diffusion), trient ce qu’ils jugent vrai ou faux, légitiment certains discours plutôt que d'autres, etc.

Un rôle qui dépasse largement la simple mise en relation entre contenus et utilisateurs. En filtrant, hiérarchisant, promouvant ou invisibilisant certains discours, les plateformes redessinent les contours mêmes de la connaissance accessible. Elles deviennent des intermédiaires cognitifs, souvent invisibles, via des choix techniques (personnalisation, engagement, viralité) qui ont des effets profonds sur les personnes.

Toutefois cette "autorité" s'exerce sans les garanties traditionnelles du champ scientifique ou journalistique (collégialité, transparence des sources, responsabilité éditoriale), en étant déléguée à des algorithmes, des dynamiques de popularité, voire des politiques de modération opaques. Question : à quelles conditions une telle autorité peut-elle être légitime ? Par conséquent interroger l’autorité épistémique des plateformes, c’est poser une question politique autant qu’intellectuelle : qui décide de ce qui mérite d’être vu, su, cru ?

Maintenant, avec l’essor fulgurant de l’intelligence artificielle générative, les grandes plateformes technologiques ne sont plus seulement des hébergeurs ou des diffuseurs d’information : au moyen de modèles capables de générer des textes, des images, voire des raisonnements de plus en plus cohérents, elles deviennent des producteurs actifs de savoirs simulés.

Dans ce nouveau régime informationnel, leur "autorité épistémique" prend une dimension inédite : ce n’est plus uniquement l’accès au savoir qui est filtré, mais la forme même que prend la connaissance produite par les machines. Lorsqu’un assistant IA répond à une question, il ne cite pas toujours ses sources, et il n’est pas aisé de distinguer ce qui relève d’une synthèse fondée, d’un biais algorithmique ou d’une approximation.

Cette délégation implicite de la vérité à des systèmes opaques pose un problème majeur de responsabilité épistémique. Les plateformes ne revendiquent que partiellement la maîtrise du contenu généré par leurs modèles, tout en accumulant un pouvoir considérable sur ce que des millions d’utilisateurs vont percevoir comme vrai, probable ou crédible.

D'où le risque d’une normalisation silencieuse : plus les IA génératives sont perçues comme compétentes, plus leur autorité est acceptée sans examen critique. Cependant, cette autorité n’est ni neutre ni universelle : elle est modelée par les données d’entraînement, les objectifs commerciaux et les contraintes techniques de chaque plateforme. La boucle est bouclée : Garbage in, Garbage out...

Donc, appliquée à la traduction automatique à l'ère de l'IA, quelle peut-être l'autorité épistémique de plateformes traductionnelles ne se contentant plus d’outiller les traducteurs, mais d'en devenir les co-producteurs invisibles ? Un glissement qui soulève une question essentielle : à qui accorde-t-on la légitimité de dire ce que signifie un texte ? 

Autrement dit, qui détient l’autorité épistémique dans l’acte de traduction ? Traditionnellement, cette autorité appartenait au traducteur humain, fondée sur une expertise linguistique, culturelle et contextuelle. Mais à l'heure où les plateformes s’imposent comme des intermédiaires cognitifs puissants, capables de produire des traductions fluides, plausibles, souvent même acceptées sans vérification approfondie ?

L’usage massif de ces outils en entreprise, dans les administrations ou même chez les professionnels, témoigne d’un transfert progressif de confiance vers des systèmes opaques, entraînés sur des corpus inconnus, selon des logiques d’optimisation qui ne sont pas celles de la fidélité ou de la précision. Avec quelques risques sous-jacents :
  • Naturalisation des erreurs : une formulation plausible est perçue comme correcte
  • Effacement du traducteur : son rôle se réduit à un contrôle qualité subordonné, de plus en plus mal payé
  • Perte de réflexivité : les décisions traductives deviennent mécaniques, sans distance critique, ou si peu...
Or, la traduction n’est pas une simple opération technique. C’est un acte interprétatif, culturellement situé, politiquement chargé. Confier ce pouvoir à des machines — ou aux entités qui les opèrent — sans discussion, c’est accepter que la voix des plateformes redéfinisse silencieusement la norme du sens. Il est donc urgent de repenser la place du traducteur non pas comme un opérateur marginal de l’IA, mais comme un expert en position d’interroger ses productions, de les encadrer, de les corriger et de leur résister. 

Condition sine qua non pour que l’autorité épistémique redevienne un acte professionnel conscient, et non pas un automatisme vide de sens.

C'est ainsi que Slator prévoit l'Expert-in-the-Loop (EITL), où une approche semi-automatisée de production de contenu multilingue serait censée s’appuyer sur l’expertise humaine, introduite dans la boucle pour garantir un résultat final de haute qualité : très bien dans le principe, pratiquement totalement absente dans la réalité (pour l'instant du moins...) !

*

Solution

Dans l'esprit du rebranding de l'industrie voulu par Slator, « Solution » remplace « Service ». Pourquoi ?

Souvent employés de manière interchangeable dans divers secteurs, les deux termes ont pourtant des nuances différentes. La notion de "services" est moins large et plus connotée "exécution", là où une offre orientée "solutions" promet au client de résoudre ses problèmes à 360°. Il y a trois types de solutions :
  • solution 100% humaine (coûts désormais insoutenables)
  • solution 100% machine (entièrement automatisée, peu épistémique)
  • solution hybride homme+machine (curseur réglable à volonté)
Le repositionnement du secteur s'articule surtout autour de ce troisième axe, où, loin de remplacer l'humain, l'IA collabore avec lui (à moins que ce ne soit le contraire ;-). Je développerai cela dans un deuxième billet sur les plateformes dédiées aux technologies linguistiques.

P.S. Liens connexes :