mardi 6 mars 2007

Les enjeux autour de Technorati et des blogs

Les enjeux autour de Technorati et des blogs

Dans une association de pensées un peu facile, mais immédiate, il m'arrive souvent d'évoquer l'équation suivante : blogosphère = Technorati. Très partiel et partial, je vous l'accorde, mais lorsque je veux circonscrire une recherche aux blogs, j'ai plus volontiers le réflexe Technorati que Google BlogSearch, et j'imagine ne pas être le seul.

C'est donc avec une certaine surprise que j'ai lu ce billet de Read/WriteWeb reprenant une analyse de LeeAnn Prescott, publiée fin décembre 2006 et intitulée Google Blog Search dépasse Technorati, indiquant que pour la première fois Google pousse son propre moteur de recherche de blogs sur le marché nord-américain, aux dépens des résultats de Technorati.


Technorati, une bonne image de marque et une très forte notoriété sur le Web, PR7, 91 millions de résultats dans Google :


+70 millions de blogs tracés à ce jour :


soit une progression de 100% en moins d'un an (+35 millions en avril 2006) !

Des chiffres impressionnants mais probablement en dessous de la réalité. Je m'explique : si l'on en croit le niveau de francisation de la blogosphère selon David Sifry, le français ne représente que 2% de l'ensemble, soit en gros 1,5 million de blogs en se basant sur le total de 70 millions annoncé ci-dessus. Or Skyblog à lui seul en compte plus de 7,5 millions (à l'instant de ma capture d'écran)... Un différentiel de 6 millions de blogs pour une langue, cherchez l'erreur !


Un différentiel qui trahit la difficulté de dénombrer le phénomène avec exactitude et qui explique les fourchettes importantes qu'on retrouve çà et là sur le Web : des 70 millions annoncés par Technorati aux 100 millions de blogueurs prévus par Gartner durant le premier semestre 2007 :
Blogging and community contributors will peak in the first half of 2007. Given the trend in the average life span of a blogger and the current growth rate of blogs, there are already more than 200 million ex-bloggers. Consequently, the peak number of bloggers will be around 100 million at some point in the first half of 2007.
Donc si l'on suppose ce chiffre de 100 millions comme plausible (ayant vu que les estimations de Technorati étaient par défaut), cela signifie que Technorati concentre grosso modo les 3/4 des blogs à l'heure actuelle.

Une ressource exceptionnelle, puisque la blogosphère prend chaque jour une importance considérable, autant en termes de taille que d'UGC, le fameux contenu généré par l'utilisateur. L’audience et le contenu étant devenus pour l’Internet ce que le labourage et le pâturage sont à la France : ses deux mamelles. Elles nourrissent le réseau, dont l’arborescence a le contenu pour sève et l’audience pour frondaison.

Le binôme audience + contenu est d'ailleurs le véritable modèle économique du Web, voir les (prix des) rachats de MySpace par News Corp., de YouTube par Google, ou plus récemment de MyBlogLog par Yahoo (une opération bien utile...).

C'est là du reste où je rejoins l'analyse d'Emre Sokullu et Richard MacManus sur les options de sortie de Technorati, qui mentionnent un choix possible entre une introduction en bourse ou une acquisition par Viacom ou News Corp. (dont on connaît l'appétit pour ce genre d'opérations), ou encore par Yahoo, qui en profiterait pour étendre son offre de recherche aux blogs.

De plus, si un moteur réussit à décrocher l'exclusivité sur Technorati, il bénéficiera de sa formidable audience (208ème site le plus visité au monde, selon Alexa).

La possibilité d'un rachat de Technorati avait déjà été envisagée en 2005, aussi bien par Yahoo que par News Corp., mais cela ne s'est pas concrétisé par la suite. Il n'empêche qu'en deux ans les choses bougent, a fortiori sur Internet, où les réseaux sociaux ont actuellement un pouvoir d'attraction qu'ils n'avaient pas alors (l'apparition de nouveaux acteurs le montre), et que les rumeurs d'aujourd'hui deviendront peut-être les réalités de demain...

Qui vivra verra ;-)



P.S. Merci à Tom, qui vient d'ajouter en commentaire que les fils RSS sont maintenant disponibles sur Skyblog. Par curiosité, j'ai voulu comparer les stats entre le jour où j'ai écrit ce billet et aujourd'hui (vendredi 23 mars, 16h30'), or à l'heure où j'écris, voici les résultats :


Donc, en 17 jours :
  • 250 000 nouveaux skyblogs
  • plus de 7 millions d'articles écrits
  • près de 30 millions de commentaires
C'est quand même étonnant !

Tiens, pour terminer, cadeau : voici le premier skyblog en termes de fréquentation. Sortez couverts...

, , , , , ,

samedi 3 mars 2007

Deux mots sur Google ... et quelques liens

Deux mots sur Google ... et quelques liens

En mars dernier je publiais un billet sur Google qui allait faire date dans ma vie de blogueur. C'était le cinquième que j'écrivais sur la firme de Mountain View, mais j'ignorais qu'il préludait à une longue série, riche d'une cinquantaine d'articles qui m'ont amené à décortiquer le mystère Google, toujours aussi fascinant, je l'avoue, même si j'en parle moins. Zorgloob et d'autres le font déjà très bien (impossible de tous les citer), et puis je n'aime pas me focaliser trop longtemps sur les mêmes sujets, étant curieux de tout par nature. Je crois d'ailleurs que l'éclectisme est l'une des qualités du blogueur.

Mais bon, lundi aura lieu la présentation d'Eric Schmidt aux analystes financiers, accessible ensuite ici, et même si je doute qu'il répète la formidable erreur de l'année dernière, il y a toujours beaucoup à apprendre dans les présentations de Google (je me suis peut-être avancé un peu vite, cette année le rapport signal-bruit n'est certainement pas en faveur de Schmidt !).

Qui vient juste de soumettre son bilan 2006 aux instances américaines compétentes (via Search Engine Land), je vous le laisse disséquer à loisir (quelques précisions chez Didier Durand). Je me contenterai de vous signaler une section très intéressante sur le pôle business, qui décrit tous les produits et services grâce auxquels la société fournit de la valeur à ses utilisateurs (How We Provide Value to Our Users). La liste est longue et c'est en anglais, aussi permettez-moi de vous signaler le superbe travail d'Olivier Duffez, qui vous fournit pratiquement la même en français. Donc, tant qu'à choisir, restons gaulois ;-)

Autre must read, ces deux ressources exceptionnelles sur le blog de Gord Hotchkiss, à propos de la personnalisation des résultats de recherche : une interview avec Marissa Meyer, l'autre avec Matt Cutts, qui aborde également l'avenir du référencement...

Et puisqu'il faut aussi citer les zones d'ombre, je vous conseille cet excellent billet de Philipp Lenssen sur la censure exercée par Google dans certains pays / certaines circonstances.

Côté hypercompétition, la bataille de titans se poursuit, et au milieu Yahoo compte les points. Google, dont la suite bureautique en ligne écrase ses concurrents (en leur laissant les miettes), attaque de front Microsoft sur son propre terrain, qui essaie de s'adapter, notamment en reversant une partie croissante de son budget pub sur Internet.

J'emprunterai d'ailleurs à Ray Ozzie le mot de la fin, qui définit ainsi la recherche sur la toile : the command line of the Internet. Une définition qui pourrait fort bien s'appliquer à Google...


vendredi 2 mars 2007

Lorsque les conversations se taisent...

J'aime bien Loïc Le Meur. Le Monsieur Blog de l'Hexagone !

Ça n'apparaît sûrement pas dans mes billets, vu qu'à chaque fois que j'en ai parlé c'était plutôt sur le ton de la critique, mais critiquer quelqu'un ne veut sûrement pas dire qu'on ne l'apprécie pas.

Je l'aime bien parce que je pense que c'est un honnête homme. Je sais pertinemment qu'en 2007 dire de quelqu'un qu'il est honnête homme ça fait con ou ringard, au choix, mais ça veut bien dire ce que ça veut dire. Quelqu'un d'honnête, droit dans ses bottes disait Juppé si je me souviens bien, quelqu'un qui n'a pas peur de s'exposer ni de dire publiquement ce qu'il pense, ce qu'il croit et en quoi (ou en qui) il croit, etc.


Il m'énerve d'ailleurs assez depuis qu'il parsème son blog de billets parlant de Sarko, personnage pour qui j'ai à peu près autant d'estime que pour Berlusconi, c'est-à-dire aucune. Pour employer un euphémisme.
[Parenthèse] Même si je penche plutôt à gauche côté politique, c'est juste au niveau des idées, car je suis intimement convaincu que la politique telle qu'elle est pratiquée aujourd'hui dans nos démocraties s'est tellement vidée de son sens qu'elle n'en a plus, de sens. Ni à droite, ni gauche, au centre, en haut ou en bas, car qu'ils ou elles se proclament d'une quelconque "famille" (laissez-moi rire :-), le résultat est le même sous toutes les latitudes, tous sont à la botte (droits dedans ?) de l'économie et des grands pouvoirs financiers qui se partagent le gâteau global. Mais c'est une autre histoire. [/Parenthèse]
Tout comme j'aime, beaucoup, son slogan : « Les blogs démarrent des conversations. »

Donc quelle n'a pas été ma surprise de découvrir un de ses derniers billets, publié le 27 février, intitulé « Fermeture temporaire des commentaires de ce blog. »


Et d'expliquer qu'après 40 000 commentaires, une fantastique conversation, la situation est devenue ingérable, notamment à cause de :
  • militants politiques et autres qui polluent toute la journée les commentaires juste pour nuire et tuer la conversation... ;
  • commentaires publicitaires en tous genres ;
  • insultes, caractère diffamatoire de beaucoup de commentaires pour moi ou pire, pour d'autres ;
  • lettres d'avocat qui me demandent de supprimer tel ou tel commentaire de personne qui s'en prend à une autre ;
  • commentateurs qui me demandent de modifier ou supprimer les commentaires une fois qu'ils les ont déposés ;
  • etc., etc.
Un billet qui m'a attristé, car pour moi une conversation qui s'éteint, c'est comme un départ, un manque, un vide qui se crée et que rien ne vient combler.

Et au-delà du cas particulier de Loïc, ça m'a fait penser à l'analyse (que je partage) faite par Chris Sherman de la recherche sociale, où il mentionne les "parfaits idiots", "les nuls et les spammeurs". Ajoutons-y les plagieurs, les trolls - pour employer un anglicisme - et les connards - pour employer un gallicisme (ou un idiotisme, si vous préférez, double-cliquez sur le mot pour obtenir sa définition).

C'est du reste l'une des raisons pour laquelle je ne lis pratiquement jamais les commentaires laissés sur AgoraVox, où tous les esprits chagrins et les pisse-froid vont déverser à torrents leur bile et leur mal-être. Souvent de quoi vous faire désespérer de la nature humaine...

Donc voilà, lorsque les conversations se taisent, c'est triste.

Remarquez-bien que je n'ai pas ce problème ! Malheureusement, dirais-je même de façon assez paradoxale ! Comme je l'avouais dans cette interview :
Êtes-vous satisfait de l’interaction de votre blog ?

- Pas vraiment. Trop de silence. À ce jour, 335 commentaires (dont les miens) pour 169 billets publiés, soit pratiquement 2 commentaires par billet, un rapport de 2 à 1, presque de 3 à 1 si l’on tient compte des 76 billets non commentés, près de 50% du total. Qu’il me soit permis au passage de remercier chaudement tous ces commentateurs et quelques rares commentatrices, qui me donnent leur avis épisodiquement ou plus régulièrement. Même si en vérité, je me fais souvent l’impression d’écrire pour les moteurs vu ce taux de participation plutôt bas. Pour autant, les commentaires font sens, comme on dit en anglais, de par leur qualité plutôt que de leur quantité.
C'était il y a une trentaine de billets de cela, or la courbe n'a pas évolué depuis. Presque chaque matin, voici ce que je peux lire lorsque je contrôle mon tableau de bord :


Lorsque les conversations se taisent, c'est triste. Mais lorsqu'elles ne démarrent même pas, c'est encore plus triste. :-(


[MàJ - 5 mars 2007] Loïc Le Meur s'explique dans un podcast et annonce en parallèle la création d'un groupe Google.

, , , , , ,

jeudi 1 mars 2007

La fin de GYM se dessine, lentement mais sûrement...

Google, premier
Yahoo!, deuxième
Microsoft, troisième


MSN sous-performe de plus en plus, ayant perdu 24% de parts de marché dans la recherche d'une année sur l'autre (janvier 2006 - janvier 2007), alors que Google en gagnait presque autant sur la même période. En outre, la position de Google est beaucoup plus forte en Europe qu'elle ne l'est en Amérique, voir la France pour exemple.

Une situation qui stagne depuis maintenant plus de deux ans, précisément depuis le lancement de MSN Search qui se voulait un "Google killer", en rien modifiée par le restyling en Live Search :


et une troisième place qu'a du mal à digérer Steve Ballmer (retranscription intégrale) :
"We're the number three company in the world for ad-funded online experiences behind Google and Yahoo! We don't like being number three."
Un message subliminal ? Pas tant que ça quand même ! Car Ballmer a beau ne pas toujours répondre aux questions qu'on lui pose (suite à ses attaques répétées), il y répond parfois, et ses paroles ne doivent pas être sous-estimées :
We are the number three seller of Internet advertising in the world, ..., and now the question is where do we go next.
Oui, qu'allons-nous faire maintenant, là est la question ! « Nous réveiller », comme le suggère Ray Ozzie avec son wake-up call ?

Moi j'aurais une solution toute simple : racheter Yahoo ! L'option IV selon les analystes d'UBS (Go big. Buy Yahoo). Pour faire d'une pierre deux coups , en éliminant le deuxième pour prendre sa place et en se rapprochant considérablement du premier par la même occasion.

L'idée n'est pas mienne et revient cycliquement à l'ordre du jour. Microsoft vient d'ailleurs d'acquérir Medstory (annonce faite il y a moins d'une semaine), un moteur vertical dédié à la santé, et reconnaît, toujours par la voix de Ballmer, qu'il peut y avoir encore de gros coups à jouer :
“There may be blockbuster [deals], but the number one thing for us is our own development and let’s call them technology acquisitions.”
Tout est dans le non-dit...

Il y a trois mois, j'ai tenté d'expliquer pourquoi Yahoo serait une proie convoitable par Microsoft, or je ne peux que confirmer mon analyse aujourd'hui : plus que jamais convoitable ! Pour plusieurs raisons défavorables à Yahoo! (mais favorables à Microsoft) :

1. L'action de Yahoo! a perdu près d'un quart de sa valeur en un an :


2. Le management de Yahoo! semble très très agité, et en dépit du lancement réussi de Panama, tout le monde, de Wall Street aux actionnaires, s'accorde à demander la tête de M. Semel, à qui il est reproché, entre autres, d'avoir loupé plusieurs tournants stratégiques, notamment quelques acquisitions manquées, de MySpace à YouTube en passant par ... Google (pour 3 misérables milliards de dollars à l'époque !).

Une chute et une instabilité que Microsoft pourrait (devrait ?) mettre à profit. Je suis d'ailleurs assez surpris de la réponse (ingénue ?) faite par Christophe Parcot, directeur de Yahoo France, à la question sans ambiguïté de Jérôme Bouteiller :
Microsoft pèse 300 Mds $ de Market Cap, Google environ 150 et Yahoo tout juste 40. Pensez vous que Yahoo puisse continuer seul sur ce marché ? Un rapprochement avec Microsoft aurait-il du sens ?
- Oui...

Donc, en donnant pour acquis que la retranscription de l'interview est fidèle, ne reste plus qu'à savoir à quelle partie de la question se réfère M. Parcot :
  1. Pensez vous que Yahoo puisse continuer seul sur ce marché ?
  2. Un rapprochement avec Microsoft aurait-il du sens ?
Oui..., décidément, de part et d'autre de l'Atlantique, tout est dans le non-dit !

Probable qu'ils n'ont pas osé publier le manifeste du beurre d'arachide de Brad Garlinghouse sur leur Suggestion Board, mais que va faire Yahoo maintenant ? À suivre...


, , , , , , ,

vendredi 23 février 2007

L'industrie GILT et l'effet Mozart

L'industrie GILT et l'effet Mozart

GILT, késako ?
L'effet Mozart et la localisation


* * *

À dimension humaine, Internet efface le temps, la distance, la vitesse, voire confère aux internautes une certaine forme d'ubiquité, mais ne franchit que très imparfaitement les frontières ultimes des langues et des cultures. Qui ont donné naissance à l'industrie de la Globalisation, l'Internationalisation, la Localisation & la Traduction, GILT pour les intimes.

Ces termes, compréhensibles en apparence, dissimulent en réalité une complexité extrême et toute une galaxie de services liés et souvent interdépendants (source) :


Pourquoi "industrie" ? Parce qu'il y a autant de différences entre une agence de traduction "normale" et un LSP (cf. glossaire) qu'entre une boutique de quartier et l'hyper du coin, entre un artisan et un industriel...

Il n'y a qu'à voir la flopée de standards liés aux processus métiers impliqués pour comprendre que les choses sont plus compliquées qu'il n'y paraît !


Voici donc quelques définitions succinctes pour mieux saisir de quoi l'on parle :
  • Globalisation (G11N) : concerne tous les aspects de l'entreprise liés à la mondialisation de sa présence, sa marque, son image, ses produits/services, etc., et par conséquent l'intégration de tous les facteurs exogènes (externes à l'entreprise : économie, politique, technologies, social, etc.) et endogènes (internes à l'entreprise : processus métiers, marketing, ventes, SAV, suivi clients, etc.) au niveau planétaire.
  • Internationalisation (I18N) : conception technique native d’un produit/service en vue de sa localisation, de sorte qu'on puisse lui appliquer les différentes conventions linguistiques et culturelles propres aux pays cibles sans devoir à chaque fois tout reprendre à zéro. Attention toutefois à la polysémie du terme, puisqu'il ne s'agit pas de la même chose selon la nature du produit/service, logiciel, site Web, etc.
  • Localisation (L10N) : modification finale des produits/services pour prendre en compte les spécificités inhérentes aux marchés cibles ; touche tous les aspects de la commercialisation : conditionnement, documentation, promotion, etc. La localisation s'oppose à la standardisation, où seul change le message, forcément traduit/adapté.
  • Traduction : après des millénaires de bons et loyaux services (quoiqu'en pensent les adeptes du traduttore = traditore), le terme et les réalités qu'il cache restent à définir, plus de 20 ans de métier n'ayant pas encore suffi à me fournir une réponse définitive ! Something which really get me puzzled...

À noter que dans le triplet G11N, I18N, L10N, les chiffres correspondent au nombre de lettres intercalées entre la première et la dernière du terme concerné.

Sur un plan purement hiérarchique, la globalisation "englobe" les autres activités, la traduction étant au cœur du processus :


Et tandis que l'internationalisation n'est que le socle des opérations successives, la localisation est un élément déterminant du e-commerce, puisqu'il est unanimement reconnu que les internautes sont plus enclins à acheter en ligne des produits/services sur des sites Web qu’ils peuvent consulter dans leur langue, indépendamment de leur maîtrise plus ou moins bonne de l'anglais. D'où l'enjeu de communiquer immédiatement dans les formes auxquelles les locuteurs natifs sont habitués, sous peine de perdre un nombre incalculable de clients potentiels qui ne reviendront jamais sur un site imprésentable, voire ridicule, parce que ne respectant ni les canons linguistiques ni les impératifs culturels du marché cible.

En revanche, si le visiteur de votre site ne remarque pas qu'il est sur le point d'acheter un produit/service qui a été conçu sous d'autres cieux pour des publics étrangers, alors soyez convaincu que vous avez réussi votre localisation !

Ce qui est plus facile à dire qu'à faire, puisque d'un pays à l'autre, tout change : citons entre autres les abréviations, la typographie, les dates, les caractères, l’usage des majuscules, la ponctuation, la division syllabique, la mise en page et le design, les significations attachées aux chiffres ou aux couleurs :


Sans compter la législation, les us et coutumes, la gestuelle, les références culturelles, religieuses, historiques, etc., autant de facteurs déterminants - implicites ou explicites - aux yeux d’un locuteur natif. Jusqu'au(x) sens variable(s) lié(s) à l'usage d'un même terme de part et d'autre de la frontière : l'orgueil a une connotation fortement positive en Italie, fortement négative en France !

Tout cela ne fait qu'ajouter des morceaux au puzzle de la localisation,


mais ne pas le savoir peut coûter - très - cher, les exemples sont légion et font bien rigoler des générations de traducteurs. D'autres passent à la légende...

C'est ainsi qu'on en arrive à la dernière composante GILT, la traduction :


qui n'est en théorie (et, malheureusement, dans la pratique aussi) que l'un des éléments de la localisation, comme on le voit, puisqu'en dépit de leur interdépendance, ces opérations sont dissociées, séparées en autant de fonctionnalités (processus que les anglo-saxons appellent "featurization" ou "commoditization"), ce qui conduit le traducteur à ne plus travailler que sur des portions de projet sans en avoir la moindre vision globale.

Un état de fait allant à l'encontre d'une loi en traduction, qui veut que plus on travaille sur des segments de petite taille, plus on a des chances de se tromper : « The smaller the semantical unit, the greater the potential to get it wrong. » (Source)

Je simplifie, c'est clair, mais grosso modo, ça se passe ainsi en réalité, même si je crois que le système atteint ses limites. En effet, bien que la traduction automatique avance à grand pas, il reste une part ultime, un noyau de résistance qu'il serait vain et, chose plus importante encore pour les clients, économiquement injustifié, de vouloir soustraire aux traducteurs. [Début]

* * *

Qu'est-ce que l'effet Mozart dans l'univers GILT ?

Contrairement à ce que pourraient penser les bien informé(e)s, la théorie n'a rien à voir avec le fameux effet Mozart du Docteur Tomatis (le Mozart effect cher à Don Campbell), soi-disant bénéfique au QI.

En bref, voici ce dont il s'agit, selon Rory Cowan, PDG de Lionbridge Technologies, actuellement n° 1 de la localisation dans le monde :
Si, en 1790, il fallait cinq musiciens pour interpréter un quintette de Mozart durant tant de minutes, aujourd'hui, en dépit des progrès techniques considérables qui ont été accomplis depuis, rien n'a changé : il faut toujours autant de musiciens jouant pendant autant de temps pour restituer la même œuvre !
Cette belle métaphore sur l'incompressibilité de certains délais d'exécution souligne implicitement les limites de la technologie galopante, qui ne pourra jamais répondre à tout sans intervention humaine, notamment au plan de la productivité.

Des traducteurs en ce qui nous concerne. D'où l'inutilité de toujours les presser ... comme des citrons trop mûrs, en leur demandant à tort et à travers la quadrature du triangle !

Car à force de véhiculer un tas d'idées préconçues sur l'activité des traducteurs, par exemple en assimilant toujours plus le résultat de leur travail à une "commodité", on en finit par perdre de vue combien est fausse et nocive cette notion de commoditisation de la traduction. D'abord, une commodité en français (agrément, avantage, confort, utilité, ...) n'a absolument rien à voir avec la "commodity" anglo-saxonne, qui désigne un produit de base, une matière première.

Nous y voilà : traduction = marchandise, et plus la quantité est importante, plus la remise doit être conséquente. Or c'est oublier un peu vite le fait que la traduction n'est pas un produit comme un autre, mais un service à haute valeur ajoutée d'autant plus spécialisé que le domaine est pointu, et que la seule matière première utilisée servant à la "fabriquer" est la matière grise du traducteur. Dont la logique objective est très exactement inverse à celle du client : plus la quantité est importante, plus ça va me demander de temps et d'effort pour maintenir le même niveau de qualité de bout en bout. Une qualité qui n'est pas acquise par enchantement, mais conquise de haute lutte. Dans la durée.

Une réalité sur laquelle les clients - et les agences qui les secondent dans cette approche pour les conserver à tout prix (c'est le cas de dire) - font trop souvent l'impasse, ce qui contribue à ternir l'image d'une profession en vérité hautement spécialisée, exigeant des années et des années de pratique et de formation continues avant de donner de bons ouvriers. De plus en plus rares. Or tout ce qui est rare est cher, qu'on se le dise.

Ce n'est d'ailleurs pas moi qui le décrète, mais la loi du marché. Dura lex, sed lex ! [Début]


P.S. Petit glossaire GILT, sans prétention aucune :
  • Globalisation (G11N) : concerne tous les aspects de l'entreprise liés à la mondialisation de sa présence, sa marque, son image, ses produits/services, etc., et par conséquent l'intégration de tous les facteurs exogènes (externes à l'entreprise : économie, politique, technologies, social, etc.) et endogènes (internes à l'entreprise : processus métiers, marketing, ventes, SAV, suivi clients, etc.) au niveau planétaire.
  • Internationalisation (I18N) : conception technique native d’un produit/service en vue de sa localisation, de sorte qu'on puisse lui appliquer les différentes conventions linguistiques et culturelles propres aux pays cibles sans devoir à chaque fois tout reprendre à zéro. Attention toutefois à la polysémie du terme, puisqu'il ne s'agit pas de la même chose selon la nature du produit/service, logiciel, site Web, etc.
  • Localisation (L10N) : modification finale des produits/services pour prendre en compte les spécificités inhérentes aux marchés cibles ; touche tous les aspects de la commercialisation : conditionnement, documentation, promotion, etc. La localisation s'oppose à la standardisation, où seul change le message, forcément traduit/adapté.
  • Traduction : après des millénaires de bons et loyaux services (quoi qu'en pensent les adeptes du traduttore = traditore), le terme et les réalités qu'il cache restent à définir, plus de 35 ans de métier n'ayant pas encore suffi à me fournir une réponse définitive !
N.B. De même que les sigles anglais TM et MT sont de faux-amis (voir plus loin), et que TM anglais (Translation Memory) = MT français (Mémoire de Traduction), on évitera de confondre les sigles français TA et TAO : TA est la Traduction Automatique (cf. 1 et 2), alors que TAO désigne l'environnement et les outils de Traduction Assistée par Ordinateur (CAT en anglais) qu'utilisent les traducteurs dans leur travail quotidien. Autres définitions :
  • Language Service Providers (LSPs) : fournisseurs de services linguistiques. En général, ce sont les maîtres d'ouvrage qui sous-traitent les projets aux MLVs et/ou SLVs. Une vingtaine d'acteurs majeurs au niveau mondial.
  • Multi-Language Vendors & Single-Language Vendors (MLVs & SLVs) : fournisseurs de services multilingues ou unilingues, capables de prendre en charge soit une large gamme de langues/services, soit une seule et/ou un nombre limité de langues/services.
  • Independent Software Vendors (ISVs) : les éditeurs de logiciels indépendants qui développent des outils propres au marché linguistique : mémoires de traduction (TM - translation memory), traduction automatique (MT - machine translation), gestion terminologique (terminology management), etc.
  • LISA - Localisation Industry Standards Association, également éditeur d'un Guide d’introduction à l’industrie de la localisation (en français)
  • GALA - Globalisation and Localisation Association
  • I18N Guy : site-ressource très fourni sur l'industrie GILT (en anglais)
  • Translator : traducteur, le dernier maillon de la chaîne (celui qu'on fait sauter à l'occurrence), qui n'a pas dit son dernier mot...
[Début]

, , , , , , , ,

mardi 13 février 2007

Transclusion: Fixing Electronic Literature = TransLiterature

Transclusion : Fixing Electronic Literature = TransLiterature

Titre un peu abscons en apparence, que je vais m'efforcer d'expliquer. Billet enfoui dans mes désirs depuis des mois, qui jaillit ENFIN à la faveur d'une lecture sur l'Agent rank (à quand le Safe rank...), un brevet présenté sur Search Engine Land et qui consisterait à classer les pages en fonction des sources d'informations qui y sont liées, notamment en les scorant d'après la signature numérique de leur(s) auteur(s) :
The present invention provides methods and apparatus, including computer program products, implementing techniques for searching and ranking linked information sources. The techniques include receiving multiple content items from a corpus of content items; receiving digital signatures each made by one of multiple agents, each digital signature associating one of the agents with one or more of the content items; and assigning a score to a first agent of the multiple agents, wherein the score is based upon the content items associated with the first agent by the digital signatures.
Or Bill Slawski conclut son exposé en mentionnant Ted Nelson, l'un des pionniers de l'hypertexte, et en nous renvoyant à une présentation faite par ce dernier dans les locaux de Google le 29 janvier dernier, intitulée Transclusion: Fixing Electronic Literature.


Nelson, 70 ans, dont j'ai déjà eu l'occasion de parler à propos du palimptexte, définit ainsi la transclusion, selon Pierre de La Coste :
Nelson parle de "Transclusion" pour désigner en quelque sorte le lien hypertexte "parfait" : un fragment d’un texte inclus comme une citation dans un autre texte.
Enfin, last but not least, l’hypertexte ainsi conçu doit gérer les droits d’auteur. C’est-à-dire qu’un système "franc et honnête" calcule ce que doit payer le lecteur à chacun des auteurs des textes reliés entre eux par des liens hypertextes et qu’il visite successivement. Cette conception idéale de l’hypertexte, effectivement non retenue par les créateurs du web, pose quelques problèmes pratiques qui sont loin d’être résolus. Tout d’abord, il met en cause le code informatique tel qu’il existe, notamment dans le langage HTML, dont le tort, selon Ted Nelson est "d’encapsuler" le texte par des balises informatiques.
Concrètement, la transclusion est déjà possible sur Viabloga, et David Latapie propose de l'adapter à Wikipédia.

Quant à l'aspect "gestion des droits d'auteur", désigné par Nelson sous l'appellation de Transcopyright, vous pouvez avoir une idée de son fonctionnement ici (cliquer sur les liens pour mieux comprendre). Une notion qui n'a rien de simpliste, puisqu'elle a fait l'objet d'une conceptualisation poussée de la part de son auteur :


Mais la découverte que j'ai faite il y a quelques mois à propos de Nelson et qui m'a laissée sans voix est celle-ci : la vision qu'il a de son projet humaniste, A humanist Design, est regroupée sous le concept de Transliterature, marque déposée « non pas pour des raisons commerciales mais pour éviter des détournements sémantiques » ("Transliterature" is trademarked not for commercial purposes but to avoid semantic creep. Our trademarked terms may be used only for what exactly fits our specs-- with no additional features.).

Or savez-vous qui avait enregistré Transliterature.net dès novembre 1999 ? Moi !!! En même temps que traducteur.org/traduire.org, dictionnaires.net, etc. Je ne l'ai abandonné que deux ans plus tard (j'ai retrouvé la lettre de dédit que j'avais envoyée à Tiscali, elle date du 8 octobre 2001) !

Mais le plus bizarre, c'est que quelques mois avant d'enregistrer ce nom, j'avais réalisé un texte poétique uniquement à base de « transclusions », ou de « transquotations » si vous préférez, que m'avait inspiré une visite à la Villa de l'empereur Hadrien, à Tivoli (près de Rome), dont les mémoires sont parvenues jusqu'à nous...

Ce texte est un collage de fragments puisés çà et là, dont la beauté ou la force m'avait marqué. Je vous le livre tel quel :
HOSPITALIA

Un escalier qui ne conduit nulle part grimpe autour de la maison. Il n’y a, d’ailleurs, ni portes ni fenêtres. On voit sur le toit, on imagine plutôt, absorbé dans ses contemplations, un homme exilé en attente sur le seuil de l’oubli, éperdu « au bord de l’infini ». Un croissant de lune très fin incise le ciel, faucille d’or négligemment jetée dans le champ des galaxies, lorsqu’une étoile filante raie le diamant noir de la nuit. « Rien n’approche du bruit qui accompagne l’éclosion de certaines œuvres trop brillantes si ce n’est l’intensité du magnifique silence qui suit », pense-t-il. « Vite, fais un vœu ! » …

Voilà, aussitôt dit aussitôt fait. En secret. Cet homme c’est moi, bien sûr : assumer l’écart, et constituer l’exil comme lieu d’observation, centre d’expérimentation, point de perspective. Une terrible envie de le dire à tout le monde me saisit. Mais le dire comment ? Le crier sur le toit ? Ce serait le comble ! Chose singulière, il va me falloir inventer une langue inédite dont je ne connais pour l’instant que les deux premiers vocables : Utopie et Réalité. Couple antinomique s’il en est, encore à marier, mais comment ?

Rien de plus simple, il suffit de RÉALISER L’UTOPIE !!! C’est bien un vœu de poète ça, un rêve de poète même. Le poète est un doux rêveur, c’est connu. Pourtant, campé sur son toit, tantôt debout, comme le voyageur nocturne dont on n’aperçoit plus que le profil perdu dans la sombre embrasure d’une gare, tantôt assis, tel l’apatride sur son rocher faisant face à l’océan, toujours penseur, le poète est dans une position difficile et souvent périlleuse, à l’intersection de deux plans au tranchant cruellement acéré (la ligne de faîte), celui du rêve et celui de la réalité.

Funambule à la recherche d’un point de fuite jamais atteint, il déambule d’une marche incertaine et précaire sur le vide, aspiré par en haut, attiré par en bas, en revenant toujours au même endroit et en tournant en rond, — comme le fait d’ailleurs de son côté la terre sur laquelle sans fin nous cheminons, cette roue giratoire qui continuerait à tourner jusqu’à l’éternité sans l’usure progressive et irrémédiable de l’axe — en cherchant à remplir de son esprit et de sa sensibilité l’abîme vertigineux de la distance, à réinventer ce réel dont la poésie nous rapproche, de lueur en lueur, à croire que nous allons enfin le saisir, que son secret est sur le point de se révéler à nous dans les mots du poème, qu’il n’est plus qu’un pas, un seul pas à franchir et nous allons savoir, notre attente enfin va être comblée. Mais la transparence ne supprime pas l’invisible, l’ultime, la mince, l’infranchissable frontière : la promesse demeure sans fin promesse d’un horizon toujours reculé.

Or le vœu n’est-il pas promesse en même temps que désir ? Et ce que nous appelons promesse entre les hommes n’est-il pas nommé vœu au regard de Dieu ? Et que dire du rêve ? Encore un mot qui doit changer d’acception, prêt à mourir usé, effacé, fruste comme une de ces très vieilles médailles qui semblent avoir fondu lentement dans nos doigts.

Le poète entend plutôt par rêve l’état où la conscience est portée à son plus haut degré de perception : une perception vraie parce qu’elle relève d’un monde frais éclos et balbutiant, où le dedans et le dehors peuvent permuter, où la conscience est habitée par le monde et vice versa. Il faut avoir innée la puissance du rêve… Utopie et Réalité, deux mots bien accouplés qui le font jaillir, nuance à nuance, une image inouïe, une image qui coupe à vif dans les dimensions primitives du monde. Le poète le sent, et il sait bien que seul le rêve (ou la prière) est propre à provoquer une telle émotion. Lors sa voix murmure, une voix un peu étouffée, des choses quotidiennes, humbles (bouleversantes), et voilà que, peu à peu, dans la plénitude de ce murmure, nous comprenons, nous sentons que notre vie, la vie est concernée par cette voix qui devient celle non plus du poète mais du poème même, où ce qui parle dans le poème c’est plus une nature qu’une culture, ou alors une culture qui reflète cette communion spontanée de l’homme et de la nature, cette fusion du sensible et du sens, où le mot semble encore une image brute et non un signe...

Les mots se sont perdus tout le long du chemin
Les mots n’ont plus de sens
D’ailleurs on n’a plus besoin de mots pour se comprendre
Il n’y a plus rien à dire
Le vent est arrivé — une parole de vent toute intérieure mais suspendue
Le monde se retire
L’autre côté
Je vois l’autre côté du monde
Le côté caché, le plus important
Celui où doit avoir lieu le réel dénouement


Rome, samedi 24 juillet 1999, 17h18’
Voilà. Si vous le souhaitez, vous pouvez télécharger un fichier .DOC où j'avais noté en vrac une partie des sources. Ce travail, inachevé (dans mon idée d'alors, ce qui précède n'était que le début), restera à l'état d'ébauche, ne vous attendez donc pas à quelque chose d'exhaustif, c'est juste pour vous donner un aperçu de la genèse du texte.

Je conclurai en citant Ted Nelson, qui commence son intervention par ces mots : « The clearer is your vision, the harder it is to explain… », et termine en disant : « I guess Google would do that… »


, , , , , ,

jeudi 8 février 2007

No intervening human linguists: est-ce la GALE, Docteur ?

En commentaire à un billet intitulé Les traducteurs, espèce en voie d'extinction ?, j'observe :
En voie d'extinction, sûrement pas, mais en voie de transformation profonde, certainement. Même si apparemment beaucoup des parties prenantes n'en ont pas encore pris conscience.

On ne peut plus traduire sur et via Internet comme on le faisait AVANT Internet, et les logiques de nivellement par le bas à l'œuvre sur les différentes places de marché dédiées qui existent aujourd'hui font l'impasse sur ce que doit être une traduction de qualité, en finissant toujours par imposer aux traducteurs la quadrature du triangle...
Je voudrais donc développer davantage mon raisonnement, et, surtout, tenter d'expliquer pourquoi, selon moi, les métiers de la traduction vont subir bien plus tôt qu'ils ne le pensent des « transformations profondes », pour ne pas dire une véritable révolution.

Je vois deux grands axes d'évolution :
  1. la traduction automatique
  2. la localisation sans traduction

* * *

1. Traduction automatique


Eric Schmidt nous rappelait déjà en octobre 2005 que la traduction automatique (TA) pourrait aider à abolir les barrières linguistiques à la communication :
Larry and Sergey talked a little bit yesterday about some of the issues of automatic translation. And language has typically been a barrier for communication. If we can automatically translate between the two, that can help.
Il est d'ailleurs notoire que chez Google de nombreux ingénieurs s'y consacrent à plein temps :
Google also has an army of engineers working on automatic translation tools that would render information in any language intelligible in any other.
Ce n'est donc pas un hasard si en moins de 10 ans Google s'est hissé parmi les premiers acteurs mondiaux dans le domaine de la traduction automatique et pourrait bien nous réserver quelques surprises à l'avenir...

Mais Google n'est pas seul en lice. Dans son rapport 2007 de planification stratégique, la DARPA, mieux connue pour être à l'origine du défi Internet, nous annonce que l'un de ses développements clés à l'horizon 2010 va porter sur le traitement des langues, et plus spécialement sur une traduction automatique fiable en temps réel : Real-Time Accurate Language Translation, qui ne nécessitera plus l'intervention de traducteurs-interprètes humains. Directement du média à l'utilisateur !


Page 33 du rapport, fin de la section 3.7. Ce mode de traitement, qui fait partie du programme GALE (Global Autonomous Language Exploitation), prévoit trois phases :
  1. la transcription
  2. la traduction
  3. la distillation
La première étape pour pouvoir exploiter les données audio en langue étrangère à des fins de traduction consiste à convertir les discours en texte, c'est la transcription. Les américains nomment ça Speech to Text Transcription (STT). Après quoi le texte est traduit puis « distillé », l'ensemble des opérations étant automatisé par des moteurs de traitement (2.2 Transcription Engine ; 2.3 Translation Engine ; 2.4 Distillation Engine). Aperçu de ce dernier concept :


L'objectif est de parvenir à de très hauts niveaux de performances : 95% de fiabilité et 90-95% de cohérence/justesse sur les traductions depuis l'arabe et le chinois vers l'anglais, afin de pouvoir extraire et fournir des informations clés aux décideurs ayant un degré de pertinence égalant voire dépassant celui des humains.

Si on évalue grossièrement à 60% le degré de fiabilité des systèmes actuels, on peut se faire une idée des progrès qui seront accomplis. Disons qu'après 50 ans de tâtonnements de la recherche en TA, l'évolution sera significative dans les années à venir. Avec des conséquences qu'on peut aisément deviner pour les traducteurs, qui n'en sont plus à une révolution près ! D'ailleurs c'est écrit en toutes lettres :
GALE engines perform both of these processes in a completely automated fashion, without the intervention of human linguists.
Nous voilà fixés, si certains nourrissent encore quelques doutes. Car une fois au point, nous savons très bien que les technologies développées par les militaires sont ensuite industrialisées pour des usages civils. Il serait donc temps que nous remémorions le vieil adage : « Un traducteur averti en vaut deux... »

À noter que sur l'année 2007, la Darpa a budgété +84 millions US$ aux technologies de traduction du langage (language translation technologies), soit 7 millions par mois, ce qui s'appelle "se donner les moyens" ! (source : Human Language Technologies for Europe, p. 32, PDF - 7,7 Mo)

[Début]

* * *

Juste pour donner une idée de l'état de l'art en la matière, voici la synthèse d'un rapport publié par l'OTAN, Research & Technology Organisation, sur « La mise en œuvre des technologies de la parole et du langage dans les environnements militaires » (RTO-TR-IST-037) (PDF en anglais, 4,3 Mo) :
Les communications, le commandement et contrôle, le renseignement et les systèmes d’entraînement font de plus en plus appel à des composants issus des technologies vocales et du traitement du langage naturel : il s’agit de codeurs vocaux, de systèmes C2 à commande vocale, de la reconnaissance du locuteur et du langage, de systèmes de traduction, ainsi que de programmes automatisés d’entraînement. La mise en œuvre de ces technologies passe par la connaissance des performances des systèmes actuels, ainsi que des systèmes qui seront disponibles dans quelques années.
Etant donné l’intégration de plus en plus courante des technologies vocales et du traitement du langage naturel dans les systèmes militaires, il est important de sensibiliser tous ceux qui travaillent dans les domaines de la conception des systèmes et de la gestion des programmes aux capacités, ainsi qu’aux limitations des systèmes de traitement de la parole actuels. Ces personnes devraient également être informées de l’état actuel des travaux de recherche dans ces domaines, afin qu’ils puissent envisager les développements futurs. Cet aspect prendra beaucoup d’importance lors de la considération d’éventuelles améliorations à apporter à de futurs systèmes militaires.
Les textes contenus dans cette publication comprennent des communications sur l’état actuel des connaissances dans ce domaine, ainsi que sur des travaux de recherche en cours sur certaines technologies de la parole et du langage, à savoir : les techniques et les normes d’évaluation, la reconnaissance de la parole, l’identification linguistique, et la traduction.

Technologies déjà disponibles :

Décomposition du traitement de la parole (PDF, 12 Mo) :

[Début]
* * *

2. Localisation sans traduction

L'avenir souhaitable de la traduction sur Internet, selon moi, une évolution de la sphère GILT, une vision que j'ai déjà eu l'occasion de développer dans un discours sur la traduction technique professionnelle prononcé en 2003 à l'université de Rennes 2, lors du Colloque « Traduction et francophonie(s) ; traduire en francophonie », dont j'ai développé les conclusions dans ce billet.

Nous en sommes encore loin, c'est une évidence, même si je me plais à répéter une fois encore ces mots de M. Daniel Gouadec, qui résument parfaitement ma pensée :
L’une des évolutions à court terme pourrait donc porter sur l’assimilation de la « traduction » à une rédaction dans laquelle le document initial servirait uniquement de référence ou source d’informations qui, analysées et synthétisées par le traducteur, seraient ensuite reformulées ou réexprimées selon les contraintes posées par le public, le type de document, et les utilisations voulues ou prévues du document.

(...)

La meilleure façon de traduire est peut-être bien de rédiger d’abord et même de rédiger seulement.
Et dans une grande clairvoyance, il avait nommé ça la « naturalisation ». Le rêve de millions de PME qui voudraient pouvoir offrir (et s'offrir...) sur Internet une présence multilingue de qualité. La demande est là, qui va grandissante au fil des jours, ne reste plus qu'à créer l'offre.

Traducteurs, à bon entendeur...
[Début]


P.S. Pour finir en beauté, juste histoire de montrer que s'il est déjà difficile de se comprendre dans sa propre langue, que donnera le message une fois passé à la moulinette de la TA... [Début]

C'est en anglais, désolé :-) (Merci Emmanuelle)

, , , , , ,