dimanche 31 août 2008

Google et la traduction

English version

Bluffé depuis le début par la percée significative et ultra-rapide de Google dans la traduction automatique, voici longtemps que je prédis ses avancées éclatantes dans le domaine de la traduction, de nature à nous réserver bien des surprises.

À tel point qu'à l'instar de l'opérateur define:, de temps en temps je teste l'opérateur translate: juste pour voir s'il n'aurait pas été mis en place entre-temps. Or il semble qu'avec la translation onebox, le moment est venu ! (Via Google Live).

Apparemment, ça ne concerne aujourd'hui que les expressions courantes, même s'il est probable que cela puisse porter sur tous les termes qui renseignent déjà les dictionnaires de Google.


J'ai testé avec l'italien mais ça ne marche pas encore. Pour autant, il est probable que dès la mise à régime du futur centre de traduction de Google, cet opérateur ira également rechercher les traductions dans les bitextes qui peupleront la mémoire de traduction universelle quotidiennement élaborée par une armée de traductrices et de traducteurs.

Pour rappel, cette mémoire sert également à l'auto-apprentissage de Google, et par bitexte il faut comprendre que l'on a texte source (ou texte de départ) et texte cible (ou texte d'arrivée) en regard l'un de l'autre. Exemple.

Par ailleurs, l'opérateur semble ne pas fonctionner de la même manière que define:, où vous utilisez le terme anglais quelle que soit votre langue.

Alors qu'avec "translate", c'est apparemment l'opérateur qui définit la langue d'arrivée, puisqu'en saisissant translate ordinateur Google interprète directement le sens de traduction français vers anglais, tandis qu'avec traduire computer l'interprétation se fait de l'anglais vers le français.

Donc en nous livrant à un bref exercice de prospective, on peut très facilement imaginer que dans un avenir proche, non seulement Google pourra coupler par défaut l'opérateur à votre profil (en clair, sachant que vous êtes anglais, il vous proposera par défaut des termes traduits en anglais, sauf indications contraires de votre part), mais aussi, et surtout, qu'il pourra puiser pratiquement tous les termes du langage humain, dans toutes les langues, au fur et à mesure que sa notre mémoire de traduction universelle prendra forme.

Alimentée autant par les traducteurs humains qui utiliseront les outils de Google pour traduire, que par ses technos automatisées à grande échelle (à ne pas confondre avec le déploiement d'un système de traduction automatique en entreprise, par exemple), voire par la mise en parallèle des œuvres littéraires qui appartiennent au patrimoine de l'humanité et sont déjà traduites dans de nombreuses langues.

Pour les profanes, mettre en parallèle un texte c'est prendre Les Misérables de Hugo ou votre livre préféré, le segmenter et mettre en parallèle les segments du texte original avec les segments correspondants traduits dans la ou les langues de votre choix (à noter qu'un segment ne correspond pas forcément à une phrase, découpée en plusieurs segments si elle est trop longue, par exemple). Vous faites ça avec français-anglais, et vous avez la mémoire français-anglais des Misérables. Ensuite vous faites de même avec anglais-italien, espagnol-allemand, russe-chinois, etc., et vous obtenez autant de mémoires que de langues dans lesquelles l'ouvrage a été traduit.

La pierre de Rosette est un parfait exemple de textes mis en parallèle. Et pour me limiter à n'en mentionner qu'un seul autre, pensez aux milliers de traductions de la Bible qui existent déjà...

Donc ajoutez-y tous les grands classiques mondiaux déjà numérisés, construisez les mémoires de traduction correspondantes dans les couples de langues dont vous disposez, et vous comprendrez aisément qu'on n'est pas loin de pouvoir mettre en parallèle pratiquement l'ensemble du langage humain, à toutes les époques.

Depuis l'aube de l'humanité, nul n'a jamais été en mesure de faire ça. Jusqu'à Google...

Google et la traduction, on n'a pas fini d'en parler. En fait, on commence juste !


Partager sur Facebook

, , , , , , , , , , ,

samedi 30 août 2008

Le graphe social selon Google

Le graphe social selon Google

Après le graphe social de Facebook, voici celui selon Google !



Google Profile now supports Social Graph API, par Chris Messina sur Vimeo.

Ainsi j'ai découvert que nous pouvions tous avoir un profil sur Google, voici donc le mien !

Vraiment, Google profileur en série se ... profile de plus en plus à l'horizon.

Pour autant, jusqu'à ce jour, il me semble que ce "profil Google" était plutôt resté dans l'ombre, mais comme le souligne justement Frederic Lardinois, si Google commence à booster son API, il pourrait éventuellement s'en servir pour présenter "notre profil" comme l'élément central, ou, si vous préférez, comme le référentiel principal de notre identité numérique.

Je ne sais pas trop vers quoi tout ceci peut nous mener, mais les implications pourraient vraiment être énormes, comme toujours avec Google...

Car même si a priori toutes les données prises en compte sont par définition "publiques", une fois qu'elles seront centralisées en quantité (voir ici), cela joint aux phénoménales capacités de Google d'indexer tout ce qui bouge, je vois encore difficilement qui pourra concurrencer la plus grande superpuissance de la planète ! À moins d'un changement radical de culture, mais c'est pas encore pour demain...


Car jamais autant de données "publiques" n'auront été réunies sur - et autour - chacun de nous, et soyez sûrs que Google sait s'en servir...

En attendant, si vous voulez suivre la démonstration :




Partager sur Facebook

, , , , , , , , , , ,

Communication de Netvibes aux JO : aucune médaille !

Communication de Netvibes aux JO : aucune médaille !

Netvibes est-elle rentrée bredouille des Jeux Olympiques 2008 à Pékin ? Je vous laisse juges...

Toujours convaincu que la stratégie globale de Netvibes est sévèrement pénalisée par un fort déficit de communication, voici selon moi le dernier exemple en date.

En janvier de cette année, après avoir découvert par le plus grand des hasards l'annonce d'un partenariat Netvibes - Sohu - Maxthon en vue de promouvoir au niveau mondial l'échange des Universal Widgets de Netvibes à l'occasion des Jeux Olympiques de Pékin, je concluais ainsi un billet sur la communication de Netvibes :
Non, décidément, on ne m'enlèvera pas de l'idée que la communication de Netvibes est mauvaise. Ou mal adaptée, insuffisante, comme vous préférez. En tout cas, qu'elle n'est pas à la hauteur d'une société ayant un tel potentiel, une telle envergure, une telle ambition !

Et si un professionnel de la com veut bien me donner son avis, je suis preneur. Parce que là, je sèche !

(...)

Au final, avec toutes ces actus mirobolantes, espérons qu'on en entendra parler !
Vous en avez entendu parler, vous ?

Pas moi ! J'ai entendu parler des résultats mirobolants de ses partenaires, Sohu avec un résultat trimestriel en hausse de 162% (croissance supérieure à 600% d'une année sur l'autre !), boosté par le parrainage des Jeux Olympiques, et Maxthon déclarant dans la foulée que son navigateur bilingue aux couleurs des JO avait été téléchargé par plus de 4 millions d'utilisateurs :


Mais Netvibes, rien, blog muet, zéro pointé.

C'est tout juste si l'on apprend, là encore par hasard, que Sohu a localisé l'API Universal Widget...

Au bout du compte, peut-être en entendrons-nous parler aux prochaines journées de l'Open Web Asia '08, en tout cas il y aura ... Loïc Le Meur, ami du fondateur de Netvibes, Tariq Krim, mais je pense que la société, qui pouvait compter sur la vitrine exceptionnelle des JO, a perdu là une belle occasion de faire parler d'elle. Une de plus...


Partager sur Facebook

, , , , , , , ,

jeudi 28 août 2008

Facebook : 100 millions de membres !

Facebook : 100 millions de membres !

C'est officiel ! Mark Zuckerberg lui-même confirme ma seule prédiction pour 2008 !

L'autre, non formulée par la suite, aurait été la fusion-acquisition Microsoft-Yahoo!, il a donc mieux valu que je me taise...

Ainsi, il n'y aura pas eu besoin d'attendre début 2009 pour passer le cap des 100 millions, bien qu'il reste un décalage de 4 millions d'utilisateurs entre l'annonce et les statistiques fournies aujourd'hui sur le site, puisque sur 93 pays recensés, le détail ne totalise "que" 96 024 580 membres.


À comparer à mes précédents relevés pour suivre la croissance impressionnante de Facebook, le plus grand réseau social du monde :

- 20 octobre 2007 : +42 millions (31 pays)
- 20 décembre 2007 : +53 millions (47 pays)
- 9 mai 2008 : +71 millions (54 pays) (8 mars : +63 millions)
- 27 mai 2008 : +74 millions (81 pays)
- aujourd'hui, 28 août 2008 : +96 millions (93 pays)

Si je découvre comment faire une double courbe avec Excel (un truc dans ce genre, avec les millions sur un tracé et les pays sur l'autre), j'essaierai de vous illustrer cette progression. :-)


Partager sur Facebook

, , ,

mercredi 27 août 2008

The Big Tent - Denver - Colorado - DNC 2008

The Big Tent - Denver - Colorado - DNC 2008

Ce billet naît de la comparaison de deux façons différentes de traiter une info, chez Narvic, et Szarah.

Deux façons à la fois divergentes et complémentaires, deux points de vue originaux, comme toujours quand il s'agit de ces loustics (que Madame me pardonne :-).

Deux rectificatifs aussi : the Big Tent n'est pas une grande tente, comme son nom semblerait l'indiquer, et Google n'en est pas le promoteur. Tout juste un sponsor parmi d'autres, dont Digg et ... Dailymotion !


Voici un peu à quoi ça ressemble (qualité de son déplorable) :



Ici le son est meilleur mais la vidéo moins intéressante. des photos. Vous pouvez également suivre The Big Tent sur Twitter.

Ceci étant posé, il est vraiment intéressant de constater comment Google, pratiquement sans rien faire au plan de la communication, se voit promu organisateur de la chose, alors qu'il n'a rien à voir ni avec les fameux 100 dollars (quand bien même on pourra me rétorquer que c'est grâce aux sponsors que ces prix sont possibles), ni avec le reste. Il leur suffit de laisser dire et laisser faire, tout le monde s'en charge fort bien à leur place.

Et alors même que l'info officielle était en ligne depuis le ... 26 juin !

Ceci dit Google et d'autres sauront très certainement s'inspirer des retombées inattendues de ce sponsoring pour de prochaines occasions, voire pour faciliter l'émergence des nouveaux médias en vue de compenser le déclin du journalisme de terrain de leurs aînés grand public.

Même si en fin de compte, qu'on soit journaliste ou blogueur, les vraies questions restent celles des complémentarités et de la crédibilité de l'information, voire de son asymétrie...


Partager sur Facebook

P.S. Derrière le bureau de réception du Google Lounge, cette inscription : Google retreat...

Tout un programme, qu'on veuille jouer sur les mots ou non !

, , , , , , , , , , , , , ,

mardi 26 août 2008

Strates bloguesques

Strates bloguesques

Une réflexion pour marquer mon retour au blogging après quinze jours de repos, durant lesquels je ne me suis connecté qu'avec grande parcimonie, en n'observant Internet et tout le tintouin que de très loin.

Juste un chiffre sur Adscriptor : samedi 23 août, 80 visites et 92 pages vues. Cela me fait réfléchir au rapport entre valeur d'un blog et tout le travail qu'il y a derrière.

Si les stats de fréquentation sont censées mesurer la valeur d'un blog (car même si ce n'est pas le seul critère, c'est quand même un critère dominant, voire vendeur lorsqu'on parle pub), alors Adscriptor ne vaut pas grand chose. En tout cas pas toute la charge de travail nécessaire. Sans parler de l'absence de considération des ténors de la blogosphère franco-française.

Il va donc me falloir trouver d'autres critères de valeur pour justifier le bien-fondé d'un tel travail. Je n'entends d'ailleurs pas une justification vis-à-vis de mon lectorat, qui prend et laisse au gré de ses envies de façon tout à fait légitime, mais vis-à-vis de moi-même.

Car pourquoi vouloir faire à tout prix du contenu de qualité s'il n'est pas lu ? Ou si peu !

C'est le problème des strates que j'énonçais à Szarah, dont le biberon fut probablement rempli au lait coupé d'un grain de ciguë auparavant mis à macérer dans de la soude caustique (sourire) :
Je trouve en effet qu'il est dommage que le contenu d'un blog se résume au dernier billet publié et que dès qu'un billet a plus d'une semaine il ne vaut plus rien.
Ce n'est pas mon approche, ni mon attente.
Je n'écris pas des billets avec une date de péremption.
Or Internet me semble fonctionner à l'opposé : sur un blog le billet plus récent est la dernière strate s'ajoutant aux précédentes, qui sédimentent les unes après les autres et enfouissent toujours plus profondément des analyses ou des articles qui mériteraient certainement davantage que l'oubli les recouvrant.

En réalité un billet chasse l'autre à la vitesse du Web, c'est-à-dire plusieurs fois par jour, et au royaume de l'éphémère les blogueurs sont rois.

Au détriment du recul, de l'approfondissement et de l'analyse.

En parallèle, dans le cadre de ma recherche de modèles pour passer à Wordpress, sur la page d'accueil de la plateforme je trouve les chiffres suivants, pour aujourd'hui (stats en ce moment même, puisque ça change d'une seconde à l'autre...) : 3 913 485 blogs, 142 371 nouveaux billets, 48 918 920 mots.

Soit seulement 3,64% de blogueurs actifs pour ce 26 août (mais il est vrai qu'on est en vacances, il faudra voir en septembre), avec une moyenne inférieure à 344 mots par billet !
[MàJ - 17 heures plus tard] 3 920 094 blogs, 158 967 nouveaux billets et 50 788 180 mots, soit en gros 4% de blogueurs actifs et une moyenne autour de 320 mots par billet.
Le royaume de l'éphémère, disais-je. Car l'examen des stats enseigne que la recherche par catégorie est pratiquement inexistante, ou si faible que cela en devient négligeable, de même que la recherche plein texte sur tout le contenu du blog.

Comme si un blog n'avait vocation qu'à devenir au bout du compte « un pulvérisateur de dépêches hâtivement traitées çà et là », soit « (r)ien de très intéressant, en somme ». Pour moi.

Espérons que je ferai mieux dans les mois à venir.


Partager sur Facebook

, ,

lundi 11 août 2008

Adscriptor recherche un prestataire

Adscriptor recherche un prestataire

Dernier billet avant une quinzaine de jours de congés, rendez-vous fin août-début septembre.

J'en profite pour lancer un appel à un prestataire pour refondre complètement Adscriptor. Ça fait longtemps que je veux le faire et l'idéal dans les délais serait de pouvoir mettre en ligne la nouvelle version du blog début 2009.

Le cahier des charges consiste à passer de Blogger à Wordpress sous une charte graphique qui serait un mélange entre le modèle utilisé par Fred Cavazza (via Wordpress MU, impératif pour pouvoir gérer plusieurs blogs sous une même interface d'administration) et le très élégant Magazine Style Theme, du genre :


Ce n'est pas un absolu, mais ça sert juste à vous donner une idée. Les couleurs de fond qui me plaisent rappellent un peu celles du drapeau européen, le bleu marine profond et le jaune des étoiles.

Ceci dit, autant pour le modèle que pour les couleurs, je reste ouvert à toute suggestion émanant de graphistes de métier.

Si ça intéresse quelqu'un, vous pouvez m'envoyer vos idées à jmleray@studio92.net en m'indiquant la façon dont vous voyez les choses, y compris en me proposant des modèles alternatifs, et en me précisant vos délais et votre tarif. Je vous répondrai dès mon retour, ou dans la première semaine de septembre au plus tard.

Bonnes vacances
(et bon boulot pour les autres :-)