Adscriptor

lundi 31 juillet 2006

Google h9, the Ultimate Search Engine

II - Google h9, « crack the code »
Here is all the story in English...

Cet article fait suite à mon billet sur Google RS2, qui tentait d'éclaircir deux des mystérieux services de Google révélés par Tony Ruscoe et repris par Zorgloob en français. Noms de code : Google RS2 et Google Weaver.

J'avais consacré tout le corps du billet au premier, à mon avis un nom de code pour décrire un service de traduction automatique des flux de syndication (RSS), ayant vocation à traduire à la volée des fils RSS ou de podcasts de/vers n'importe quelle langue, et un simple post-scriptum à Weaver :

D'après moi, ce n'est ni une allusion au tisserand (traduction de weaver en français) ni à Google Health, mais à Sigourney Weaver dans Futurama (in Love and Rocket), qui double un personnage parodiant HAL 9000, le Supercomputer, « ordinateur exceptionnel doué d'intelligence et de parole », dans 2001 : l'odyssée de l'espace.

Or les observateurs de Google savent que HAL 9000 (h9) est un concept cher à Larry Page et Sergey Brin, qu'ils nomment volontiers The Ultimate Search Engine, concept auquel j'ai décidé de m'intéresser pour mieux comprendre ce à quoi ils se réfèrent par cette appellation de moteur de recherche ultime.

Google h9 - HAL 9000 - The Ultimate Search Engine

Diapositive n° 131 du Google Inc. Factory Tour du 19 mai 2005.

* * *

Les premières traces auxquelles j'ai pu remonter datent du 29 novrembre 2002, Paul fêtait le 1er anniversaire de sa joyeuse vie :

et Outre-Atlantique, Spencer Michels interviewait différentes personnalités du Net, dont les deux compères fondateurs de Google. Vidéo disponible ici :

La retranscription des propos de Page & Brin nous donne des indications précieuses :

LARRY PAGE: And, actually, the ultimate search engine, which would understand, you know, exactly what you wanted when you typed in a query, and it would give you the exact right thing back, in computer science we call that artificial intelligence. That means it would be smart, and we're a long ways from having smart computers.

SPENCER MICHELS: Sergey Brin thinks the ultimate search engine would be something like the computer named Hal in the movie 2001: A Space Odyssey.

SERGEY BRIN: Hal could... had a lot of information, could piece it together, could rationalize it. Now, hopefully, it would never... it would never have a bug like Hal did where he killed the occupants of the space ship. But that's what we're striving for, and I think we've made it a part of the way there.

Je crois que nous tenons ici l'explication précise du nom de code Weaver dans ces mots de Sergey Brin : « Hal ... pourrait disposer d'une quantité énorme d'informations, en recomposer le puzzle et les rationaliser. Ceci étant, il est à espérer qu'il n'attrapera jamais le même bogue que Hal 9000, qui finit par tuer les occupants du vaisseau spatial Discovery. Nous y travaillons, et je crois que nous sommes déjà sur la bonne voie... », puisque, dans Futura, Sigourney Weaver doublait un robot parodiant justement les travers de Hal !

* * *

The Ultimate Search Engine, selon Larry Page :

Le moteur de recherche ultime comprendrait précisément ce que vous voulez lorsque vous lui soumettez une requête, et vous donnerait la réponse exacte en retour, ce qu'on appelle l'intelligence artificielle en sciences de l'information. Ce qui signifie qu'il serait intelligent, et nous avons encore un long chemin à faire avant d'avoir des ordinateurs intelligents.

Je rappelle la date de l'interview : 29 novembre 2002.

Intelligence artificielle, on monte en puissance. Ce même Larry Page est d'ailleurs revenu sur ces thèmes chers à Google il n'y a pas longtemps, le 23 mai dernier à Londres, lors de la conférence Zeitgeist 06 : l'IA pourrait vite devenir une réalité, d'ici quelques années (AI could be a reality within a few years). Peter Norvig n'est-il pas un expert en IA ?

Selon les propos rapportés de Page, voici quelques-unes de ses déclarations :

People always make the assumption that we're done with search. That's very far from the case. We're probably only 5 percent of the way there. We want to create the ultimate search engine that can understand anything ... some people could call that artificial intelligence.
Et d'ajouter : ...a lot of our systems already use learning techniques.

(Les gens supposent toujours que nous avons déjà fait le tour de la question de la recherche. Or c'est très loin d'être le cas. Nous n'en sommes probablement qu'à 5% du chemin qu'il nous faudrait accomplir. Ce que nous voulons, c'est créer le moteur de recherche ultime, LE moteur de recherche, capable de TOUT comprendre, ce que d'aucuns nommeraient l'intelligence artificielle... Nombre de nos systèmes utilisent déjà des technologies d'apprentissage.)

Alors, Google, un simple moteur de recherche ?...

Jean-Marie Le Ray

P.S. Parmi les services dévoilés par le scoop de Tony Ruscoe se trouve un sybillin Google Guess. Je ne sais pas quel sera le leur, mais vous connaissez déjà le mien ;-)

En attendant, j'espère que vous aurez observé la différence de regard entre Hal et Paul : Hal a l'œil cyclopique d'un lapin albinos, tandis que les yeux de mon fils ont la couleur et la profondeur des océans...

N.B. Merci à Jean-Baptiste Boisseau, traducteur français de What is Web 2.0, l'article fondateur de Tim O'Reilly, lecteur assidu et attentif qui a remarqué mon erreur d'interprétation des mots de Page :

Les gens pensent toujours que Google = recherche. Loin s'en faut. La recherche ne représente probablement que 5% de ce que nous faisons.

Or comme je lui ai répondu en le remerciant, j'ai écrit ce billet animé par le sentiment de l'urgence. Carpe diem. Je ne voulais pas "perdre l'instant", tellement cette histoire me paraît énorme et que personne n'en parle. Sauf Adscriptor. Certes, si Search Engine Watch avait évoqué Google RS2 et Google Weaver/h9 dans l'article que Danny Sullivan publie aujourd'hui sur le sujet, l'impact serait tout autre et l'info ferait le tour du Web en moins de temps qu'il n'en faut pour le dire :-)

Actualités, Google, Weaver, AI, IA, intelligence artificielle, Google h9, h9, Hal 9000, Ultimate Search Engine, OR, outil de recherche, moteur, moteur de recherche, Google RS2, RS2, laboratoire de traduction, laboratoire de réflexion, Internet

Interview sur le Blog Emploi Challenge

Interviewé sur le Blog Emploi Challenge

Une très très brève, pour vous signaler la publication de mon interview dans le cadre du Blog Emploi Challenge :

J’ai déjà évoqué succinctement les raisons de ma canditature, or même si j'étais préparé, c'est quand même avec surprise que j'ai reçu le message de Bertrand Duperrin me demandant de bien vouloir répondre au questionnaire qui sert de canevas à l'initiative. En plein coup de feu à cause d'une grosse traduction à finir. Dilemme ! Que faire ? Temporiser, repousser l’invitation ?

Et puis non, finalement je me suis dis que certaines occasions ne passent qu’une fois, et qu’il y a des trains qu’il vaut mieux ne pas rater. Tant pis pour les nuits de travail en plus !

Alors voilà le résultat, écrit en 2 jours, dans l’urgence (comme beaucoup de mes billets), et bien que le texte soit perfectible, j’ai essayé de ne rien oublier, d’y caser l’essentiel ! Les 9 questions auxquelles je réponds :

Peux-tu te présenter en quelques mots et nous parler de ton parcours professionnel ?
Quelle est ta recherche aujourd’hui ?
Tu as ouvert un blog. Depuis quand le tiens-tu et pourquoi t’es-tu lancé dans cette démarche ?
Tu as une ligne éditoriale précise ? De quoi parles-tu ? Comment procèdes-tu ?
Que t’as amené ton blog jusqu’à présent (contact, réseau, rompre l’isolement, échanges, aidé à formuler ton projet….) ?
Et quelles sont les principales difficultés que tu as rencontrées au départ ? Et aujourd’hui ?
Que conseillerais-tu à quelqu’un qui voudrait se lancer également ?
Imagine que tu tires une « carte chance professionnelle » : le travail de tes rêves, avec le rôle que tu désires, dans le contexte que tu aimes, dans le secteur qui t’attire… celui que tu ne quitterais pour rien au monde. Raconte-nous à quoi tout cela ressemblerait.
Un dernier mot à l’adresse des recruteurs ?

Le développement ici.

Jean-Marie Le Ray

P.S. À noter pour les esthètes que j'ai réalisé moi-même la photo avec mon portable, donc à défaut d'être photogénique, elle a au moins le mérite d'être récente ;-)

Par ailleurs, si l’envie vous prend de laisser un commentaire, merci de bien vouloir le faire de préférence au bas de l’interview, et non pas sur ce blog.

Bonnes vacances aux chanceux d’une part, et bon boulot aux chanceux de l’autre :-)

Emploi, blogueur, challenge

samedi 29 juillet 2006

Google RS2, traducteur automatique de troisième génération

Google RS2, traducteur automatique de ~~deuxième~~ troisième génération

Here is all the story in English...

Préambule
Cadre de la situation
Qu'est-ce que Google RS2 ? (selon moi :-)
P.S. Qu'est-ce que Google h9 ? (toujours selon moi :-)

* * *

Préambule

Dans mon précédent billet, je vous invitais à lire une info de Zorgloob reprenant un scoop de Tony Ruscoe sur une panoplie de nouveaux services testés par Google.

Pas question de revenir sur le sujet, mais plutôt de tenter d'approfondir l'un de ces services, nom de code Google RS2, déjà déniché par Tony Ruscoe en juin dernier sans avoir la moindre idée de ce dont il s'agissait, et qui nous dit aujourd'hui que ce pourrait être une fonctionnalité en rapport avec le système de traduction automatique sur lequel travaille la firme, puisque le lien pointe vers Google Translate :

The link in the ‘My Account’ page points to Google Translate, so could it be anything to do with the statistical machine translation system that we know Google’s working on?

[Début]

* * *

Cadre de la situation

Étant passionné de traduction autant par goût que par métier, j'avais déjà eu l'occasion d'aborder Google et la traduction automatique, un billet dans lequel je traçais grossièrement les contours du système de Google, dont l'approche :

consiste à gaver les machines de milliards de mots de texte (ce n'est pas la matière première qui lui manque !), ce qu'on appelle la linguistique de corpus (parallèles, alignés ou non), en associant des corpus (ou corpora pour les puristes) monolingues à des bi-textes (en prenant par exemple un site bilingue, ou tri- ou n-lingue, dont les textes sont segmentés puis alignés afin de fournir une mémoire de traduction) pour y appliquer ensuite des techniques d'apprentissage statistiques permettant de construire des modèles de traduction.

Et de constater que Google était vraiment très fort, puisque, dernier arrivé dans le domaine de la TA (où les places sont chères, par ailleurs), la société se classait au premier rang (note : 0.5131) en devançant IBM (0.4646), etc., et en se détachant très nettement de Systran (0.1079), aussi bien pour la paire linguistique chinois-anglais qu'arabe-anglais, selon les résultats officiels de l'évaluation sur la traduction automatique faite par le National Institute of Standards and Technology : NIST 2005 - Machine Translation Evaluation Official Results.

Or l'édition 2006 s'est terminée hier, comme indiqué sur le Formulaire d'enregistrement au 2006 NIST Machine Translation Evaluation :

Donc, les participants ont reçu le test confidentiel de traduction automatique par courriel le 24 et l'ont rendu hier à 16h (12h EDT). Selon le protocole, le test devrait globalement se composer de textes (environ 40 mille mots), mais aussi de discours, il s'agit donc d'une évaluation données-voix. Documentation supplémentaire ici.

Pour preuve que Google a de la suite dans les idées, consultez les diapositives du Google Inc. Factory Tour du 19 mai 2005, et notamment les numéros 135 :

qui réaffirme la mission de Google, 136 :

puis de 137 à 140, qui donnent un aperçu de la précision du système (ici la n° 140) :

et enfin 145, dans le prolongement direct de ce qui précède et en rapport tout aussi direct avec ce qui suit...

[Début]

* * *

Première constatation

Le système de TA de Google est la fine fleur des technologies de pointe, ce qui se fait de mieux en la matière (le moment venu, nous verrons d'ailleurs si les résultats 2006 confirment ceux de 2005, mais je ne doute pas un instant que, là aussi, Google se classera premier), et n'a absolument aucun rapport avec ce qu'on trouve actuellement sur la page de Google translate, qui n'est autre que Systran (bien que ce ne soit pas mentionné sur sa page de FAQ). Donc, pour l'instant, Christophe Asselin a encore raison :-)

J'en ai d'ailleurs la preuve ! J'avais précédemment tenté une expérience, relatée ici, en retraduisant du français vers l'anglais, avec l'outil de TA de Yahoo (Babelfish), un extrait (traduit de l'anglais vers le français) de mon billet sur la dérive publicitaire sur Internet et les incohérences de Google, afin de tester la pertinence de la traduction automatique sur Internet. J'ai donc soumis le même extrait à Google translate :

Le résultat est concluant :

J'ai mis l'intégralité des deux traductions de l'extrait, identiques à la virgule près, dans un PDF téléchargeable, car le tableau est trop long et mange la moitié du billet, déjà abondant par lui-même... [Début]

* * *

Qu'est-ce que Google RS2 ? (My guess)

Selon moi, la première inférence, évidente, est que Google RS2 n'a absolument rien à voir avec la page vers laquelle renvoie le lien, ni même avec la fonctionnalité de TA telle qu'on la connaît aujourd'hui (Systran). Voilà deux jours que je me perds en conjectures sur la signification possible de RS2, qui ne me dit absolument rien comme acronyme lié à la traduction. Et pourtant, j'en connais des sigles. Alors quoi, so what ?

Je vous livre la conclusion de mes élucubrations, ou, pour mieux dire, de mon intuition : RS2, nom de code de Google, = RSS (S2 = deux "S"), et le lien avec la traduction serait la mise à disposition par Google d'un service de traduction automatique des flux de syndication, pour traduire à la volée des fils RSS ou de podcasts de/vers n'importe quelle langue (à plein régime, puisque selon toute probabilité, cette fonction sera initialement "bridée" aux langues principales...).

Un service de cette nature existe déjà : NATIVETEXT

« Service gratuit qui traduit les flux RSS des blogs et des podcasts dans votre langue. Ce service s’opére grâce à la communauté car la traduction se fait par les membres et non par un système informatique. On parle de Syndication de Langue d’Origine (Native Language Syndication)
Utilisation très simple :
- créez votre compte
- ajoutez votre flux
- choissisez vos langues de traductions
- répondez à un petit questionnaire pour renseigner les traducteurs
- bienvenue au reste du monde !! »

Source : Aurigance (pour une fois, c'est pas moi qui traduis :-)

Conclusion

La différence tient en un mot : le service de Nativetext est COMMUNAUTAIRE, celui de Google AUTOMATIQUE.
Oui, un mot qui fait toute la différence. [Début]

Jean-Marie Le Ray

P.S.1 Deuxième constatation

Cette hypothèse doit absolument être mise en rapport avec cette info : Google et la recherche vocale, puisqu'une fois que Google maîtrisera avec un degré de pertinence suffisant la traduction automatique du texte, et a fortiori de la voix, je vous laisse imaginer le reste...

~~RS2~~ P.S.2 Je me plante peut-être, et si vous avez autre chose à proposer, je suis preneur. Pour autant, je suis sûr de ne pas me tromper en affirmant que Google nous prépare quelque chose de révolutionnaire avec sa fonction de traduction automatique : texte-voix, Internet, vidéo, mobiles, Adsenses personnalisés, etc., qui pourra concurrencer Google ? Pas moi, c'est sûr :-)

P.S.3 Tiens, juste parce que je me sens en forme, je vous livre une autre intuition à propos de Weaver, dont Zorgloob nous dit : « aucune information sur ce service dont le lien pointe vers http://www.google.com/h9 ». D'après moi, ce n'est ni une allusion au tisserand (traduction de weaver en français) ni à Google Health, mais à Sigourney Weaver dans Futurama (in Love and Rocket), qui double un personnage parodiant HAL 9000, le Supercomputer, « ordinateur exceptionnel doué d'intelligence et de parole », dans 2001 : l'odyssée de l'espace.

Or en langage Google, HAL 9000 (h9) est « The Ultimate Search Engine » :

Diapositive n° 131 du Google Inc. Factory Tour du 19 mai 2005. On comprend pourquoi l'URL n'est plus accessible ! (moi, la photo, elle me fait penser à Big Brother...) [Début]

Pour approfondir (en français) :

I - Google h9, « the Ultimate Search Engine »
II - Google h9, « crack the code »

Actualités, Google, Google RS2, RS2, traduction automatique, traduction, TA, laboratoire de traduction, Google h9, h9, Hal 9000, Weaver, Ultimate Search Engine, OR, outil de recherche, moteur, moteur de recherche, laboratoire de réflexion, Internet

vendredi 28 juillet 2006

Google est la première marque mondiale en terme de progression

Google est la première marque mondiale en terme de progression

Un peu de potins. Publication du classement Interbrand / BusinessWeek 2006 des meilleures marques mondiales.

Pour la 6e année consécutive, ce classement annuel en valeur des meilleures marques mondiales identifie les 100 qui ont su le mieux développer des performances fortes sur un marché global hypercompétitif. Selon le communiqué de presse, « pour qu’une marque puisse intégrer le classement, celle-ci doit, par ailleurs, avoir une valeur supérieure à 2,7 milliards de dollars, faire 1/3 de ses revenus à l’étranger, rendre ses comptes publics et être intégrée à un grand nombre de marchés à travers le monde. »

Google, qui passe de la 38e place l'année dernière à la 24e en 2006, est le « gagnant toute catégorie de cette année ... avec une valeur qui augmente de 46 % ».

Comparatif avec le classement de Wired des entreprises les plus branchées (au vrai sens du terme :-)

Depuis que je m'intéresse à Google, j'ai toujours été bluffé par l'énergie que la firme de Mountain View met à construire sa brand recognition, ou reconnaissance de sa marque. Je crois qu'elle n'aura de cesse d'arriver à la première place. Rendez-vous dans 10 ans...

À noter en outre que sur les 16 sociétés du classement qui ont trait à l'informatique au sens large, seules cinq sont à proprement parler des entreprises de services Internet, puisque Microsoft, avec MSN, fait également partie de cette catégorie. Last but not least, 13 sur 16 sont américaines...

Vous avez dit suprématie ? Non, j'ai rien dit, moi...

Jean-Marie Le Ray

P.S. Pour toutes celles et ceux qui veulent connaître les dernières infos sur Google, un scoop (et un site) à ne pas perdre !

Actualités, Google, marque, brand recognition, statistiques, Interbrand, Business Week, Internet

Internet media à part entière : comparatif et mise en perspective

Après le billet écrit il y a une dizaine de jours sur Internet 2010 : prospective et mise en perspective, un article récemment publié sur BrandWeek, signé Mike Shields, me donne l'occasion de revenir sur certaines perspectives d'Internet à l'horizon ... 2011, c'est-à-dire dans un tout petit lustre.

Jupiter Research prévoit une forte croissance des dépenses publicitaires en ligne aux États-Unis dans les 5 ans à venir, pour atteindre 25,9 milliards $ en 2011, soit environ 9% de l'ensemble du marché publicitaire du pays. Quant aux dépenses consacrées par les acteurs économiques pour promotionner leurs produits/services sur les résultats des moteurs de recherche, elles vont passer de 41% à 43% des sommes investies en ligne sur la même période, la recherche se plaçant au premier rang des sources de revenus.

Des chiffres à rapprocher des statistiques que j'ai données dans mon précédent billet (tout en veillant à ne pas confondre e-commerce au sens large et dépenses publicitaires en ligne, celles-ci n'étant qu'une partie de celui-là), et à comparer à ceux de Yahoo, qui prévoit au niveau mondial 54,9 milliards $ en 2010 !

* * *

Bien qu'il soit difficile de faire un parallèle en prenant pour référence des pays différents, une étude récente conjointe TNS Media Intelligence et IAB (Internet Advertising Bureau), qui analyse la pub online en France, publie des chiffres qui donnent à réfléchir : près d'1 milliard d'euros d'investissements publicitaires sur le Web durant les premiers mois de 2006, soit une croissance de 57 % par rapport au même semestre 2005, avec la répartition sectorielle suivante :

voyage + tourisme : 29,7 %

informatique : 29,3 %

équipements sportifs : 25,2 %

télécommunications : 18,6 %

audiovisuel, photo, cinéma : 14,9 %

services : 11,8 %

distribution GMS (grandes et moyennes surfaces) : 7,6 %

Sources : données compilées à partir des différentes dépêches qui circulent, dont la plupart, soit dit en passant, se contentent de répéter ce que dit le voisin sans un minimum d'analyse. Ce n'est pas le cas d'Adscriptor, merci bien, qui souffre cependant d'une asymétrie de crédibilité dans l'information...

À comparer avec le tableau suivant, publié dans le baromètre du Journal du Net en juin 2006 :

Source : AdNetTrack / TNS Media Intelligence

Côté sites supports publicitaires, les trois premiers seraient Orange, Yahoo et MSN. Ceci étant, l'étude ne prend pas en compte les liens sponsorisés, et, donc, Google, qui est premier, selon Médiamétrie (audience de l'Internet en France en juin 2006), loin, loin devant Orange, avec près de 4 millions de visiteurs uniques en plus sur juin, une paille :

Pour la rime, une lacune de taille...

Côté comparatif avec l'étude américaine, en France aussi Internet s'accapare 9 % du marché publicitaire tous médias confondus, et aux États-Unis comme ici, le marché de la vidéo en ligne explose, puisque selon Forrester, les investissements dans le « rich media » vont connaître des taux de croissance annuels compris entre 21 et 27% au cours des cinq prochaines années, un « épanouissement » total, pour reprendre le terme de M. Jérôme de Labriffe, Président d'IAB France.

* * *

Conclusion

Parenthèse de paléontologie numérique :

Durant mes recherches pour rédiger ce billet, je suis tombé sur cette déclaration, qui remonte à un peu plus ... d'un lustre :

En 2000, l'Internet serait devenu le sixième grand média.
Toutefois, la publicité en ligne est-elle, dès aujourd'hui, une véritable source de chiffre d'affaires, tant en France que dans le reste du monde ? N'y a t-il pas pour l'heure un engouement spéculatif entretenu autour du Réseau des réseaux ?

L'étude de marché (Octobre 2000), intitulée La publicité sur internet, semble encore disponible pour la modique somme de 442 €, si ça vous intéresse...

Et cette autre :

Si vous vous demandez quels sont les 5 grands médias traditionnels :

1. Presse
2. Cinéma
3. Radio
4. Télévision
5. Affichage

Au moins, à présent nous connaissons la réponse ! Toutefois, la chose qui me rend perplexe, c'est qu'aujourd'hui on entend les mêmes propos circonspects sur les blogs (je vous prépare d'ailleurs un petit billet de derrière les fagots sur la question), qui ne laissent de me faire sourire. J'ai lu quelque part que pour ses études futures, le IAB a prévu de mieux segmenter les catégories de sites supports. Si vous voulez l'avis du soussigné, cher Monsieur de Labriffe, prenez en compte les blogs, ils sont appelés à un bel avenir, pérenne et prometteur :-)

Lien connexe : Internet 2010 : prospective et mise en perspective

Jean-Marie Le Ray

Actualités, Internet, marché publicitaire, Jupiter Research, IAB, IAB France, Internet Advertising Bureau, TNS Media Intelligence, Médiamétrie, sondages, recherche, statistiques, ecommerce, e-commerce, prospective

jeudi 27 juillet 2006

Professionnel indépendant : grand questionnaire de l'été !

Professionnel indépendant : grand questionnaire de l'été !

Je réponds à ce questionnaire qui m'a été transmis par Muriel (Electrablog), que je remercie :

#1 - Quand et quelle est votre prochaine prestation facturée ?

En début de semaine prochaine, pour la traduction d'environ 200 pages, encore à terminer (mais j'en suis à un stade avancé)...

#2 - Pour quelle raison reprendriez-vous une activité salariée classique ? Qu'est-ce qui vous manquerait le plus ?

- Pour un chèque avec un premier chiffre quelconque, suivi de plein plein de zéros, du genre G00000000000000000000000000000000000000000G10...
- Les chèques suivants :-)

#3 - Que fait un professionnel autonome l'été alors que ses clients sont à la plage ?

La plage étant à 7 km de chez moi, il est probable que j'y arriverais avant eux !

#4 - Décrivez votre principal outil de travail sans citer son nom.

Il n'y en a pas un mais plusieurs, en réseau, avec tout un tas de bigntz, de trucs et de schmurz : rétroverseurs de bougnazal, antivibreurs cystographiques, cadrans à baloches oscillantes, cribles thermo-fiduciaires, introspecteurs à longue durée, fouinasseurs à ondes courtes, stratagèmes géants montés sur chenilles, amalgameurs de fréquence à moulinette perforée, conjonctivites traceuses, prostateuses lentes à boule kère, enfigourées électriques, coltineuses de périphrases à syntaxe superposée, j'en passe et des meilleurs...

Sources : San-Antonio pour la première partie (Tango chinetoque, édition 1988), Victor Hugo pour la seconde (Hernani), c'est pas le même registre, je vous l'accorde, mais Totor aussi avait de l'humour.

#5 - Finalement, tout serait parfait si...

... j'étais en vacances :-)

INSTRUCTIONS :

- répondre à ce questionnaire sur son blog
- le faire passer à au moins une personne
- faire un trackback sur celui qui vous l'a transmis ou la présente note
- reproduire telles quelles ces 5 4 lignes en bas de votre note

Jean-Marie Le Ray

P.S. Si à la lecture de ce questionnaire engagé, vous sentez l'irrépressible besoin d'y répondre sur votre blog, vous gênez pas, je vous l'échange contre un lien (ne jamais perdre de vue le sens des affaires :-)

Voir quelques-un(e)s des répondeurs ici ou là.

Bon questionnaire aussi pour les participants au Blog Emploi Challenge, I comme ... information, indépendant, intermède ou interlude

[MàJ - 28 juillet 2006] Suite au commentaire de Jean-François et après avoir visité son blog, je me suis inscrit à Perso Web 2006. Vous voulez en savoir plus ?

Actualités, humour, intermède, interlude, vacances

mercredi 26 juillet 2006

Google communique les taux de clics invalides à ses annonceurs

Actualité oblige ! Ce qui n'était hier qu'une mise à jour passe à la une aujourd'hui. J'extrais donc la dernière partie de mon billet précédent pour en faire un article à part entière :

Quant à la fraude aux clics, un problème étroitement lié avec tout ce qui précède, avant-hier le blog officiel de Google a sorti l'info de la publication d'un rapport indépendant, diligenté dans le cadre d'un précédent procès et rédigé par le Professeur Alexander Tuzhilin, qui conclut, après 47 pages d'explications :
In summary, I have been asked to evaluate Google’s invalid click detection efforts and to conclude whether these efforts are reasonable or not. Based on my evaluation, I conclude that Google’s efforts to combat click fraud are reasonable.

En bref, j'ai été mandaté pour évaluer les actions entreprises par Google afin de détecter les clics invalides (ou abusifs), et pour conclure en déterminant si ces efforts étaient "raisonnables" ou non. Selon mes estimations, j'en conclus que les efforts déployés par Google pour combattre la fraude aux clics sont "raisonnables".
Qu'en termes choisis, ces choses-là sont dites ! Mais enfin, s'il le dit...

[MàJ - 25 juillet 2006] La conclusion (la seule à laquelle il pouvait parvenir) du Professeur Tuzhilin n'aura pas beaucoup servi à Google, dont la proposition de règlement devant la justice américaine a été rejetée par les parties adverses...

[Mercredi 26 juillet 2006, 18h] : probablement sous la pression d'une décision de justice lourde de conséquences (dans les jours qui viennent, une audience se tiendra devant le juge Joe Griffin, de l'Arkansas, saisi pour évaluer et satuer sur les objections faites à la proposition de règlement avancée par Google Inc. sur la fraude aux clics), la société de Mountain View a décidé de dévoiler aux annonceurs qui enchérissent sur les AdWords quel est le taux estimé de clics invalides sur leurs mots clés :

These clicks are filtered in real-time by our systems before advertisers are charged for them. The resulting data will of course differ from one advertiser to the next. In addition, a much smaller number of invalid clicks may also be credited to advertisers’ accounts after-the-fact, as the result of a publisher being terminated from the AdSense program for invalid click activity. These will appear as account-level credits.

Ces clics sont filtrés en temps réel par nos systèmes, avant que les annonceurs ne soient facturés dessus. Les résultats vont naturellement varier d'un annonceur à l'autre. En outre, une quantité moindre de clics invalides pourra aussi être créditée au compte de l'annonceur a posteriori, dès lors que l'éditeur responsable de la fraude aux clics aura été banni du programme AdSense. Ce crédit résultera au niveau du compte de l'annonceur.

Détails supplémentaires (je viens de voir que la traduction française officielle de Google pour « invalid clicks » est « clics incorrects », un euphémisme à mon avis, mais pour une fois, on ne va pas jouer sur les mots. Il faudra voir le niveau d'implantation terminologique :-)

Une petite révolution qui intervient ... moins d'une semaine avant l'audience, serait-ce un hasard ?

MàJ - 28 juillet 2006 : Règlement accepté !

Finalement, je me suis avancé un peu vite en pensant que le rapport du Professeur Tuzhilin n'aurait pas beaucoup servi à Google, qui en sera donc de sa poche pour 90 millions de dollars, le tribunal ayant décidé de rejeter les quelque 70 objections à la proposition de règlement de Google, jugée (c'est le cas de dire) « fair, reasonable and adequate », soit « honnête, raisonnable et appropriée ». Dont acte. Même si certains ne sont pas d'accord...

Lien connexe : La dérive publicitaire sur Internet : les incohérences de Google (entre autres)...

Jean-Marie Le Ray

Actualités, Google, Adsense, statistiques Adsense, Adwords, Web marketing, revenu par clic, RPC, CPC, CTR, TDC, RPM, CPM, monétisation, monétiser, fraude aux clics, click fraud, clics invalides, invalid clicks, invalid clicks rate, liens sponsorisés

Pages

lundi 31 juillet 2006

samedi 29 juillet 2006

vendredi 28 juillet 2006

jeudi 27 juillet 2006

mercredi 26 juillet 2006