samedi 31 janvier 2009

Google - Click Forensics : que cache la rumeur ?

Très étonné par cette affaire de fausse rumeur depuis avant-hier, j'essaie de m'expliquer le pourquoi du comment.

Or quelle n'a pas été ma surprise de découvrir sur le compte Twitter de Tom Cuthbert, fondateur et PDG de Click Forensics, qu'il cautionne lui-même cette rumeur dans deux messages twittés :
  1. l'un renvoyant vers le premier article à l'origine de la rumeur :


    en citant expressément ce paragraphe :
    Google and Click Forensics have often locked horns in the past over the rate of click fraud. Google has accused Click Forensics of being inept in its methodology and misleading in its results in order to make the problem seem bigger than it is. Meanwhile, Click Forensics has charged that Google has purposefully trivialized click fraud and mischaracterized it as a minor problem.
    Signalons pour autant que toute la partie graissée n'est qu'un copier-coller, liens compris, d'un paragraphe identique, écrit à la lettre près plusieurs mois auparavant... par le même journaliste (qui en plus étaye son "article" en citant un courriel remontant à 2007...) !

  2. l'autre définissant le billet de Search Engine Watch comme étant probablement le meilleur article jamais rédigé sur la question !


    Il est également repris dans la rubrique presse du site :

Alors même que celui-ci ne dit rien de nouveau mais se contente de réélaborer sur la base du premier, qui lui-même reprend des infos vieilles de plus de deux ans !

Bizarre, vous avez dit bizarre... Ou, juste par hasard, est-ce que la collaboration Google - Click Forensics ne battrait pas de l'aile ?


Partager sur Facebook

, , , , , , , , , , , , , , , , ,

Google - Click Forensics : la fausse rumeur monte...

Suite : Google - Click Forensics : que cache la rumeur ?


J'ai montré hier que le seul article à l'origine de cette rumeur se fondait sur un courriel datant de plus de deux ans, alors que l'article signé Juan Carlos Perez, d'IDG, n'avait été publié qu'avant-hier sur The Industry Standard !


Or hier The Industry Standard en remettait une couche, sous la signature d'un autre journaliste, Lincoln Spector :


Probablement satisfait de la montagne de rétroliens qu'a dû leur attirer le premier article, ce deuxième morceau de pure information ne fait rien d'autre que de répéter les mêmes choses, si ce n'est que pour mieux appuyer ses dires, il se base sur un autre article de Search Engine Watch, rédigé à partir des mêmes sources éculées...

Or la sauce commence à prendre,


et la rumeur à dépasser les frontières US !


J'ignore ce que dit le japonais, mais le titre italien, c'est "Google rejette les accusations de fraude aux clics" !

Encore à suivre...



Partager sur Facebook

P.S. Hier encore, sur son blog, Click Forensics déclarait :
But Google’s results showed an 18% growth in paid clicks and revenue. That’s just stellar. Since Google controls the large majority of the search market and 98+% of Google’s revenue comes from paid search, this means two things. One, Google is increasing market share. No news there. Two, the market as a whole is still growing at double-digit rates. That’s the real surprise and the truly good news.
À la limite, il y aurait même une troisième explication possible, qui coule de source....

, , , , , , , , , , , , , , , , ,

vendredi 30 janvier 2009

Google : en attendant GDrive...

Qui risque d'arriver plus vite que Godot...

Depuis bientôt 4 ans qu'on en parle (dès novembre 2005, ici, , ou encore), Google poursuit sa stratégie, imperturbable. Pour mémoire, rappelons que le leadership du moteur tournait (et tourne toujours...) autour de 4 grands thèmes :
  1. la rapidité de la recherche
  2. l'exhaustivité et la fraîcheur de l'information
  3. la pertinence
  4. l'interface utilisateur
Avec au cœur de la philosophie Google l'approche "Aucune contrainte" se déclinant initialement autour de 4 postulats :
  1. Pas de contrainte de puissance de traitement
  2. Pas de contrainte de capacités de stockage
  3. Pas de contrainte de bande passante
  4. Pas de contrainte liée à la monétisation des services...
Plus une offre de produits/services à l'internaute s'appuyant sur 3 piliers :
  1. la vitesse (un leitmotiv chez GG)
  2. le stockage intégral des données de l'utilisateur
  3. la transparence de la personnalisation

Le deuxième volet, Store 100% of User Data, expressément nommé GDrive par Google dans ses notes, était on ne peut plus explicite :
Stocker 100 % des données utilisateur

Le stockage illimité nous permettra d’héberger l’ensemble des fichiers des utilisateurs : courriels, historiques Web, images, signets, etc., pour les rendre accessibles depuis n'importe quelle application ou plate-forme.
Tous les efforts que nous avons déployés dans ce sens, avec des projets tels que GDrive, GDS ou Lighthouse, se sont heurtés jusqu’à présent aux contraintes imposées par des capacités de bande passante et de stockage limitées. À titre d’exemple, les développeurs de Firefox travaillent actuellement sur le stockage des données côté serveur, même s’ils n’envisagent d’emmagasiner que les URL et non pas l'intégralité des pages Web, pour des motifs de place.
Ce projet va nous permettre d’alléger le côté client pour concentrer toute la puissance côté serveur (thin client, thick server), un modèle qui renforce nos atouts vis-à-vis de Microsoft tout en offrant davantage de valeur ajoutée à l'utilisateur.
De plus, avec le 100 % stockage, la version en ligne de vos données va devenir votre copie de référence, votre original, alors que la version stockée sur votre ordinateur local fera plutôt fonction de cache, avec pour conséquence, et non des moindres, que les copies de vos données seront davantage sécurisées en ligne que sur votre propre ordinateur.
Une autre implication de ce projet est que 100 % des données utilisateur stockées sont mieux valorisées sur Internet, dès lors qu’elles sont accessibles et interopérables d’une application à l’autre. Exemple : un profil d'utilisateur Orkut devient plus intéressant s'il est accessible depuis Gmail (carnet d'adresses), depuis Lighthouse (liste d’accès), etc.
(À noter que j'avais traduit Golden copy par copie de référence en m'inspirant de ce billet, en anglais, particulièrement éclairant sur la question.)

Nous voyons donc aujourd'hui que Google ne change pas de cap, notamment à la lumière de récentes initiatives concernant la vitesse, GDrive ou la personnalisation "transparente", dont Alex Chitu nous dit en concluant :
Preferred Sites is an extension of Google SearchWiki, the feature that allowed you to make per-query changes. If the feature goes live to everyone, people will be able to pick a list of authoritative sites and influence all search results.
Or j'écrivais il y a 3 ans, dans mes commentaires aux diapositives 7 et 8 :
Quant à l'expérience Wiki appliquée à la recherche, si j'interprète bien le principe des Wikis, cela signifierait permettre à chaque internaute de modifier les pages à volonté pour rendre la recherche dynamique.
Ou comment la stratégie de Google se déploie sous nos yeux...

Je suis impressionné !


Partager sur Facebook

P.S. À mettre en parallèle avec l'absence quasi-totale de stratégie cohérente chez Microsoft ou Yahoo!

, , , , , , , , , , ,

Google et la fraude aux clics

Google - Click Forensics : la fausse rumeur monte...
Google - Click Forensics : que cache la rumeur ?

Comment réagit Google, face à ce problème qui refait surface assez régulièrement, au moins depuis 2006 (année où la fraude aurait coûté 666 millions $ aux annonceurs...) ? Signe que non seulement il n'est pas résolu, mais encore qu'il est en hausse constante, selon un communiqué récent de Click Forensics, et conformément à certaines prévisions.


D'après la terminologie française adoptée par Google, les "clics incorrects" sont détectés par diverses techniques avancées de détection, de filtrage et de contrôle, et communiqués aux annonceurs.



Google a également publié plusieurs rapports, dont celui d'un expert indépendant, M. Alexander Tuzhilin, et plus récemment un document intitulé Report on Third-Party Click Fraud Auditing. Vous pouvez aussi consulter ce doc de Boris et Eugene Mordkovich qui explique les mécanismes frauduleux.

D'ailleurs, Google collabore avec Click Forensics depuis l'année dernière. Or ce matin, je lis dans mes flux que Google contesterait le rapport à peine publié, d'après un email dont la teneur est la suivante :
These estimates continue to count clicks Google does not charge to advertisers as fraudulent, so they are not actually click fraud estimates, ... Furthermore, their estimates have never reflected the invalid click rates we see at Google, ...
Problème : l'article signé Juan Carlos Perez, d'IDG, a été publié hier !


alors qu'on retrouve trace du même email dès ... 2007, pour une affaire qualifiée de dépassée déjà à l'époque !

Ça n'empêche pas les internautes américains d'en débattre encore aujourd'hui, comme hier.

Donc, pour l'instant, je n'ai pas trouvé d'autres sources corroborant cette contestation par Google du rapport de Click Forensics, et l'info commence à être reprise telle quelle...


Mais qu'en penser pour autant ? Que le silence de Google face à ces chiffres et aux déclarations de Click Forensics (Google’s results showed an 18% growth in paid clicks and revenue. That’s just stellar.) est une confirmation implicite de leur réalité ? Et, si oui, à quand une réaction "officielle" ? À suivre...


Partager sur Facebook

P.S. À titre de comparaison, l'année dernière Google minimisait l'impact de la fraude en ne reconnaissant "officiellement" qu'un taux de clics incorrects qui passeraient ses filtres inférieur à 0,02% de l'ensemble des clics.


, , , , , , , , , , , , , , , , ,

mardi 27 janvier 2009

Adscriptor en nuages

Dans les commentaires de mon précédent billet, je réponds la chose suivante à Szarah :
À la question « Je me demande s'il serait possible de dégager la thématique véritable du discours au départ des mots », pour moi la réponse est évidente : OUI !
Je fantasme sur les nuages sémantiques depuis longtemps, et maintenant que je dispose d'outils pertinents pour en faire (binôme Quensis + Wordle), je souhaite vraiment approfondir ce filon d'une extrême richesse.
Si je devais faire un parallèle, je dirais que ça me fait penser à la graphologie.
L'écriture en dit toujours beaucoup plus qu'on ne croit sur le scripteur.
Dans les fréquences signifiantes autant que dans les hapax...
Dès le début de ma réflexion et du feedback à Exalead, l'idée était de créer un nuage de mots clés à partir de l'univers lexical d'un blog ou d'un site.

Je ne parlais pas de tags, qui sont plus ou moins ponctuels, mais d'une fonctionnalité qui indexerait l'intégralité d'un site ou d'un blog à un instant donné pour l'analyser et restituer les (co)occurrences plus significatives du blog ou site considéré. Ce type d'analyse intégrale serait censé faire ressortir des centres d'intérêt dont l'auteur n'est qu'à moitié conscient, c'est un peu le même principe que ce que font les chercheurs ou les universitaires lorsqu'ils analysent la sémantique d'une oeuvre, d'un livre.

Un peu comme si les tags étaient la partie consciente, délibérément choisis, alors qu'en revanche le principe du nuage sémantique serait de faire ressortir l' « inconscient », toujours très riche en enseignements.

Donc aujourd'hui que j'ai la possibilité de réaliser moi-même cette analyse en prenant Adscriptor comme cobaye, je ne vais pas m'en priver. J'ai ainsi réalisé trois nuages, les deux premiers à partir de mes tags pris à différents moments de l'évolution du blog :

- 21 tags sur 348 ayant une fréquence d'occurrences égale ou supérieure à 10 en septembre 2006 :


- 123 tags sur 800, dans la lignée de mes précédentes statistiques, ayant une fréquence d'occurrences égale ou supérieure à 7 en janvier 2009 :


et le troisième en analysant l'intégralité du contenu texte (sans les tags), soit 587 billets en 37 mois de blogging, pour un total de 522 944 mots avant traitement et 532 905 occurrences après traitement (apostrophes changées en retour chariot, etc). D'où une moyenne globale de 14 403 mots/mois et 908 mots/billet, soit pour arrondir 16 billets de 900 mots chacun par mois :


Donc si l'on enlève le tag "Actualités", qui représente la moitié du total des billets mais dont il est évident que le terme est absent de leur contenu, on voit bien qu'il y a une très forte corrélation entre les tags et les thèmes majeurs qui ressortent de l'analyse de plus de 530 000 mots !

Ainsi mon idée d'automatisation d'un système de nuages sémantiques prévoyait ce genre d'analyse, soit sur tout le contenu d'un blog/site, soit sur des thèmes donnés : analyser uniquement les billets tagués Google ou Facebook, par exemple. Cela permettrait une granularité encore plus fine, avec en sortie des nuages clicables (vers les billets où sont mentionnés les termes) et widgétisables. Mais Exalead n'en a pas voulu, dommage...

Ils ont pourtant lancé CloudViewTM, comme le rapporte François Bourdoncle dans cette interview.

Pour en revenir à mon blog, j'ai été fort étonné de la prépondérance absolue de GOOGLE (2447 fois), qui représente plus du double des deux occurrences significatives suivantes : INTERNET (1174 fois) et WEB (1074 fois, dont 154 fois pour Web 2.0). Ainsi, contrairement à ce que laissent supposer les tags, Google est beaucoup plus présent dans mes billets que je n'imaginais (avec une moyenne supérieure à 4 occurrences par billet !), Yahoo est traité davantage que Microsoft, et j'observe un déplacement progressif des questions techniques (référencement, monétisation, écriture Web, etc.) vers une vision plus large du Web et de l'Internet. Globalement, il y a cependant cohérence entre les tags et les thèmes qui se dégagent de l'analyse.

Voici le début du tableau :


Anecdote : le décompte me donne 4705 JE (3046 JE + 1659 J’) sur 532 905 occurrences, soit une moyenne d'utilisation de 9 sur 1000 (mais après tout ce blog est rédigé à la première personne), à peu près moitié moins que Sarkozy (17 fois sur 1000), dont le score est pourtant plus modeste qu'on ne pourrait le croire !


Partager sur Facebook

P.S. Une curiosité pour finir : ce billet est le 16e du mois et il fait environ 900 mots...

, , , , , ,

samedi 24 janvier 2009

Nicolas Sarkozy : l'Etat, c'est moi !

Suite chez Jean Véronis...

Pièce en un acte et combien de législatures ?

Il y a presque deux ans, j'écrivais dans Le sens et la valeur des mots :
Voilà pourquoi des textes tels que celui-ci me dérangent profondément. Je pourrais le reprendre dans son intégralité en le démontant paragraphe par paragraphe, phrase par phrase, pour en mettre à jour les rouages manipulateurs, les incohérences flagrantes, les faussetés doucereuses, les finalités à peine masquées (mieux ferrer le gogo). Peut-être un jour, quand ma colère retombera, si elle retombe (car impossible d'écrire objectivement sous son emprise), mais ce n'est pas pour demain.
Un texte dont Jean Véronis proposait le nuage suivant :


L'heure est donc venue de mettre mon projet à exécution, maintenant que je peux utiliser à volonté les outils de Quensis (site Web), pour procéder à un traitement statistique de ce texte et vous proposer mon analyse, très personnelle et sans aucune velléité, ni d'exhaustivité ni de rigueur scientifique.

C'est juste ce que je pense. Point, à la ligne.

En commençant par le nuage généré avec Wordle sur la base des 110 termes qui reviennent le plus dans ce discours, qui comprend 8645 occurrences une fois décortiqué.


Et une explication préalable sur ce SARKO qui trône au centre : pour une raison que je ne m'explique pas, Wordle n'accepte pas le JE ! En fait, lorsque j'ai chargé le fichier avec les 162 JE du discours, tous les autres mots apparaissaient sur le graphique, sauf le JE. Pas plus que le MOI en faisant l'essai.

Dès lors, mon choix de tester avec SARKO, qui représente précisément :
  • 129 fois le pronom JE :
    • 52 fois « je veux », 4 fois « je ne veux pas »
    • 24 fois « je propose » (dont une seule fois « je vous propose »)
    • 10 fois « je dis », 5 fois « je (vous) le dis »
    • 4 fois « je salue », etc.
  • 8 fois J' : j'affirme, j'ai proposé, j'ai envie, j'ai la conviction...
  • 8 fois MOI, dont 6 fois « La République pour moi c’est... »
  • 6 fois MON : devoir, ambition, projet, objectif (3 fois)
  • 5 fois ME + M' : je ne me résigne pas, on m'a répondu...
  • 3 fois MA : responsabilité, mission, volonté
  • 3 fois MES : mes amis, à mes yeux (2 fois)
Soit un total présidentiel de 162 occurrences ! Que j'ai toutes fondues initialement sous le JE, puis sous le SARKO que Wordle accepte volontiers en remplacement. D'où son poids disproportionné dans le graphique...

Mais ça ne s'arrête pas là, puisque nous avons 76 fois la République, 53 fois la France (dont 30 fois la France qui « veut »), 37 fois l’État, 29 fois la Nation !

Le tout pour un modeste total de 357 occurrences, dont un remarquable taux dépassant 45% d’occupation par le JE/MOI présidentiel...

Sans compter 68 fois « Elle », qui représente tantôt la Nation, tantôt la République, tantôt la France, que Sarko fait pratiquement parler à la troisième personne : « la France veut ». Ou encore, « La République, c’est… », « la République fraternelle dans laquelle JE crois. » (ça en fait au moins un...) :
Il y a bien une exception française auquel il est légitime que nous soyons attachés, non parce qu'il est la marque d'une quelconque supériorité par rapport aux autres, mais parce qu'il exprime ce que nous sommes et ce qui nous unit. Cette exception tient en trois mots : la Nation, la République, l'État. Cette exception est politique. Elle est intellectuelle. Elle est morale. Elle est culturelle.
C’est le miracle de la France...
C’est le miracle de la France...
C’est le miracle de la France...
C’est le miracle de la France...
C’est le miracle de la France...
C’est le miracle de la France...
Mais chacun sent bien que ce miracle est menacé.
(J'ai mis en gras les erreurs de syntaxe, dans un tel discours, ça la fout mal...)

Mais no problem, Sarko le thaumaturge arrive :
Dès lors, mon projet est simple : Je veux construire une nouvelle relation avec les Français, faite de vérité, de respect de la parole donnée, de confiance. Je veux un nouvel Etat, une nouvelle nation, une nouvelle République.
C'est simple, en effet. Simple et modeste. Comme le J majuscule après les deux points, normal pour un personnage majuscule, modestement primus inter pares. Tous les problèmes de la France, ne vous inquiétez pas, JE M'en charge !

- Nous, peut-être ? Pourrions-nous faire ça ensemble ? Avec nous, les français (21 fois), nous, les citoyens (11 fois, toutes occurrences confondues), nous, le peuple (8 fois) ?

Ah ! « La parole rendue au peuple, le pouvoir redonné au peuple, ... », fausse et illusoire promesse froidement contredite par un extraordinaire total de 40 occurrences, soit neuf fois moins que pour ELLE & LUI, la France et son époux, pardon Carla !

Idem pour le triptyque NOUS (24 fois) / Nos (8 fois) / Notre (13 fois) (dont 5 fois « notre République »), dont l'utilisation plus condescendante qu’autre chose est confirmée par l’emploi parcimonieux du VOUS : 15 fois en tout et pour tout, dont 6 fois dans les dernières lignes… (mais jamais ô grand jamais, ni votre, ni vos, … ni vaches et cochons).
Vous êtes la preuve vivante du contraire.
Vous êtes l’espérance qui ne veut pas s’éteindre.
Vous êtes les témoins d’une France qui veut renaître et qui ne craint ni le changement, ni l’avenir.
Vous êtes les témoins d’une France qui n’a pas peur de la rupture.
(…)
Je vous le promets, nous allons construire une France nouvelle dont vous serez les acteurs.
Magnifique envolée finale, peut-être avec un zeste de grandiloquence, mais pas trop, juste ce qu'il faut pour amener le lecteur, que dis-je ? l'auditeur, que dis-je ? le gogo, que dis-je ? le concitoyen (en deux mots), vers la chute, engageante, impliquante, et, pour tout dire, prégnante :
Je souhaite sceller un nouveau pacte avec tous les Français.
Promesse berlusconienne s'il en est, autant dire jamais tenue, limite berlusconnerie (berlusconata)…

Sarkozy est vraiment un type formidable, le roi des discours (mais pas seulement)...

Conclusion

Qu'est-ce qui cloche dans son discours (auquel on ne reprochera certes pas de manquer de volontarisme, le bonhomme est habitué) ? Oh, pas grand chose, juste un détail, à savoir que pour résoudre tous les problèmes de la France, un seul homme suffira, le troupeau des 60 et quelques millions de concitoyens n'a qu'à ME suivre, SARKO/ZORRO est arrivé, je vais tout résoudre tout seul, j'en ai la volonté, j'en ai la conviction, donc je vous le promets. Que ma parole vous suffise. Ou iriez-vous jusqu'à penser que je ne sois pas homme à honorer ma parole, peut-être ? Demandez à Édouard, à Jacques éventuellement, il s'en porteront garants...

Donc croyez-moi, suivez-moi, et si possible fermez vos gueules.

D'ailleurs avec Obama nous allons changer le monde, et vite...

Je vous le dis haut et fort ! Du reste, vous n'avez qu'à lire son discours : là où je proclame France & République, fort à propos il rétorque Amérique & Nation. Voyez son nuage, on dirait son pays :


Mais tiens, c'est bizarre, Barack, où es-tu passé ?


Partager sur Facebook

P.S. À noter que dans son discours (quatre fois moins long que celui de Sarkozy), Barack Obama utilise 3 fois le JE (répétons-le : 3 fois), contre 62 fois le NOUS, 68 fois le NOTRE/NOS et une dizaine de fois le VOUS/VOTRE/VOS !

Nous appellerons ça des visions diamétralement et TOTALEMENT opposées...

[MàJ - 23h45'] Suite à de vifs échanges en commentaire avec un certain "Christophe" qui m'a beaucoup énervé (j'ai horreur qu'on mette en doute mon honnêteté intellectuelle), un heureux concours de circonstances va me permettre de faire taire ce blanc-bec. En travaillant sur le nuage sémantique du discours sur la question raciale prononcé à Philadelphie par Obama, j'ai découvert de façon tout à fait fortuite Wordle advanced, qui inclut les pronoms dans le nuage, chose que je n'avais pas réussi à faire avec la version 1.0.

En fait, si vous avez 10 fois le mot NUAGE, au lieu de saisir 10 fois NUAGE l'un à la suite de l'autre, il suffit de faire NUAGE:10 ! Idem avec les pronoms, et ça marche ! Allez savoir...

J'ai donc repris le nuage contesté, en me basant cette fois sur celui de Jean Véronis en début de billet, en gardant le même poids spécifique à chaque terme, en ôtant le mot TOUR (sans aucune pertinence dans le discours) et en ajoutant JE (137 occurrences, j'ai viré MOI, MA, MES, etc.), VEUX (56 fois) et VEUT (36 fois), là où Jean n'avait retenu que VEULENT. Et si j'ai encore laissé de côté le pronom "Elle", c'est tout simplement parce que sa valeur n'est pas uniforme : tantôt Nation, tantôt France, tantôt République, etc. Alors qu'avec JE, le problème ne se pose pas ! Voici ce que ça donne :


Donc, Monsieur l'anonyme, vous avez sous les yeux un nuage reprenant exactement les mots de Sarkozy, sans en modifier les "déterminants" selon votre propre jargon. Ma question est : est-ce que ça change quoi que ce soit à mon analyse ?

[MàJ II - dimanche 25 janvier 2009] Je viens de voir dans mes stats que ce billet a été repris en Une de Médiapart !!!


, , , , , , , , , , , , , , ,

vendredi 23 janvier 2009

Obama dans un nuage ... sémantique

Comparer avec le nuage de Sarko...

Read Write Web a comparé le nuage sémantique du discours d'investiture d'Obama avec ceux de ses prédécesseurs. Intéressant, même si sur son Twitter, Simon Talvard-Balland nous dit qu'il préfère de loin celui du New York Times :


De plus, en survolant le nuage, vous voyez le nombre d'occurrences et en cliquant les termes apparaissent en contexte.

J'ai donc voulu tenter l'expérience en récupérant une version française du discours original, et en profitant des outils statistiques de Quensis pour créer un nuage équivalent, toujours en utilisant Wordle pour le rendu graphique mais en le débarrassant de tous les mots vides (articles, possessifs, démonstratifs, etc.). De plus je n'ai sélectionné que les termes allant jusqu'à 2 occurrences, pour coller davantage avec le nuage du NYT. Voici le résultat graphique :


Il y a évidemment quelques légères différences dues à la traduction, et il faudrait que je compare chaque occurrence respectivement dans le texte source et le texte cible pour avoir une analyse plus précise. Ceci étant, voici le tableau comparatif, qui comprend 61 entrées pour l'américain et 98 pour le français. Disons que ça correspond à un coefficient de foisonnement pour faire simple...


Cela me rappelle un article récent où il est question d'Obama et du bilinguisme, avec là encore une position originale, probablement l'une des nombreuses (r)évolutions auxquelles on peut s'attendre sous sa présidence, née sous le signe de la nouveauté ... à tous les niveaux, sous l'impulsion de la nouvelle équipe !

Parenthèse : Microsoft risque d'ailleurs de perdre un client important au profit du libre...

Donc, dès son installation à la Maison Blanche, Barack Obama s'est immédiatement mis au travail, et je profite de ce billet pour vous fournir quelques liens glanés ici et là.

- Le robots.txt d'Obama
- The Obama Generation
- une conséquence inattendue de l'investiture, et les répercussions au niveau des recherches sur le Web...
- etc. etc.

Sans oublier la Twitter World Map...




Partager sur Facebook

P.S. Voir également ce site, signalé par Olivier Ertzscheid.

, , , , , , , ,

mardi 20 janvier 2009

Barack Obama, Change has come to WhiteHouse!

Le premier billet de blog paru sur le site de la Maison Blanche est daté 20 janvier 2009 à 12h01', soit l'instant exact où Barack Obama devient le 44e et premier Président noir des États-Unis d'Amérique !


On retrouve d'ailleurs sur WhiteHouse.gov la même usabilité simple que sur Change.gov : Change has come to America... and to the World, we hope so! And so much!



Lire l'intégralité du discours d'investiture. Je voulais juste marquer ce grand moment...




Partager sur Facebook

, , , , , ,

Les 250 premiers sites du Web selon Linkscape

Linkscape vient d'être mis à jour et nous propose une sélection des 250 premiers sites du Web, calculée selon des métriques "maison" :


Voici maintenant les 20 premiers sites par nombre de liens externes pointant vers ces sites :


Première remarque, évidente : une fois confirmé le succès planétaire de Wikipedia, les quatre sites suivants appartiennent à la galaxie ... Google ! Qui totalisent à eux seuls plus de 240 millions de liens !!!

Donc en comparant avec MSN, bon dernier avec à peine plus de 7 millions de liens, on peut d'autant mieux saisir ces mots prononcés par Steve Ballmer le mois dernier :
Look, the fundamental basis for doing the search deal with Yahoo has to do with critical mass in the advertising marketplace. It doesn’t have to do with technology, or any of these other things, it really is a market phenomenon. Together we would have more advertisers….which means we’d have more relevant ads on our page. We’d have higher monetization levels possible in front of us because there would be more people bidding on more key words. Most importantly, Google would have perhaps a real credible competitor sooner.
En français : « La raison principale d'un deal avec Yahoo! Search, c'est de parvenir à une taille critique sur le marché de la publicité. Cela n'a rien à voir avec la technologie ou autre, c'est juste un problème de parts de marché. Ensemble, nous aurions plus d'annonceurs... Et par conséquent davantage de pubs pertinentes sur nos pages. D'où des niveaux de monétisation potentiellement plus élevés, grâce à un nombre accru d'enchères sur nos mots clés. Mais la chose peut-être plus importante, c'est que Google aurait enfin devant lui un véritable concurrent, crédible. »

J'y reviendrai.


Partager sur Facebook

P.S. Facebook n'arrive qu'en 72e position avec 1 468 698 liens (chose plutôt normale vu l'accessibilité "fermée" du site), 10 rangs derrière Twitter (+2 millions de liens).

Parmi les français, sauf erreur de ma part, je n'ai vu que Free (47e avec près de 3 millions de liens, 3 rangs derrière google.fr), Wanadoo (146e), Xiti (193e) et publicidees.com (237e).

, , , , , ,

dimanche 18 janvier 2009

Nous sommes tous des personnages publics !

Traditionnellement, on ne faisait plus trop de distinction entre personnage public et people, célébrité, star, etc.

Cela change désormais avec Internet, dès lors que du jour au lendemain Monsieur ou Madame Tout-le-monde peut potentiellement devenir un personnage public sans être célèbre pour autant, un Marc L. ou un Fred mis à nu de son plein gré ou contre...

Une histoire qui a suscité des vocations, des répliques, et des analyses.

Pour répondre à Szarah, cette affaire me rappelle celle d'Olivier Martinez. Mais a contrario.

Dans l'interview de l'internaute devenu "célèbre" malgré lui, à la question « Comptez-vous porter plainte ? », il répond :
Non, je n'ai pas grand chose à faire, toutes (c)es informations étaient accessibles.
Tout en précisant :
Toutes ces infos que j'ai publiées sur moi, elles étaient pour les gens qui m'entourent.
Or selon moi, le fait que quelqu'un collecte des données, certes accessibles, mais éparpillées, et les rassemble contre la volonté de la personne qui les a publiées, ou tout au moins sans l'informer ni obtenir son consentement au préalable, devrait être considéré comme un "traitement" de données - directement et indirectement - nominatives, à savoir des “informations qui permettent, sous quelque forme que ce soit, directement ou non, l’identification des personnes physiques auxquelles elles s’appliquent...”, qui contreviendrait ainsi aux dispositions générales de la loi n° 78-17 du 6 Janvier 1978 relative à l'informatique, aux fichiers et aux libertés, et ne remplirait donc pas les nécessaires "CONDITIONS DE LICÉITÉ DES TRAITEMENTS DE DONNÉES À CARACTÈRE PERSONNEL" :
Article 6

Un traitement ne peut porter que sur des données à caractère personnel qui satisfont aux conditions suivantes :
  1. Les données sont collectées et traitées de manière loyale et licite ;
  2. Elles sont collectées pour des finalités déterminées, explicites et légitimes et ne sont pas traitées ultérieurement de manière incompatible avec ces finalités. Toutefois, un traitement ultérieur de données à des fins statistiques ou à des fins de recherche scientifique ou historique est considéré comme compatible avec les finalités initiales de la collecte des données, s’il est réalisé dans le respect des principes et des procédures prévus au présent chapitre, au chapitre IV et à la section 1 du chapitre V ainsi qu’aux chapitres IX et X et s’il n’est pas utilisé pour prendre des décisions à l’égard des personnes concernées ;
  3. Elles sont adéquates, pertinentes et non excessives au regard des finalités pour lesquelles elles sont collectées et de leurs traitements ultérieurs ;
  4. Elles sont exactes, complètes et, si nécessaire, mises à jour ; les mesures appropriées doivent être prises pour que les données inexactes ou incomplètes au regard des finalités pour lesquelles elles sont collectées ou traitées soient effacées ou rectifiées ;
  5. Elles sont conservées sous une forme permettant l’identification des personnes concernées pendant une durée qui n’excède pas la durée nécessaire aux finalités pour lesquelles elles sont collectées et traitées.
Article 7

Un traitement de données à caractère personnel doit avoir reçu le consentement de la personne concernée ou satisfaire à l’une des conditions suivantes :
  1. Le respect d’une obligation légale incombant au responsable du traitement ;
  2. La sauvegarde de la vie de la personne concernée ;
  3. L’exécution d’une mission de service public dont est investi le responsable ou le destinataire du traitement ;
  4. L’exécution, soit d’un contrat auquel la personne concernée est partie, soit de mesures précontractuelles prises à la demande de celle-ci ;
  5. La réalisation de l’intérêt légitime poursuivi par le responsable du traitement ou par le destinataire, sous réserve de ne pas méconnaître l’intérêt ou les droits et libertés fondamentaux de la personne concernée.
Donc en lisant ce qui précède, il me semble bien que cette "collecte" et ce "traitement" de données à caractère personnel sans aucun consentement préalable serait de nature à porter une « atteinte aux droits de la personne résultant des fichiers ou des traitements informatiques », c'est pour le moins ce que me dicte le bon sens...

Et à qui objecterait qu'il s'agit là de "redivulgation de faits déjà licitement publiés", d'informations "anodines" ou encore de "faits publics ou faits qui ont été portés à la connaissance de tous en toute légalité", on pourrait facilement répliquer en citant le jugement prononcé dans l'affaire O. M. c/ S.N.C. Prisma Presse :
...attendu que la divulgation antérieure par le demandeur de faits relevant de sa vie privée, à supposer qu'elle soit suffisamment démontrée, ne saurait le priver de la possibilité d'agir en référé en raison d'atteintes postérieures non autorisées...
puisqu'après tout, selon la jurisprudence, « toute personne, quels que soient son rang, sa naissance, sa fortune, ses fonctions présentes ou à venir, a droit au respect de sa vie privée » (Civ. 1ère, 23 octobre 1990, Bull. n° 222), conformément à l'article 9 du Code civil.

Cela dit, le problème de l'identité numérique étant inévitable, autant s'y préparer, ce qui ne va pas de soi, contrairement aux apparences.

Donc à celles et ceux qui pensent comme les 57% de votants que la chose est sans intérêt :


je conseillerais de suivre attentivement la présentation par Me Olivier Itéanu du livre « L'identité numérique en question » :



En conclusion, cette affaire montre bien que, sur Internet, plus besoin d'être une vedette pour être livrés en pâture aux internautes, ce qui fait désormais de nous tous des personnages publics !


Partager sur Facebook

, , , , , , , , , , ,