vendredi 25 juillet 2008

L'index de Google : 1000 milliards de pages !

L'index de Google : 1000 milliards de pages !

C'est pas moi qui le dis !

Moi je dis juste : Google superlatif !

1000 milliards de pages ! Symbolique.

D'un autre côté, si on considérait dès 2001 que le Web profond (Deep Web) en contenait déjà 550 milliards, alors on se dit que Google a bien avancé, notamment au niveau de l'indexation des contenus dynamiques des bases de données ou des formulaires, mais n'est pas au bout de la tâche !

Car même si Google déclare :
We don't index every one of those trillion pages -- many of them are similar to each other, or represent auto-generated content similar to the calendar example that isn't very useful to searchers.
... pour savoir que les pages sont dupliquées, il faut déjà les avoir crawlées : « Ce graphe de 1000 milliards d'URL est semblable à une cartographie qui aurait 1000 milliards de nœuds » (This graph of one trillion URLs is similar to a map made up of one trillion intersections.) !!!

Et d'ajouter dans la foulée :
But we're proud to have the most comprehensive index of any search engine, and our goal always has been to index all the world's data.
Tout ça bien qu'il semble encore avoir quelques problèmes sur le Web profond, que ce soit délibéré ou non...


Partager sur Facebook

P.S. En outre, quand on pense à la techno derrière, on se dit que c'est pas demain la veille que le BrowseRank va rattraper le PageRank !

Même s'il y en a qui auraient besoin de plus que ça pour être impressionnés :
Here’s a trillion: 1,000,000,000,000

Here’s a googol: 10,000,000,000,000,000,000,
000,000,000,000,000,000,000,000,000,000,000,
000,000,000,000,000,000,000,000,000,000,000,
000,000,000,000,000.

When Google can google a googol URLs at once, then I’ll be impressed.
Excellent !

, , , , , ,

Google PageRank vs. Microsoft BrowseRank

Google PageRank vs. Microsoft BrowseRank

Je viens de lire sur Search Engine Land que Microsoft attaquerait Google superlatif sur la pertinence, en essayant de faire mieux que le PageRank avec le BrowseRank !!!

En gros, un algorithme de classement qui analyserait le comportement de navigation via l'historique du navigateur de l'internaute (est-ce que cela limiterait l'analyse à ceux qui utilisent Internet Explorer ?), et où les utilisateurs voteraient pour l'importance des pages...

On dirait que cela se rapproche de la recherche orientée Digg selon Google...

En comparant les algorithmes PageRank, TrustRank et BrowseRank, l'étude de Microsoft donne l'exemple de classement suivant :


Davantage d'explications ici (en) et (fr). J'ai l'impression que l'info va faire couler beaucoup d'encre, j'aurai sûrement l'occasion d'y revenir...

Mais est-ce cela dont Ballmer a déclaré hier devant les analystes : « But that’s the one thing I’m not going to talk about » ? Ce serait bien possible !



Partager sur Facebook

P.S. Je me demande pourquoi personne ne veut de mon SafeRank :-)

, , , , , ,

Wikio, un sondage surprenant !

Wikio, un sondage surprenant !

Paru sur PCInpact, les résultats de ce sondage sur Wikio sont pour le moins surprenants !


Sur près de 2 000 votants, 52,69% déclarent absolument ne pas savoir de quoi il s'agit, auxquels s'ajoutent presque 800 autres qui ont un avis pas franchement enthousiaste (un portail d'info parmi les autres, pas trop amateur, sais pas trop de quoi on cause, gadget parfaitement inutile...).

Seuls 58 votants (3,25%) déclarent que « Wikio est une référence incontournable du Web ».

Et les +130 commentaires sont à l'avenant.

C'est d'autant plus bizarre qu'on peut considérer PcInpact - dédié aux actualités informatique et multimédia - comme un site de geeks, dont il est vraiment difficile de penser qu'autant de visiteurs ignoreraient Wikio.

J'ai eu quelques échanges avec Nicolas Patte, auteur du sondage, auprès de qui je me suis étonné de la teneur des questions, puisque :
...sur 6 questions, mise à part la première, les 5 suivantes ont plus ou moins une connotation négative.
Donc vu qu'il s'agit d'un questionnaire à réponses obligées, ça laisse peut-être moins de chances pour dégager une opinion moins orientée.

Par exemple, sur une échelle de 5 questions, j'aurais choisi une formulation de ce genre :

1. très positive
2. positive
3. neutre
4. négative
5. très négative
Il m'a répondu en reconnaissant :
...une inclinaison légèrement négative du sondage, quoiqu'il ne soit pas forcément très loin de l'échelle logique que vous évoquez ("référence incontournable"/très positif, "j'y jette un oeil"/positif, "pas amateur"/neutre moins, "entendu parler"/neutre moins moins, "ignore absolument"/négatif, "gadget inutile"/très négatif). J'aurais pu sans doute faire un item avec "pas amateur" et "entendu parler" en neutralisant davantage, vous avez raison.

Reste, comme vous le dites, que la tendance lourde et les commentaires (plus de 100 à cette heure) sont très étonnants.
Nicolas, que je cite en ayant son accord, y voit également une analogie avec « l'histoire du cordonnier mal chaussé », où Wikio ne parvient pas, au final, « à bénéficier de ce qui fait sa raison d'être sinon son business model : le buzz », et où « le "buzzmaker" n'en génère aucun pour lui-même ».

J'ai personnellement une conclusion un peu différente, tout à fait subjective, en pensant que les résultats franchement peu flatteurs de ce sondage résonnent davantage comme un désaveu de Wikio plutôt que comme une ignorance généralisée de l'audience de PCInpact pour le portail de Pierre Chappaz.

L'une des raisons de ce "désengouement" devant probablement être recherchée dans la perception qu'ont beaucoup des commentateurs sur l'absence de valeur ajoutée du site.

J'ai déjà tenté plusieurs analyses de Wikio, notamment ici et , mais il me semble que ce sondage, même s'il est clair qu'il est à prendre avec les précautions d'usage, pose avec force cette question :
Quelle est aujourd'hui la valeur ajoutée de Wikio ?

Si Pierre ou quelqu'un de son équipe me lit, j'aimerais bien connaître leur opinion sur ce sondage et leurs réponses à la question ci-dessus.


En attendant, je pose cette même question au lectorat d'Adscriptor, à laquelle j'essaierai moi-même de répondre dans un prochain billet.



Partager sur Facebook

,

lundi 21 juillet 2008

Microsoft - Yahoo! : accord Yahoo! - Icahn !

Microsoft - Yahoo! : accord Yahoo! - Icahn !

[MàJ - 22 juillet, 22h30'] Bons résultats trimestriels de Yahoo! Les analystes sont plus mitigés, comme à leur habitude :-)

* * *

En vue de limiter les dégâts lors de l'assemblée générale des actionnaires du 1er août, le Conseil d'administration de Yahoo! et Carl Icahn viennent de trouver un accord :

- Huit des membres actuels du Conseil seront rééligibles : Roy Bostock, Ronald Burkle, Eric Hippeau, Vyomesh Joshi, Arthur Kern, Mary Agnes Wilderotter, Gary Wilson et Jerry Yang. Robert Kotick ne se représentera pas.

- Jerry Yang gardera son poste.

- La composition du CdA sera étendue à 11 membres. Carl Icahn sera donc nommé membre et les désignations aux deux sièges restants seront décidées sur recommandation du Comité de Gouvernance et des Nominations, notamment parmi les huit autres membres actuellement proposés par M. Icahn. Les deux candidats probables seraient Mark Cuban et Jonathan Miller, ex Président et CEO d'AOL.

- Carl Icahn, qui détient au total 68 786 320 d'actions, soit 4,98% du capital ordinaire de Yahoo!, ne présentera donc pas d'autres candidatures, ce qui permettra d'éviter la bataille de procuration. Il s'est déclaré très heureux :
I am very pleased that this settlement will allow me to work in partnership with Yahoo!'s Board and management team to help the Company achieve its full potential.
On pourra se demander pourquoi ce choix ? Est-ce le prélude à un futur accord avec Microsoft ? Les grandes manœuvres continuent...


Partager sur Facebook

, , , , , , , ,

Meetic

Meetic (et la bourse)

[MàJ - 25 juillet 2008] Résultats 1er semestre 2008 : 63M de C.A., dont 38 (+60%) dépensés en pub...


Citation :
Création du pôle « éditorial et trafic » de MEETIC au travers de VIOO, le site féminin 2.0 de MEETIC, mis en ligne mi-juillet 2008. On rappellera cependant que l’essentiel du surinvestissement marketing sera concentré sur les activités historiques du Groupe. Aucune nouvelle source de revenus ne sera générée par le pôle éditorial sur l’exercice en cours.
Avec un budget publicitaire de presque 210 000 euros/jour, difficile de concurrencer une telle force de frappe marketing !

* * *

Il y a longtemps que je voulais faire un billet sur Meetic, qui est l'un des acteurs incontournables du Web francophone, au même titre que Skyrock et d'autres success stories à la française.

Toutefois je ne vais ni m'étendre sur les débuts de Meetic ni vous détailler comment fonctionne le site de rencontres (tout est ici), mais plutôt choisir une approche différente, à savoir les rapports entre Meetic et la bourse. Qui semblent se détériorer au fur et à mesure que la société progresse, puisque depuis l'introduction en bourse (Octobre 2005), nous avons un CA journalier consolidé pratiquement multiplié par 3 en 3 ans, alors que sur la même période l'action a perdu 1/3 de sa valeur !

Jugez par vous-mêmes :


- CA journalier de 118 000 € en 2005
- CA journalier de 216 000 € en 2006
- CA journalier de 310 000 € en 2007

Idem pour le résultat net, multiplié par 2,5 entre 2005 et 2008, alors que l'évolution historique du cours semble en chute libre :


notamment depuis le début de l'année, au moment même où l'on a un CA journalier de 350 000 € au 31 mars 2008 !!!


Pourtant, d'un prix d'admission et d'émission fixé à 22,30 € par action le 13 octobre 2005 (correspondant au haut de la fourchette vu le succès de l'opération), nous en sommes arrivés à un cours de clôture à 15,22 € en fin de semaine dernière.

J'ai déjà souligné ce qui est selon moi un signe manifeste de démence des analystes financiers, qui sanctionnent à tout-va des résultats faramineux sans qu'on comprenne vraiment pourquoi, sinon l'irréfrénable envie de spéculer à l'infini sur des résultats n'ayant plus aucun rapport avec la réalité d'une gestion opérationnelle au jour le jour, effarouchés par la perspective du moindre changement de business model, un point sur lequel Marc Simoncini s'est empressé de revenir pour rassurer le troupeau :
Je crains de m’être mal exprimé. Certains investisseurs ont pu croire que Meetic allait changer de métier, il n’en est rien ! Nous entendons seulement accroître notre chiffre d’affaires en générant de nouveaux revenus, grâce aux recettes publicitaires et mobiles, et cela en créant de nouveaux sites.
Espérons donc que Meetic ne ratera pas son prochain rendez-vous avec les analystes, prévu le 24 juillet (jeudi soir), pour communiquer son chiffre d’affaires du premier semestre 2008.

Ainsi que le soulignait l'excellent DatingWatch (dommage que les juges soient encore passés par là...) :
comme toute société cotée en bourse, (Meetic) est désormais soumise à de fortes exigences de résultats.
Or malgré quelques interrogations légitimes... les résultats sont excellents. Et le cours est déplorable. Allez y comprendre quelque chose !

Entre-temps, vous pouvez déjà voir un aperçu de VIOO, signe de la nouvelle évolution en cours...

* * *

Je conclurai par cette réflexion du patron, initié au blogging par Loïc Le Meur (qui est d'ailleurs administrateur indépendant de Meetic depuis l'année dernière), sur feu son blog joliment intitulé « On ne regrette que ce que l'on n'a pas fait... » (à peine entré, déjà sorti), dans l'un des seuls billets qu'il ait publiés (6 octobre 2006) :
putain 20 ans !

L'une des questions que l'on me pose très souvent concerne "mes débuts" ... "aviez-vous l'âme d'un entrepreneur ?" "Comment avez-vous eu l'idée" "qui ont été vos modèles" etc etc.

Pourquoi j'ai décidé de monter ma première boîte à 22 ans ? Je n'arrive jamais à répondre précisément ... L'envie ? Le besoin ? L’inconscience ?

Je viens d'être invité à un colloque "les stars Internet de demain", mon intervention portait sur "2O ans d'entreprenariat", ce fut l’occasion de prendre conscience qu’effectivement, cela faisait bien 20 ans que je dirigeait des entreprises (pendant 15 ans vu le volume d’activité elle n’ont eu d’entreprises que le nom, le terme d’épicerie conviendrait mieux !)

Cela m’a donné l’occasion de me pencher sur ces 20 dernières années, de prendre conscience du chemin parcouru de mon bac à ma première société, d’iFrance à Meetic, de me souvenir des milliers de problèmes que j’ai dû affronter en 20 ans aux millions de hasards heureux qui m’ont permis de réussir 2 ou 3 trucs, des gens formidables qui m’ont aidé ou accablé, des calamiteux que j’ai croisé, de tous ceux avec qui je n’ai pas été corrects (qu’ils m’en excusent, sincèrement), de ceux qui m’ont aidé, de ceux que j’ai oublié et de tous dont j’ai tant appris.

J’ai décidé de tenter de retrouver tout cela en reprenant l’histoire au tout tout début, je ne sais pas si cela à un quelconque intérêt, si j’irai au bout ni même ni si cela servira à quelque chose mais je me lance, as usual … on verra bien. Peut être que la réponse à la première question prendra forme en même temps que mes souvenirs prendront encre…
Sic. Meetic, aujourd'hui, c'est quand même une audience qualifiée et plus d'1 milliard de pages vues par mois. Donc même si c'est sans rapport avec d'autres ordres de grandeur, c'est honorable quand même, non ?


Partager sur Facebook

P.S. Je viens de voir dans mes liens référents une recherche sur "rdv meetic" :


Incroyable : l'internaute cherche "rdv", Google met en évidence "rdv" ET "rendez-vous" !!! Trop fort, Google !

, , , ,

Google superlatif


Dans mon dernier billet sur les gains de Google par page vue et par visiteur, il y a quand même un chiffre astronomique qui ressort : 4,3 milliards de pages vues par jour !!!



Évidemment, cela veut dire - je suppose - 4,3 milliards de pages vues chaque jour sur l'ensemble du réseau de contenu de Google, qui comprend aussi bien les milliards de pages de résultats générées par le moteur de recherche que les centaines de milliers de "partenaires" - sites et pages Web, blogs, forums, réseaux sociaux, etc. -, sur lesquels s'affichent les pubs AdSense/AdWords :
Il n'existe pas plus grand réseau de publicité contextuelle au monde.
Ajoutez à cela le monopole de Google dans la vidéo avec YouTube, et vous comprenez aisément qu'il ne reste pas grand chose aux autres...

Il y avait toutefois un secteur où Google profileur en série était largement surpassé, notamment par Yahoo! : le "display advertising", ou affichage de bannières, de boutons, de fenêtres pop-up, de pubs en flash, etc.

Un retard largement récupéré grâce à l'intégration de Doubleclick qui affiche la bagatelle de ... 10 milliards de pubs ... par jour !

Et encore, ça c'était avant l'acquisition par Google, dont nous avons vu la part prépondérante de Doubleclick dans les affichages publicitaires :



Le tableau ci-dessus aide d'ailleurs à comprendre les grandes manœuvres auxquelles se livrent actuellement les acteurs cités dans le tableau : Yahoo!, Microsoft, Time Warner Network / AOL et Fox Interactive Media / Myspace.com.

Et à mieux saisir pourquoi - vu qu'au final aucune forme d'accord ne semble plus possible entre Microsoft et Yahoo! - Microsoft se tourne aujourd'hui vers AOL et Yahoo! reprend contact avec Murdoch.

Microsoft qui ferait une erreur stratégique colossale à ne pas racheter Yahoo!, c'est mon avis. D'autant plus lorsque l'on voit que dans un C.A. annuel mirobolant de 67 milliards $, l'activité en ligne de Microsoft est pratiquement la seule déficitaire (en plus du secteur Entertainment & Devices), avec une perte de 488 millions $ sur l'année...

En outre, puisqu'il est acquis que Yahoo! accepterait la fusion à 33$ l'action, soit un chiffre global d'environ 47 milliards $, on se dit que ça ne représenterait jamais qu'un peu moins de 3 trimestres de C.A., et donc on comprend encore plus difficilement pourquoi Ballmer irait se lancer dans un deal avec AOL, nettement moins avantageux pour Microsoft à tous points de vue.

Et si c'est uniquement pour ne pas perdre la face, de toute façon c'est trop tard ! Ce qui ne l'empêchait pas de déclarer il y a quelques jours :
We love what we're doing today in search. If you go to www.msn.com you use our Live Search every day, every month, every year, every release we're making incredible progress in innovation, both on the results that you see, the user experience, the relevance, the advertising, and we love what we're doing, and we're going to drive forward in any event.

(...)

I can't really comment much about what's going on today with Yahoo, but I can tell you that with or without anything going on, on that front, I love what we're building. It's fantastic. If we can accelerate our strategy, great, but we're depending on our own guys, our own engineers, their brilliance, their efforts, their energy, that's what's going to and a lot of hard work, and a lot of patience, and a lot of tenacity, that's what's going to give us the breakthroughs versus Google.
L'important, c'est de garder l'optimisme !

À noter que dès le mois de février, tous ces acteurs étaient déjà présents dans mon petit glossaire pour mieux comprendre les dessous de l'opération Microsoft - Yahoo!

Comme si rien n'avait changé depuis ! En tout cas, quoi qu'il se passe, Google est tranquille pour un bon bout de temps, les concurrents qui lui feront de l'ombre doivent encore naître...



Partager sur Facebook



P.S. Et si au final Apple coiffait tout le monde au poteau et faisait l'acquisition de Yahoo! ?



, , , , , ,

vendredi 18 juillet 2008

Google : gains par page vue et par visiteur


800 milliards de requêtes par an, tous moteurs confondus ?

Hier Google a annoncé ses résultats trimestriels, à 5,37 milliards $ pour le deuxième trimestre 2008, soit une progression de 39% d'une année sur l'autre, et de 3% par rapport au premier trimestre.

Des résultats jugés décevants par les analystes...

Un cash flow généré à 97% par la pub sur le réseau Google dans son ensemble, pour un total de 5 185 425 000 $ sur trois mois, soit une moyenne mensuelle de 1 728 475 000 $ !

Or nous savons depuis longtemps que Google est bien plus qu'un "simple" moteur de recherche, puisque c'est aussi et surtout le plus grand réseau publicitaire mondialisé, présent dans plus de 20 langues et plus de 100 pays, avec une audience qui touche entre 75% et 80% des internautes au niveau mondial, atteignant même 90% dans certains pays :


Ce qui représente plus de 1 500 milliards de pages vues annuelles, soit une moyenne de 4,3 milliards/jour.


Maintenant, si l'on extrait de ces chiffres des moyennes mensuelles, pour un cumul de 705 millions de visiteurs nous obtenons 129 milliards de pages vues (soit 183 pages vues mensuelles par visiteur).

Rapportés au C.A. moyen mensuel de Google pour le dernier trimestre (1 728 475 000 $), cela donne un gain de 0,0134 $ par page vue et de 2,45 $ par visiteur.

Je sais bien que c'est simpliste, et ne reflète en rien la formule originale de Google pour calculer ses revenus publicitaires :



Revenu
= Nb d’utilisateurs x (Nb de requêtes/utilisateur) x (Nb de pubs/requête) x (Nb de clics/pub) x (Revenu/clic)
Mais faute d'avoir toutes les données à disposition, on se contentera de ce qu'on a...

Et dire que selon une étude AdAge menée en mars dernier, la recherche ne totalise que 5% du temps passé en ligne par les internautes. Ce qui veut dire que les 95% restants concernent des activités autres que la recherche sur les moteurs !


Il serait vraiment intéressant de savoir combien de requêtes saisissent les internautes chaque jour dans le monde sur Google ! Des données secrètes et bien conservées, j'imagine.

Impossible de comparer des ordres de grandeur incomparables, mais il n'empêche que l'écart énorme entre les 3,6 milliards de visites dans le mois communiquées par Yahoo! hier, et ce chiffre de 129 milliards de pages vues par mois sur les sites du réseau Google, ne peut s'expliquer que par la quantité faramineuse de requêtes saisies chaque jour sur le moteur de recherche.

D'autant plus que cela serait vraiment inexplicable au vu des quantités de visiteurs à peu près équivalentes sur les deux réseaux.

Ceci dit, s'il est vrai que l'activité internationale de Google représente 52% du total, et que selon les derniers chiffres disponibles sur le nombre de requêtes mensuelles aux États-Unis, qui représentaient 6,67 milliards de requêtes au mois de mai dernier (61% du total), cela signifierait 7,22 milliards de requêtes hors États-Unis, pour un total mensuel qu'on arrondira par défaut à 14 milliards de requêtes dans le monde.

Des estimations encore bien basses si on les compare aux 400 milliards de requêtes par an déjà annoncées en ... 2006 par ... Yahoo ! [Début]

[MàJ - 19h] Je viens de découvrir ce communiqué de presse de comScore, qui comptait 61 milliards de recherches dans le monde en août 2007, dont +37 milliards uniquement pour Google (+31 milliards pour le moteur et le reste sur YouTube).

Or le même mois, les requêtes de Google sur le seul marché US était de 5,545 milliards, soit uniquement 18% du total mondial. Un pourcentage qui me semble un peu faible...
Si l'on applique le même taux aux résultats de mai dernier, ça nous donnerait 37 milliards de requêtes uniquement pour Google moteur de recherche, soit une estimation de 444 milliards de requêtes sur 2008, et plus de 800 milliards de requêtes tous moteurs confondus.
Soit une progression de 100% en deux ans ! Si quelqu'un a des chiffres...

En attendant, le temps que je fasse mes petits calculs, les stats de juin 2008 aux États-Unis viennent de sortir ! [Début]




Partager sur Facebook

P.S. À noter que, dans le sillage de Google, les résultats de Microsoft (un C.A. annuel de +67 milliards de $) ont également été jugés décevants par les "analystes financiers" : ces gens-là sont des déments qui n'ont absolument aucun contact avec la réalité des choses... [Début]

, ,