Pages

lundi 27 février 2006

Googlepages : les 500 premières pages !

Les 500 premières Googlepages !

En dépit d'un boulot monstre, j'écris ce billet animé par un sentiment d'urgence. Voilà toute la journée que la requête « site:googlepages.com » donne 516 résultats !

Comme j'imagine que ça ne va pas durer longtemps, si l'on en croit le succès des premiers jours qui a déjà dépassé les prévisions mêmes de Google, j'ai eu envie de faire un instantané de ces 500 premières pages, saisir sur le vif un morceau de l'histoire d'Internet, tirer un « cliché pour la postérité », pour que ceux qui liront dans 2 ou 3 années-Internet (plus ou moins égales à 2 ou 3 années-lumière) puissent se rappeler (ou juste avoir une idée) de l'Internet jurassique et des premiers pas du Googlosaurus...

J'ai donc procédé comme suit :
  • téléchargement des 516 résultats dans un fichier Adobe Acrobat
  • conversion du PDF en RTF
  • préparation du fichier pour ne garder que les résultats
  • création d'un tableau en trois colonnes, avec :
  1. le numéro progressif dans la colonne de gauche
  2. le résultat in extenso au milieu
  3. le code ISO de la langue dans la colonne de droite
Aperçu du fichier ainsi créé :


Ça m'a permis de me faire une idée rapide de la répartition linguistique et de la teneur des pages. Rassurez-vous, rien de scientifique dans ma démarche, même si j'envie beaucoup les véritables études..., c'est juste un petit boulot d'amateur, avec probablement quelques erreurs, qu'on veuille bien me les pardonner. Et si quelqu'un veut approfondir la chose, mon fichier est à sa disposition.

RÉSULTATS

Sur les 516 résultats, le décompte final n'a fourni que 513 sites, dont Googlepages lui-même et 3 sites introuvables :

soit 509 sites (dont 1 se répète 2 fois, 1 4 fois et 1 8 fois !), avec au final un total exact de 500 sites ainsi répartis, 1) par langues, et 2) par domaines :

1. RÉPARTITION PAR LANGUES

En noir et blanc :

En couleur :

Donc, on le voit, les pages en français, qui sont ex aequo au sixième rang avec les pages italiennes, ne représentent que 3% de l'ensemble, pas de quoi pavoiser ! Je sais que l'info n'a pas grande valeur, mais c'est toutefois un indice de réactivité, et les anglo-saxons sont bien toujours les premiers sur le Web, quoi qu'on en dise...

2. RÉPARTITION PAR DOMAINES

Là encore, mon analyse est plus intuitive que factuelle ! Mis à part environ 30% de sites dont j'ignore la langue, au pif, les grands domaines qui s'en dégagent sont, par ordre d'importance :
  1. les pages d'humour
  2. les pages de test (beaucoup sont en latin, allez savoir pourquoi !)
  3. les pages de pub et de spam (ou spages)
  4. les pages sérieuses (il y en a quelques-unes)
  5. les pages critiques
  6. les pages tendres
  7. les autres pages...
Il est 1 heure du mat' et je vais pas détailler tout ça à fond, voici juste quelques réflexions, pêle-mêle, en sautant les points 2 et 3 vu que ça n'apporte rien.

Entre ceux qui se prennent la tête

et ceux qui se prennent pas au sérieux,

entre ceux qui font des critiques voilées tout en profitant de l'aubaine

et ceux qui critiquent tout court

entre les laconiques

et les pris de panique

entre ceux qui bullent

et ceux qui bossent

entre ceux qui provoquent

et ceux qui expliquent

tout l'univers

semble se googlifier

même si tout ça manque parfois d'altitude


Je dédie ce billet à Marie...

Ciao, J-M

4 commentaires:

Marie a dit…

Merci J-M
;)

Marie

Monique a dit…

Bonjour,

Tout cela pour Marie ?
Mais elle le vaut bien ;-)

Amicalement,
Monique

peter gabor a dit…

bonjour en lisant votre blog, par curiosité je suis allé voir mes propres performances. Un chiffre m'a paru significatif: mon blog est visité par 123 pays différents. qu'en pensez-vous? La typographie semble intéresser le monde entier. Presque autant que le sexe. Encore bravo pour vos réflexions très construites.

Anonyme a dit…

Je vous remercie pour votre manière d'apprivoiser mon attention. Ce message est la preuve de mon intérêt surpris...conquis!

À la vôtre
░░░░▒▒▒▓▓▓