Affichage des articles dont le libellé est Google CSE. Afficher tous les articles
Affichage des articles dont le libellé est Google CSE. Afficher tous les articles

mardi 17 avril 2007

La verticalisation des moteurs de recherche - suite

La verticalisation des moteurs de recherche - suite

[MàJ - 25 mai 2007] : conclusion

[MàJ - 18 avril 2007]

Après ma critique de Reportlinker, je m'attendais à recevoir un message de dénégation de la part des responsables du site, en revanche j'ai eu l'heureuse surprise de recevoir le courriel suivant, que je reproduis avec l'aimable autorisation de son auteur, Nicolas Bombourg :
Bonjour Jean Marie,

Je me permets de revenir vers vous pour donner suite à votre post sur notre service Reportlinker.
Si vous le souhaitez, je vous propose de vous inscrire gratuitement sur notre outil.

Vous pourrez y accéder pendant un mois. En échange, je vous demanderai, comme à tous les Beta-testeurs, de nous faire remonter toutes les bonnes idées qui vous viendront à l’utilisation de notre outil.

Je vous ferai également si vous le souhaitez remonter quelques informations concernant notre technologie. En effet, notre moteur est basé sur une technologie sémantique, générant à la volée des clusters basés sur les contenus des études identifiées, et permettant d’affiner les résultats sur 4 dimensions (langue, industrie, date de publication et zone géographique). À ma connaissance, Google CSE n’offre pas ces fonctionnalités.

Cette technologie est le fruit de 5 ans de R&D, a reçu le soutient de l’Anvar, ses coûts de développement sont aujourd’hui estimés à 2 M€.

Enfin, je suis également à votre disposition pour vous faire remonter des informations concernant les moteurs de recherche verticaux, et le Web 3.0 puisque notre société s’inscrit dans cette tendance. Vous en trouverez quelques extraits sur notre blog.

À l’image de notre site, ouvert depuis le début Avril, il est perfectible ;-)

Je suis à votre disposition pour en discuter par ailleurs, vous trouverez mes coordonnées ci-dessous. À bientôt,

Cordialement,
Nicolas
J'aime les gens qui jouent le jeu, je trouve cette démarche positive, ça va dans le bon sens. À mon tour j'accepte donc de bêta-tester le moteur pendant un mois, dans la plus grande impartialité, en faisant remonter mes observations à leur concepteur et je vous reviendrai ensuite avec un nouveau billet circonstancié sur ce nouveau moteur de recherche verticale. Dont l'idée m'avait séduit d'emblée, mais dont les conditions d'abonnement m'avaient immédiatement refroidi. En attendant je leur propose d'étoffer le volet "communication" de leur site, car ce qui semble couler de source pour eux est manifestement moins évident pour l'internaute lambda. D'où la première rédaction de cet article :

* * *

Depuis que j'ai publié mon dernier billet sur la montée en puissance des moteurs de recherche verticalisés, ou thématiques, ou spécialisés, etc., j'ai découvert Reportlinker, autre exemple de verticalisation d'outil de recherche qui répertorie pour l'instant 1,2 million d'études sectorielles en accès illimité... mais payant (on est d'ailleurs à la limite de l'abus de langage : illimité, certes, pourvu qu'on paye et qu'on renouvelle son abonnement chaque mois, pour la modique somme de 2 748,00 € à l'année !). Malheureusement, AMHA bien trop cher ! Encore un business model à la française...


Faire payer 129,00 € pour 24 heures (sic!) ou 229,00 € par mois pour permettre de télécharger des ressources gratuites (car j'imagine que la plupart sont accessibles gratuitement sur Internet), faut pas se moucher du pied !

Exemple : j'ai saisi "traduction" dans l'onglet de recherche, et la première page de résultats semble alléchante :


Problème, dès qu'on clique on arrive sur la page du "choix" de l'abonnement (conditions au 17 avril 2007)...

J'ai donc voulu tester le troisième résultat, dont le snippet dit textuellement : « Glossaire anglais-français 1 abbreviated sector breakdown ventilation sectorielle simplifiée; nomenclature simplifiée des secteurs abnormal » (238 pages).


Je l'ai repris tel quel et l'ai collé dans "mon moteur". Résultat, ça sort de suite et c'est gratuit.


Et comme vous pouvez le voir, le document fait bien 238 pages, donc pas d'erreur possible, c'est bien le même qui vous aurait coûté au bas mot 129,00 € chez ReportLinker.



Par simple curiosité, j'ai réitéré l'expérience avec les deux premiers résultats, qui en fait n'en sont qu'un seul, pour voir si je retrouvais le document sur Google avec les indications disponibles. D'abord, le binôme TRADUCTION + "profil de l'industrie" est très fréquent dans les études de marché canadiennes, dont la plupart sont publiées dans les deux langues. Dont acte. Quatrième résultat (puisqu'il est question de musique) :


Là aussi, 149 pages, c'est bien ça. À noter quand même que l'étude date du 30 septembre 2004, ce qui n'est plus tout jeune si on calcule en temps Internet. Et dans le lot de plus d'un million d'études "disponibles" annoncées, je me demande quelle est la part vraiment de première fraîcheur...

* * *

Sur le billet de Jean-Michel Billaut, source de cette info, les commentaires sont d'ailleurs plutôt aigres... Allez, venez chez moi, on fera ça à la bonne franquette :-)


P.S. Voilà encore un domaine où les anglo-saxons pourraient nous enseigner ce qu'il faut faire ... ou pas !

, , , , , , ,

vendredi 13 avril 2007

La verticalisation des moteurs de recherche

Suite...

[MàJ - 14 avril 2007] En attendant Google se verticalise ... dans la pub ! Entre le rachat de Doucleclick pour 3,1 Mds $ cash et celui d'Internet pour 2 455,5 Mds $ cash, que choisir ? Seule certitude : Micro$oft est vraiment de plus en plus loin. Bientôt ce ne sera plus Poulidor mais la voiture balai (sans aller jusqu'au cercueil !)...

* * *

Depuis que je travaille - intensément - à la conception de Translation's 2.0, "mon" moteur de recherche thématique dédié à la traduction et la terminologie multilingue (indexant près de 34 600 [catégories de] sites), chaque jour je suis amené à réfléchir sur le potentiel inépuisable et encore inexploré de la verticalisation des moteurs de recherche.

[3 600 : mise à jour, 26 sept. 2007
4 600 : mise à jour, 25 février 2008
]

En 11 mois (23 mars 07 - 25 février 08), les chiffres sont plutôt encourageants :
  • 20 678 requêtes
  • 32 786 visiteurs
  • 60 585 pages vues
  • 1 minute 10 secondes de permanence par visiteur


* * *

Au moment où la recherche est plus que jamais destinée à devenir le véritable système d'exploitation de l'Internet (Search is the OS, j'aime bien la traduction en français, particulièrement explicite dans ce cas...), au moment où le référencement tel qu'on le connaît est appelé, non pas à disparaître, mais à évoluer et se transformer en profondeur, au moment où dans le couple intégration / synchronisation Desktop - Webtop, le premier régresse chaque jour davantage derrière le second (l'ère de l'information quitte le bureau pour passer à l'internet), et Microsoft derrière Google, par voie de conséquence (même si les deux ne sont pas forcément comparables), au moment où l'heure est venue de changer nos modes de travail, il est probable, et même certain, que la verticalisation des moteurs de recherche jouera un rôle central dans cette redistribution des cartes, aussi radicale qu'inéluctable.

La chose n'est pas nouvelle, Danny Sullivan dressait déjà un état des lieux en 2002, mais certains signes donnent à penser que le phénomène s'accélère. Et s'il est vrai que les mastodontes de l'Internet prennent de plus en plus de poids, puisque les dix premiers sites mondiaux (les métayers du Web comme les appelle Nicolas Carr) se partagent 40% des pages vues sur l'ensemble du réseau, soit une progression de 29% de novembre 2001 à novembre 2006, il n'en reste pas moins que la mise à disposition (quasi-)gratuite... de leurs outils permet à l'internaute lambda tel que ... moi, et vous, et nous, non pas de faire jeu égal, mais au moins d'en bénéficier quasiment à coût zéro.

Une verticalisation, chère à Google pour d'autres raisons, qui permet de conjuguer pertinence et rapidité, deux éléments d'importance pour affiner le rapport signal-bruit des résultats d'environ ... 400 milliards de requêtes par an ! Ajoutez-y les nouveaux moteurs de la recherche sociale et, entre autres, le nouvel algorithme mis au point par Ask, ça nous promet de profondes mutations en perspective...

Perso j'en suis presque à 3 000 requêtes (pour plus de 4 000 pages vues) en moins de 3 semaines, ce qui est déjà une manière d'apporter ma modeste pierre à l'édifice !



... qui risque de se faire de plus en plus rare sur ce blog dans les semaines à venir...

Partager sur Facebook

, , , , , ,

vendredi 30 mars 2007

Utiliser Google CSE pour personnaliser son moteur de recherche

Utiliser Google CSE pour personnaliser "son" moteur de recherche

Suite...

Voici quelques jours que je travaille avec CSE à la création d'un moteur de recherche "vertical" (on pourra préférer "thématique", "spécialisé" ou autre, mais j'aime bien la notion de verticalisation qui me donne une idée de profondeur...) dédié à la traduction, et plus précisément à la terminologie appliquée quasi-exclusivement au couple linguistique anglais-français mais dans tous les domaines.

J'avais décidé de m'y consacrer dès la sortie de Google CSE, un outil mettant à disposition de l'internaute lambda toute la flexibilité et la puissance de Google, qui ne faillit décidément pas à sa réputation !

Cela a donné Translation's 2.0, pour être dans l'air du temps :

D'abord dédié à la terminologie français <--> anglais (même s'il donne aussi de bons résultats avec d'autres langues européennes), le but consiste à n'indexer que des sites très riches en terminologie, bilingues pour la plupart, afin d'atténuer le plus possible le bruit généré par Google, sans pour autant tomber dans le silence.

Le but est donc de faire gagner du temps à l'internaute en éliminant la masse des réponses hors sujet, inévitables lorsqu'un moteur indexe plusieurs milliards de pages Web, pour proposer un maximum de résultats pertinents. Et même si j'ai essentiellement restreint à deux langues le champ de recherche, j'ai voulu éviter de faire un moteur confidentiel, puisque l'ambition est de traiter tous les domaines, la terminologie étant transversale par excellence.

Cela va à l'encontre de ce que j'ai pu observer dans les CSE disponibles en français, peu à vrai dire, puisque j'en ai trouvé à peine quelques dizaines contre environ 20 000 moteurs personnalisés recensés par Google (voir également ce Guide To Custom Search Engines). Encore la frilosité française face au pragmatisme anglo-saxon ?

Profitons-en donc pour saluer quelques pionniers, qui vont des trois mousquetaires de l'information juridique au D'Artagnan de la veille, en passant par la vente, la lecture, les normes du Web, l'accessibilité, les blogs de Google, les blogs francophones, les juriblogs, et même la biblioblogosphère.

Ajoutons-y en vrac les timbres, les estampes, l'emarketing, les flux, les photos, les "signaux", le foot, Autodesk, Wordpress, Linux, Ubuntu ou les beta-tests, avec une mention spéciale pour les vins ... suisses, et pardon à celles et ceux que j'oublie (les commentaires sont ouverts pour réparer cette injustice :-).

Venons-en maintenant à l'élaboration du moteur, déjà fort bien expliquée ici, pour signaler quelques fonctionnalités que je trouve géniales.

Tout d'abord la possibilité de s'affranchir de la page fournie d'office par Google dès qu'on crée son moteur pour l'héberger dans le contexte de son choix : sobrement pour Sébastien Billard, brillamment chez Sergi, ou de manière particulièrement visuelle pour Vincent Abry avec l'interface de Surfons :


Viennent ensuite différentes fonctionnalités avancées offertes par Google pour optimiser son propre espace d'accueil du moteur CSE, notamment la possibilité de faire apparaître les résultats sur la page de son choix, en dépit d'un petit bémol, à savoir la limitation des affichages à 10 résultats par page, sans fonction cache ni signaler le nombre total de résultats d'une recherche.

Ceci étant, c'est toute la puissance de son moteur que Google met gratuitement à notre disposition, et ce serait vraiment dommage de s'en priver. Si vous ne savez pas quoi y mettre, gavez-le avec tous les liens accumulés dans vos favoris au fil des ans, vous verrez que lorsque vous vous habituerez à la recherche plein texte vous en oublierez jusqu'à l'existence de vos signets !

Je vais rédiger prochainement une FAQ pour expliquer les stratégies et les syntaxes de recherche utiles pour tirer toute la pertinence possible de l'outil, donc en attendant profitez-en pour résoudre vos problèmes terminologiques et de traduction anglais-français ou vice-versa : testez-le, j'apprécierai grandement votre expérience en retour et je reste ouvert aux conseils autant qu'aux critiques constructives. Je n'ai pas encore terminé la base d'indexation, mais il est déjà gaillard, le petit ! Pour l'essayer, c'est par là :






Google Custom Search


Bonne recherche et, surtout : n'oubliez pas, créez le vôtre !

Jean-Marie Le Ray

, , , , , ,