Affichage des articles dont le libellé est verticalisation. Afficher tous les articles
Affichage des articles dont le libellé est verticalisation. Afficher tous les articles

vendredi 25 mai 2007

Reportlinker : la cata se confirme

Reportlinker : la cata se confirme

Retour sur un précédent billet, la verticalisation des moteurs de recherche, dans lequel j'exprimais une critique de Reportlinker sur son coût excessif, chose largement corroborée par la suite. J'étais alors contacté par Nicolas Bombourg, l'un des deux fondateurs, qui me proposait un accès gratuit d'un mois pour bêta-tester le moteur et, en échange, leur faire remonter toutes les bonnes idées qui me viendraient à l’utilisation de l'outil.

Le 19 avril je recevais le code d'accès et j'effectuais des tests dans la foulée. J'envoyais à Monsieur Bombourg ce que je pensais être mon premier feedback dans la soirée, où j'identifiais six catégories de problèmes. Je vous livre le message tel que je le lui ai envoyé (légèrement adapté pour tenir compte de l'absence des captures d'écran).
1. Incohérences entre titre document et document lui-même

Exemples :

- Titre annoncé : « Téléphonie Mobile et UMTS, Evaluation de la taille du marché dans le monde »
Concrètement : rapport annuel 2004 d'une société luxembourgeoise.

- Titre de l’ « étude » annoncée : « Assurances, Evaluation de la taille du marché, Russie »
En réalité, simple dépliant publicitaire décrivant les activités de la société Kazna, qui évolue dans le domaine de l’assurance, certes, mais point d’évaluation sérieuse du marché de l’assurance en Russie.

2. Problèmes de codage (IE, Firefox ?)

Sur Firefox, tous les mots accentués sont systématiquement tronqués. Résultat, lorsqu’on clique sur le lien avec un codage erroné : aucun résultat. Il faut remettre les accents pour obtenir les résultats.

3. Liens inactifs, critères aussi !

Si je clique sur l’année 2007, qui m’annonce 725 documents, rien ne se passe, les résultats sont les mêmes que ceux des autres années, et les années ne correspondent pas : par ex., deuxième doc = 2006

Quand j’essaie de cliquer sur les docs, les liens ne sont pas actifs sans qu’on comprenne pourquoi.

Autre exemple, en donnant 2007 pour critère : années affichées des 6 premiers doc : nov. 2002 – mars 2005 – mars 2003 – mars 2006 – septembre 2006 – août 2001, mais aucun daté 2007 ! Où sont passés les centaines de documents annoncés ?

4. « Fraîcheur des documents », par ailleurs disponibles en libre accès sur Google

Sur les dix premiers docs téléchargés, dont la date de publication est majoritairement comprise entre 2003 et 2005, j’ai testé Google et tous sont trouvables et téléchargeables via le moteur.

Celui-ci, http://www.openwide.fr/ , qui annonce « Logiciel, Tendances et évolution du marché » date carrément de 2002, un peu dépassé pour les tendances du marché.

5. Liens brisés

Pour cet autre : « Fenêtre et Peintures, Segmentation du marché, Europe et Afrique », le lien de téléchargement ne mène nulle part (de plus la date de mise à jour annonce février 2006, ce qui en ferait un document plutôt « récent » par rapport aux autres).

Idem pour un autre doc du Ministère des Transports du Canada.

6. Quelques autres problèmes, dont la lenteur du serveur dans les réponses, etc.

Conclusion : pour l’instant, j’ai passé près de deux heures dans mes recherches sans véritablement trouver de document pertinent et à jour. Au niveau qualitatif de l’expérience utilisateur, c’est le zéro pointé. Quant au rapport qualité-prix, j’irais plus vite en surfant sur Google, je trouverais de meilleurs documents, et c’est gratuit. Donc si en plus j’avais payé pour ce service, je vous dis pas dans quel état d’esprit je serais.
Dans un premier temps, Monsieur Bombourg a accusé réception (Je suis en déplacement et regarderai vos retours en détail avec intérêt), et puis après, plus rien. Ni le lendemain ni durant les jours qui ont suivi. Silence radio.

Dans un message laissé sur le billet de Jean-Michel Billaut, grâce auquel j'avais découvert ce "service", initialement je faisais le commentaire suivant :
...j'ai passé deux heures à tester l'outil et les résultats sont bien pires que ce à quoi j'avais pensé au départ. J'ai d'ailleurs adressé un compte-rendu détaillé à Monsieur Bombourg, qui n'y a pas donné suite.
Et contrairement à ce que j'ai dit sur mon blog, je n'envisage pas pour l'heure d'informer le lectorat d'Adscriptor de ce compte-rendu, car je n'aime pas m'acharner. J'espère juste qu'il fera réfléchir les personnes concernées.
Et, en effet, telle était mon intention au départ. Toutefois, à son insu, Monsieur Bombourg m'a fait changer d'avis : une dizaine de jours plus tard, j'ai voulu refaire des tests pour confirmer ou infirmer mes premières impressions, or j'ai découvert avec stupeur que mon code d'accès n'était plus valide. Annulé, purement et simplement.

Ce qui m'a mis très en colère. Si on me dit « Vous pourrez y accéder pendant un mois. », la moindre des choses, c'est de tenir parole. J'ai passé plus de 2 heures de mon temps que j'aurais pu employer beaucoup plus utilement, donc le premier des respects à mon égard était de donner crédit à la parole donnée, ce que moi j'ai fait de mon côté.

J'aurais d'ailleurs aimé avoir une réponse argumentée à mes critiques, plutôt qu'un silence qui vaut acquiescement et traduit une incapacité chronique à se remettre en question. Ce qui n'est pas une bonne chose lorsqu'on se vante d'être dans la mouvance Web 2.0 ou Web 3.0. Enfin, pour conclure, je laisse la parole à Pascal, qui a commenté à ma suite (le 3 mai dernier) sur le blog de Jean-Michel Billaut :
Pareil pour moi qui ai eu le droit de tester aussi... J'ai vraiment essayé de lui donner sa chance à ce moteur, en cherchant diverses choses pour un usage réel (pas juste des recherches pour le plaisir d'en faire) mais les résultats sont vraiment mauvais à tous points de vue... À oublier vite...
Oui, c'est bien la seule expression qui convient, Reportlinker, à oublier vite ! Sans parler des économies... Monsieur Bombourg, quand on prétend vouloir jouer le jeu, il faut le jouer jusqu'au bout. Enfin, oser dire que Reportlinker se distingue de Google CSE par l'aspect sémantique, faut vraiment pas craindre !


, , , , ,

mardi 17 avril 2007

La verticalisation des moteurs de recherche - suite

La verticalisation des moteurs de recherche - suite

[MàJ - 25 mai 2007] : conclusion

[MàJ - 18 avril 2007]

Après ma critique de Reportlinker, je m'attendais à recevoir un message de dénégation de la part des responsables du site, en revanche j'ai eu l'heureuse surprise de recevoir le courriel suivant, que je reproduis avec l'aimable autorisation de son auteur, Nicolas Bombourg :
Bonjour Jean Marie,

Je me permets de revenir vers vous pour donner suite à votre post sur notre service Reportlinker.
Si vous le souhaitez, je vous propose de vous inscrire gratuitement sur notre outil.

Vous pourrez y accéder pendant un mois. En échange, je vous demanderai, comme à tous les Beta-testeurs, de nous faire remonter toutes les bonnes idées qui vous viendront à l’utilisation de notre outil.

Je vous ferai également si vous le souhaitez remonter quelques informations concernant notre technologie. En effet, notre moteur est basé sur une technologie sémantique, générant à la volée des clusters basés sur les contenus des études identifiées, et permettant d’affiner les résultats sur 4 dimensions (langue, industrie, date de publication et zone géographique). À ma connaissance, Google CSE n’offre pas ces fonctionnalités.

Cette technologie est le fruit de 5 ans de R&D, a reçu le soutient de l’Anvar, ses coûts de développement sont aujourd’hui estimés à 2 M€.

Enfin, je suis également à votre disposition pour vous faire remonter des informations concernant les moteurs de recherche verticaux, et le Web 3.0 puisque notre société s’inscrit dans cette tendance. Vous en trouverez quelques extraits sur notre blog.

À l’image de notre site, ouvert depuis le début Avril, il est perfectible ;-)

Je suis à votre disposition pour en discuter par ailleurs, vous trouverez mes coordonnées ci-dessous. À bientôt,

Cordialement,
Nicolas
J'aime les gens qui jouent le jeu, je trouve cette démarche positive, ça va dans le bon sens. À mon tour j'accepte donc de bêta-tester le moteur pendant un mois, dans la plus grande impartialité, en faisant remonter mes observations à leur concepteur et je vous reviendrai ensuite avec un nouveau billet circonstancié sur ce nouveau moteur de recherche verticale. Dont l'idée m'avait séduit d'emblée, mais dont les conditions d'abonnement m'avaient immédiatement refroidi. En attendant je leur propose d'étoffer le volet "communication" de leur site, car ce qui semble couler de source pour eux est manifestement moins évident pour l'internaute lambda. D'où la première rédaction de cet article :

* * *

Depuis que j'ai publié mon dernier billet sur la montée en puissance des moteurs de recherche verticalisés, ou thématiques, ou spécialisés, etc., j'ai découvert Reportlinker, autre exemple de verticalisation d'outil de recherche qui répertorie pour l'instant 1,2 million d'études sectorielles en accès illimité... mais payant (on est d'ailleurs à la limite de l'abus de langage : illimité, certes, pourvu qu'on paye et qu'on renouvelle son abonnement chaque mois, pour la modique somme de 2 748,00 € à l'année !). Malheureusement, AMHA bien trop cher ! Encore un business model à la française...


Faire payer 129,00 € pour 24 heures (sic!) ou 229,00 € par mois pour permettre de télécharger des ressources gratuites (car j'imagine que la plupart sont accessibles gratuitement sur Internet), faut pas se moucher du pied !

Exemple : j'ai saisi "traduction" dans l'onglet de recherche, et la première page de résultats semble alléchante :


Problème, dès qu'on clique on arrive sur la page du "choix" de l'abonnement (conditions au 17 avril 2007)...

J'ai donc voulu tester le troisième résultat, dont le snippet dit textuellement : « Glossaire anglais-français 1 abbreviated sector breakdown ventilation sectorielle simplifiée; nomenclature simplifiée des secteurs abnormal » (238 pages).


Je l'ai repris tel quel et l'ai collé dans "mon moteur". Résultat, ça sort de suite et c'est gratuit.


Et comme vous pouvez le voir, le document fait bien 238 pages, donc pas d'erreur possible, c'est bien le même qui vous aurait coûté au bas mot 129,00 € chez ReportLinker.



Par simple curiosité, j'ai réitéré l'expérience avec les deux premiers résultats, qui en fait n'en sont qu'un seul, pour voir si je retrouvais le document sur Google avec les indications disponibles. D'abord, le binôme TRADUCTION + "profil de l'industrie" est très fréquent dans les études de marché canadiennes, dont la plupart sont publiées dans les deux langues. Dont acte. Quatrième résultat (puisqu'il est question de musique) :


Là aussi, 149 pages, c'est bien ça. À noter quand même que l'étude date du 30 septembre 2004, ce qui n'est plus tout jeune si on calcule en temps Internet. Et dans le lot de plus d'un million d'études "disponibles" annoncées, je me demande quelle est la part vraiment de première fraîcheur...

* * *

Sur le billet de Jean-Michel Billaut, source de cette info, les commentaires sont d'ailleurs plutôt aigres... Allez, venez chez moi, on fera ça à la bonne franquette :-)


P.S. Voilà encore un domaine où les anglo-saxons pourraient nous enseigner ce qu'il faut faire ... ou pas !

, , , , , , ,

vendredi 13 avril 2007

La verticalisation des moteurs de recherche

Suite...

[MàJ - 14 avril 2007] En attendant Google se verticalise ... dans la pub ! Entre le rachat de Doucleclick pour 3,1 Mds $ cash et celui d'Internet pour 2 455,5 Mds $ cash, que choisir ? Seule certitude : Micro$oft est vraiment de plus en plus loin. Bientôt ce ne sera plus Poulidor mais la voiture balai (sans aller jusqu'au cercueil !)...

* * *

Depuis que je travaille - intensément - à la conception de Translation's 2.0, "mon" moteur de recherche thématique dédié à la traduction et la terminologie multilingue (indexant près de 34 600 [catégories de] sites), chaque jour je suis amené à réfléchir sur le potentiel inépuisable et encore inexploré de la verticalisation des moteurs de recherche.

[3 600 : mise à jour, 26 sept. 2007
4 600 : mise à jour, 25 février 2008
]

En 11 mois (23 mars 07 - 25 février 08), les chiffres sont plutôt encourageants :
  • 20 678 requêtes
  • 32 786 visiteurs
  • 60 585 pages vues
  • 1 minute 10 secondes de permanence par visiteur


* * *

Au moment où la recherche est plus que jamais destinée à devenir le véritable système d'exploitation de l'Internet (Search is the OS, j'aime bien la traduction en français, particulièrement explicite dans ce cas...), au moment où le référencement tel qu'on le connaît est appelé, non pas à disparaître, mais à évoluer et se transformer en profondeur, au moment où dans le couple intégration / synchronisation Desktop - Webtop, le premier régresse chaque jour davantage derrière le second (l'ère de l'information quitte le bureau pour passer à l'internet), et Microsoft derrière Google, par voie de conséquence (même si les deux ne sont pas forcément comparables), au moment où l'heure est venue de changer nos modes de travail, il est probable, et même certain, que la verticalisation des moteurs de recherche jouera un rôle central dans cette redistribution des cartes, aussi radicale qu'inéluctable.

La chose n'est pas nouvelle, Danny Sullivan dressait déjà un état des lieux en 2002, mais certains signes donnent à penser que le phénomène s'accélère. Et s'il est vrai que les mastodontes de l'Internet prennent de plus en plus de poids, puisque les dix premiers sites mondiaux (les métayers du Web comme les appelle Nicolas Carr) se partagent 40% des pages vues sur l'ensemble du réseau, soit une progression de 29% de novembre 2001 à novembre 2006, il n'en reste pas moins que la mise à disposition (quasi-)gratuite... de leurs outils permet à l'internaute lambda tel que ... moi, et vous, et nous, non pas de faire jeu égal, mais au moins d'en bénéficier quasiment à coût zéro.

Une verticalisation, chère à Google pour d'autres raisons, qui permet de conjuguer pertinence et rapidité, deux éléments d'importance pour affiner le rapport signal-bruit des résultats d'environ ... 400 milliards de requêtes par an ! Ajoutez-y les nouveaux moteurs de la recherche sociale et, entre autres, le nouvel algorithme mis au point par Ask, ça nous promet de profondes mutations en perspective...

Perso j'en suis presque à 3 000 requêtes (pour plus de 4 000 pages vues) en moins de 3 semaines, ce qui est déjà une manière d'apporter ma modeste pierre à l'édifice !



... qui risque de se faire de plus en plus rare sur ce blog dans les semaines à venir...

Partager sur Facebook

, , , , , ,

vendredi 30 mars 2007

Utiliser Google CSE pour personnaliser son moteur de recherche

Utiliser Google CSE pour personnaliser "son" moteur de recherche

Suite...

Voici quelques jours que je travaille avec CSE à la création d'un moteur de recherche "vertical" (on pourra préférer "thématique", "spécialisé" ou autre, mais j'aime bien la notion de verticalisation qui me donne une idée de profondeur...) dédié à la traduction, et plus précisément à la terminologie appliquée quasi-exclusivement au couple linguistique anglais-français mais dans tous les domaines.

J'avais décidé de m'y consacrer dès la sortie de Google CSE, un outil mettant à disposition de l'internaute lambda toute la flexibilité et la puissance de Google, qui ne faillit décidément pas à sa réputation !

Cela a donné Translation's 2.0, pour être dans l'air du temps :

D'abord dédié à la terminologie français <--> anglais (même s'il donne aussi de bons résultats avec d'autres langues européennes), le but consiste à n'indexer que des sites très riches en terminologie, bilingues pour la plupart, afin d'atténuer le plus possible le bruit généré par Google, sans pour autant tomber dans le silence.

Le but est donc de faire gagner du temps à l'internaute en éliminant la masse des réponses hors sujet, inévitables lorsqu'un moteur indexe plusieurs milliards de pages Web, pour proposer un maximum de résultats pertinents. Et même si j'ai essentiellement restreint à deux langues le champ de recherche, j'ai voulu éviter de faire un moteur confidentiel, puisque l'ambition est de traiter tous les domaines, la terminologie étant transversale par excellence.

Cela va à l'encontre de ce que j'ai pu observer dans les CSE disponibles en français, peu à vrai dire, puisque j'en ai trouvé à peine quelques dizaines contre environ 20 000 moteurs personnalisés recensés par Google (voir également ce Guide To Custom Search Engines). Encore la frilosité française face au pragmatisme anglo-saxon ?

Profitons-en donc pour saluer quelques pionniers, qui vont des trois mousquetaires de l'information juridique au D'Artagnan de la veille, en passant par la vente, la lecture, les normes du Web, l'accessibilité, les blogs de Google, les blogs francophones, les juriblogs, et même la biblioblogosphère.

Ajoutons-y en vrac les timbres, les estampes, l'emarketing, les flux, les photos, les "signaux", le foot, Autodesk, Wordpress, Linux, Ubuntu ou les beta-tests, avec une mention spéciale pour les vins ... suisses, et pardon à celles et ceux que j'oublie (les commentaires sont ouverts pour réparer cette injustice :-).

Venons-en maintenant à l'élaboration du moteur, déjà fort bien expliquée ici, pour signaler quelques fonctionnalités que je trouve géniales.

Tout d'abord la possibilité de s'affranchir de la page fournie d'office par Google dès qu'on crée son moteur pour l'héberger dans le contexte de son choix : sobrement pour Sébastien Billard, brillamment chez Sergi, ou de manière particulièrement visuelle pour Vincent Abry avec l'interface de Surfons :


Viennent ensuite différentes fonctionnalités avancées offertes par Google pour optimiser son propre espace d'accueil du moteur CSE, notamment la possibilité de faire apparaître les résultats sur la page de son choix, en dépit d'un petit bémol, à savoir la limitation des affichages à 10 résultats par page, sans fonction cache ni signaler le nombre total de résultats d'une recherche.

Ceci étant, c'est toute la puissance de son moteur que Google met gratuitement à notre disposition, et ce serait vraiment dommage de s'en priver. Si vous ne savez pas quoi y mettre, gavez-le avec tous les liens accumulés dans vos favoris au fil des ans, vous verrez que lorsque vous vous habituerez à la recherche plein texte vous en oublierez jusqu'à l'existence de vos signets !

Je vais rédiger prochainement une FAQ pour expliquer les stratégies et les syntaxes de recherche utiles pour tirer toute la pertinence possible de l'outil, donc en attendant profitez-en pour résoudre vos problèmes terminologiques et de traduction anglais-français ou vice-versa : testez-le, j'apprécierai grandement votre expérience en retour et je reste ouvert aux conseils autant qu'aux critiques constructives. Je n'ai pas encore terminé la base d'indexation, mais il est déjà gaillard, le petit ! Pour l'essayer, c'est par là :






Google Custom Search


Bonne recherche et, surtout : n'oubliez pas, créez le vôtre !

Jean-Marie Le Ray

, , , , , ,