vendredi 10 février 2006

Linkbait & linkbaiting : une tentative de traduction

En réponse à un précédent billet, l'un des trop rares commentateurs de cet extraordinaire blog me disait ceci :
« Nous sommes au moins 2 (à te lire...) ! Excellent groupe d'articles JM. Ils constituent un bon exemple de LinkBait ».
J'avoue que je ne connaissais pas ce terme, aussi ai-je décidé de m'y intéresser, en irréfrénable curieux que je suis (ce qui est d'ailleurs une qualité pour un traducteur).

Comme le souligne Bill Hartzer dans son article, même si le terme est plutôt récent, le concept qui se cache derrière est aussi vieux que l'Internet (Although the term "link bait" is fairly new, the entire concept of link bait has been around as long as the internet itself).

Voyons d'abord ce qu'on trouve sur le Web à propos de bait et de baiting. Parmi de multiples définitions possibles, il convient d'isoler celles qui ont un lien (puisqu'on en parle !) avec notre sujet :
  • Le "bait", c'est l'appât dont se servent les pêcheurs pour ferrer le poisson. Un concept qui prend une connotation négative appliqué à la publicité, puisque le "bait advertising" est une pratique à la limite de la légalité, qui consiste à appâter le client par des prix exceptionnellement bas, qui cassent le marché pour tout dire ;
  • Le "baiting", c'est l'acte de provoquer les internautes par la polémique ou autre, en cherchant à susciter une réponse embarrassante de la cible et à déclencher le rire ou l'amusement chez les autres.
Donc à première vue, les notions de "link bait" et de "link baiting" (volontiers contractés par les anglophones en "linkbait" et "linkbaiting") seraient plutôt négatives si l'on s'en réfère à ce qui précède. Or il n'en est rien, puisque le sens désormais associé à ces termes semble franchement positif, dont l'émergence remonte à la fin du mois de janvier, voilà à peine 15 jours (même si on trouve certains signes avant-coureurs dès novembre 2005, voir entre autres ici, ici ou ) !

Maintenant, pour transposer l'idée en français, la métaphore toute trouvée est celle de la pêche à la ligne (hameçonnage serait plus correct mais le terme est déjà pris pour traduire "phishing"), où la ligne c'est le lien, où le blogueur tient le rôle du pêcheur, où l'hameçon c'est l'accroche (le hook), et où les gentils poissons sont tous ceux qui auront l'amabilité de mettre spontanément un lien vers votre blog, sans que vous ayez l'air de le leur demander (même si l'intention avouée est celle-là) !

Attrape-liens ou appâte-liens, j'aurais tendance à traduire le link bait et le link baiting par la « pêche au lien » (ou « pêche aux liens », puisqu'on en veut plusieurs, hein, si possible !). Il ne nous reste plus qu'à voir par l'exemple l'art et la manière de pratiquer ce nouveau sport.

* * *

L'analogie avec le sport n'est pas gratuite, le sport nécessitant par définition de l'endurance et de la technique. Le talent peut être inné, il n'en demeure pas moins qu'il faut le nourrir et le cultiver !

Concrètement, ça consiste à créer chez vos lecteurs ou vos visiteurs d'un instant l'envie irrépressible de faire un lien vers votre blog, votre site, vers un article ou une idée en particulier. Les anglo-saxons, qui sont toujours premiers lorsqu'il s'agit de créer une mode ou un mouvement sur Internet, ont déjà défini les contours de la technique pour créer des liens entrants (ces fameux liens naturels ou organiques chers aux référenceurs) sans en avoir l'air, et distinguent plusieurs manières de le faire :
  • sur le mode amusant (en jouant sur le pouvoir d'attraction du divertissement ou de l'humour) - funny
  • sur le mode polémique (les sujets qui fâchent exercent forcément de l'attrait auprès de ceux qui se sentent concernés par le sujet, en pour ou en contre) - controversial, contrary hooks, attack hooks
  • sur le mode informationnel (informer, apprendre, serrer l'actualité au plus près, dénicher le scoop, etc.) - informative, news hooks
  • sur le mode créatif (mettre en ligne la nouveauté, inventer un concours, mettre un prix en jeu en payant de sa poche, etc.) - creative
  • sur le mode utile (offrir un outil innovant, proposer des liens qui sortent de l'ordinaire, etc.) - resource hooks
Dans une étude de cas détaillée, Loren Baker nous explique la genèse de son idée de prix pour les blogs dédiés aux moteurs de recherche (reprise et réaménagée chez nous par Abondance), qui a permis de générer la bagatelle de 1 960 rétroliens sur Yahoo !

Et de conclure, avec le pragmatisme habituel des anglo-saxons :
« J'ai travaillé 4 heures à la création du concours ; si le coût estimé des liens organiques en référencement est de 100 $ l'unité, je peux évaluer la valeur des liens obtenus à 196 000 $ ; qui plus est, même en ne gardant que 10% comme pourcentage de liens de qualité, ça me donne encore 196 excellents liens que je n'avais pas auparavant ; c'est effectivement une bonne idée... »
En espérant que cette idée fera des petits chez mes lecteurs :-)


P.S. Pour l'anecdote : j'ai cherché sur le Web français, il n'y a que 10 résultats (limités aux pages les plus pertinentes), dont aucun en français, puisque les différents sites mentionnant le "linkbait" se contentent de reprendre des actus américaines ou anglaises.

Ce qui revient à dire que ce billet serait le premier à traiter la chose dans notre langue. Amies lectrices, amis lecteurs, c'est pas du linkbait 100% pur jus ça ?

P.S. bis : j'ai quand même eu ma petite satisfaction puisque mon billet est indexé sur le moteur de Google consacré aux blogs, et c'est apparemment le seul en français ! Cocorico...



[MàJ - 19 décembre 2006] J'avoue qu'en écrivant ce billet, il y a plus de dix mois, j'ignorais totalement qu'il allait être précurseur en matière de pêche aux liens sur le Web francophone. Le linkbaiting, une technique plus que jamais au goût du jour, puisqu'elle est mentionnée sur le blog officiel de Google :
Gardez donc à l’esprit, ..., que les moteurs de recherche récompensent aujourd’hui le travail apporté au contenu qui attire des liens naturels.
Au linkbait de qualité, donc. C'est moi qui traduis, mais c'est mon métier :-)

Tags , , , , ,

mardi 7 février 2006

Quelques légendes sur l’indice de popularité

Les enjeux d’une stratégie de liens - Chapitre III

Avertissement : ce billet continue la série Stratégie de liens, qui est la traduction française du rapport « Linking Matters ». Pour ceux qui préfèrent, voir le chapitre original ; à noter qu'il peut y avoir quelques différences entre la version anglaise HTML, légèrement réaménagée par son auteur pour la mise en ligne, et la présente version française, qui traduit l'intégralité du rapport au format PDF.

III. Quelques légendes sur l’indice de popularité


1. L’indice de popularité est la panacée
2. Plus vous avez de liens entrants qui mènent à votre site, mieux c’est
3. Vous réussirez toujours à tromper les moteurs de recherche
4. Vous pouvez sortir du lot même sans proposer de contenu de qualité
5. Le principal avantage de l’indice de popularité se traduit par un placement optimisé dans les moteurs de recherche
6. Une fois votre campagne terminée, vous pouvez passer à autre chose
7. Un bon logiciel peut faire le travail à votre place


1. L’indice de popularité est la panacée

Le concept de base de l’indice de popularité est simple : si quelqu’un pointe un lien vers votre site, vous avez un point ; si vous proposez un lien vers un autre site, c’est celui-ci qui obtient le point.

Pour autant tous les sites ne sont pas égaux et, donc, tous les liens ne sont pas égaux. Si un portail industriel à fort trafic pointe vers votre site, ce lien a infiniment plus de poids que celui qui provient d’un site « tout gratuit » à faible trafic, ça coule de source. D’où la création du PageRank de Google et des différents algorithmes mis au point par d’autres moteurs de recherche.

Le PageRank n’est autre que la mesure de l’ « utilité » d’un site selon Google. Cet indice influe et a un effet démultiplicateur sur la valeur de chaque lien. Un lien venant d’un site avec un PageRank de 7 sera jugé fortement recommandable ; a contrario, un lien provenant d’un site Web ayant un PageRank de 0 sera considéré sans la moindre valeur.

Un lien vers votre site pointant d’un portail industriel à fort trafic a infiniment plus de poids que celui qui provient d’un site « tout gratuit » à faible trafic.

Google, AltaVista, Excite et Hotbot déclinent tous à leur matière l’indice de popularité d’un site lorsqu’ils procèdent à son classement. [Début]

2. Plus vous avez de liens entrants qui mènent à votre site, mieux c’est

Le postulat semble plausible : plus vous avez de liens pointant vers votre site, plus vous aurez de chances que de nouveaux internautes viennent le visiter. Mais est-ce vrai ?
En effet, si personne ne les voit jamais, ils pourraient aussi bien ne pas exister ! Échanger avec ce type de liens n’est qu’une perte de temps et de ressources. Donc, développer une stratégie de liens efficace ne signifie pas l'obtention du plus de liens possibles, mais la recherche de liens pertinents qui feront confluer du trafic qualifié vers votre site. [Début]

3. Vous réussirez toujours à tromper les moteurs de recherche

Nombreux sont ceux qui dépensent beaucoup de leur temps et de leur énergie à tenter d’embrouiller les moteurs de recherche. Certes, leurs efforts semblent parfois couronnés de succès pour un certain temps, mais ce serait oublier que les moteurs traquent constamment les pratiques douteuses, qu’ils ne manquent pas de sanctionner dès qu’ils les détectent. Par conséquent, d’un côté, les attaques se succèdent et, de l’autre, les contre-mesures sont de plus en plus sophistiquées.
L’évolution du Web a déjà vu l’ascension et le déclin du keyword spamming (ou utilisation indue des mots clés), du free-for-alls (le gratuit pour tous), des fermes de liens, des liens cachés et autres avatars de ce genre. Donc les ressources déployées sont considérables et le gain, pour peu qu’il y en ait un, de courte durée.
Mieux vaut encore s’atteler à donner aux moteurs ce qu’ils veulent vraiment, à savoir un contenu de premier choix, bien organisé, publié dans les règles de l’art, et de bons hyperliens pointant vers des ressources pertinentes. Concentrez-vous sur cette tâche, tôt ou tard vos efforts seront récompensés ! [Début]

Hooked & Linked!
4. Vous pouvez sortir du lot même sans proposer de contenu de qualité

Imaginons un instant que vous êtes le top des référenceurs disposant d’outils de pointe, un expert en moteurs de recherche au maximum de son potentiel, capable de drainer un trafic considérable vers les sites des clients qui vous feront confiance.
Il est clair que les internautes qui arriveront en masse sur ces sites sont tous à la recherche de quelque chose qu’ils espèrent trouver, tous veulent que leurs attentes soient satisfaites, que leurs questions obtiennent des réponses, que leurs problèmes soient solutionnés.
Tous veulent dénicher le contenu ou la fonctionnalité dont ils rêvent, faute de quoi leur « expérience utilisateur » s’arrêtera là ! Par conséquent, si vous ne pouvez donner aux gens ce qu’ils demandent, cela signifie que vous perdez votre temps, et eux le leur. [Début]

5. Le principal avantage de l’indice de popularité se traduit par un placement optimisé dans les moteurs de recherche

Certes, un bon indice de popularité aura sans aucun doute des retombées positives sur vos performances dans les moteurs de recherche, mais ce n’est que la partie émergée de l’iceberg.
Car la mise en œuvre d’une stratégie de liens a d’autres atouts : attirer davantage de visiteurs, mettre à leur disposition du contenu et des ressources supplémentaires, en savoir toujours plus sur votre secteur d’activité et sur votre positionnement compétitif, « construire la confiance » ou devenir partie intégrante d’une communauté virtuelle élargie.
Autant de facteurs positifs qui dépassent de loin le seul gain de placement dans les moteurs, et qui vous donneront résolument beaucoup d’autres satisfactions. [Début]

6. Une fois votre campagne terminée, vous pouvez passer à autre chose

Sachez qu’une stratégie de liens efficace exige un engagement constant.
Il ne s’agit pas seulement d’entretenir votre « parc de liens », mais plutôt d’en ajouter régulièrement d’autres. Une fois que vous avez réalisé les « fondamentaux », il y a une phase naturelle d’expansion durant laquelle de nouveaux sites pointent spontanément des liens vers le vôtre. Or cela n’est pas suffisant.
D’une part, il vous faut continuer à fournir du contenu et des ressources à l’intention des sites qui pointent déjà vers vous ; de l’autre, vous devez consacrer chaque semaine un peu de temps à la prospection de liens supplémentaires.
Ainsi, vous pourrez accroître et enrichir votre stratégie de liens au fur et à mesure que votre expérience et vos connaissances augmenteront. [Début]

7. Un bon logiciel peut faire le travail à votre place

Aucun logiciel ne peut automatiser les processus de l’interaction humaine qui est au cœur de toute stratégie de liens efficace. De même qu’aucune quantité d’intelligence artificielle ne saura jamais générer des partenaires potentiels d’échange de liens plus efficacement que vous quand vous y travaillez avec méthode et réflexion.
A fortiori lorsqu’il s’agit de transmettre des demandes de liens par messagerie électronique. En utilisateurs avertis, les internautes ne supportent plus les envois de courriels en masse, et les messages anonymes qui leur arrivent passent vite fait à la trappe.
Sélectionnez plutôt quelques sites triés sur le volet et contactez-les de façon personnalisée, en expliquant dans le détail à chaque webmestre ce que vous lui offrez, quel serait le positionnement idéal d’un lien sur son site en vertu de la complémentarité des contenus, et soyez sûr que vous obtiendrez non seulement un excellent taux de réponse, mais aussi et surtout des liens à forte valeur ajoutée.
Une fois ce travail préalable effectué, il est évident que certains logiciels pourront vous faciliter la tâche en automatisant une partie du processus de demandes de liens. Citons tout d’abord Arelis et Zeus, qui ont tous deux des fonctionnalités similaires, puisqu’ils sont capables de détecter les sites utilisant les mots clés que vous aurez choisis, de les sauvegarder automatiquement dans leur base de données et d’envoyer ensuite en automatique des courriels à partir des informations emmagasinées. Si vous le souhaitez, ils peuvent même créer automatiquement sur vos pages des liens réciproques. [Début]

À venir : IV. Indice de popularité : quel est votre score ?


Partager sur Facebook

, ,

dimanche 5 février 2006

Google et le business des noms de domaine


Google et le business des noms de domaine

Avis aux lectrices et lecteurs : attention, billet marathon ! Celles et ceux qui auront le courage et la patience d'arriver jusqu'au bout gagnent ... toute ma reconnaissance :-)

1. Introduction aux related searches de Google
2. Le service AdSense for Domains de Google
3. La nouvelle ère du business sur Internet : la sémantique contextuelle
4. Explication
5. Du type-in au typo-in...

1. Introduction aux related searches de Google

Il y a quelques jours, le 1er février pour être précis, Olivier Andrieu annonçait dans ses actus l'apparition timide des recherches connexes de Google sur l'Internet francophone, en réponse à la syntaxe "define:". En quoi ça consiste ?
Vous saisissez dans l'onglet de recherche « define:[mot ou expression qui vous intéresse] », et Google vous propose plusieurs définitions correspondantes en affichant des termes connexes en haut de ses résultats. Exemple pour "traduction" :

Termes connexes affichés : "mémoire de traduction", "informatique et traduction", "traduction française des", "le logiciel de traduction", "services de traduction", "traduction automatique", "traduction renversee", "compétence de traduction", ces termes menant eux-mêmes à d'autres définitions.

On sent bien que les résultats en
français sont quelque peu hésitants, tant et si bien que Google vous renvoie à d'autres langues quand il ne trouve rien. Exemple avec "marketing" :

Aucun terme connexe n'est visualisé mais un choix de langues en option. Cliquez sur "anglais" et voici enfin les « related searches » :


Expressions connexes : "direct marketing", "marketing plan", "marketing mix", "marketing research", "search engine marketing", "viral marketing", "affiliate marketing", "internet marketing", "permission marketing", "database marketing".

Certes, la pertinence est plus affinée en anglais. Comme le note O. Andrieu (qui propose aussi une alternative), « les résultats semblent parfois moins heureux » en français, et il termine en posant la question suivante : « Ces infos sont-elles proposées pour la syntaxe "define:" uniquement en version bêta avant d'être élargies aux pages de résultats "classiques" ? Difficile à dire pour l'instant... »

C'est le seul point où je diverge avec lui, car à mon avis la prévision est facile, elle coule de source, même : toutes proportions gardées, c'est comme pour la grippe aviaire, la question n'est plus de savoir "si" ça va se produire, mais "quand" ! [Début]

* * *

2. Le service AdSense for Domains de Google

Google est d'ailleurs très avancé dans sa technologie sémantique, puisqu'il propose déjà cette fonctionnalité aux professionnels des noms de domaine, avec un service dénommé « Google AdSense for domains ».

Voyons de plus près de quoi il retourne.

Google propose aux gros centres d'enregistrement et aux gros détenteurs de noms de domaine, c.-à-d. qui gèrent des dizaines, ou plutôt des centaines de milliers de domaines, de les « monétiser » en personnalisant chaque landing page, c'est-à-dire la page où vous atterrissez lorsque vous faites une saisie directe (type-in) du nom de domaine dans la barre d'adresse.
Et si j'insiste sur l'adjectif gros, c'est tout simplement parce que si vous ne pouvez pas justifier d'un réseau de sites qui génère au moins 750 000 pages vues/mois, inutile de contacter Google !

La société de Mountain Vew se définit elle-même comme leader du secteur, en fournissant son service sur les pages de plus de 3 millions de domaines stationnés (parked pages), aux mains d'une vingtaine d'acteurs à peine qui se répartissent chacun un portefeuille allant de 100k à 500k domaines et plus...

Voici à quoi ressemble la page de résultats fournie par Google :

Par conséquent, en guise de contenu, pourtant largement prôné par Google, nous obtenons une page 100% « marketing sémantique », truffée de liens sponsorisés et de pubs contextuelles, qui sont à proprement parler la seule raison d'être de la page. De toute façon, 4 américains sur 5 ne font pas la différence entre liens organiques (ou référencement naturel) et liens promotionnels...

Donc, dans la série « faites ce que je dis, mais ne faites pas ce que je fais », pour Google, en-dessous de 750 000 pages vues par mois, c'est du spam, en-dessus c'est du commerce ! Big deals et gros sous, en espèces sonnantes et trébuchantes...

Juste une précision : je ne m'indigne pas sur le principe, en ce sens que je trouve tout à fait licite de gagner de l'argent avec les noms de domaine, je reproche juste le discours à deux vitesses. Mais c'est une autre histoire. [Début]

* * *

3. La nouvelle ère du business sur Internet : la sémantique contextuelle

Le temps est proche où les bannières, les programmes d'affiliation et d'échanges de liens divers feront partie des vestiges de la "civilisation Internet", définitivement supplantés par les publicités contextuelles et autres liens promotionnels, qui sont les chevaux de bataille, pour ne pas dire l'artillerie lourde, de Google, Yahoo, Microsoft, Miva, etc.

Une étude de WebSiteStory sur les taux de conversion nous donne déjà une indication (merci à Guide-Webmaster, qui m'a fourni la source) :

Ces taux de conversion s'appliquent aux quatre types de trafic générés sur Internet pour vous amener là où vous le voulez (ou là où on veut vous amener...), c'est-à-dire, en les prenant par ordre croissant :
  1. les hyperliens fournis par les bannières, les comparateurs de coûts, les affiliations, les liens référents, etc. : 0,96%
  2. les résultats fournis par les outils de recherche (OR) : 2,30%
  3. la navigation directe, qui regroupe les liens de courriels, les favoris et les saisies directes d'URL dans la barre d'adresse des navigateurs : 4,23%
Donc, première surprise, contrairement à ce qu'on pourrait croire, les OR ne se placent qu'au deuxième rang, en offrant un taux de conversion qui représente le double de 1, mais la moitié de 3, c'est-à-dire loin derrière la navigation directe, qui inclut essentiellement l'e-mail marketing, les signets et les "type-ins".
Il n'y a pas, à ma connaissance, d'études qui analysent précisément le segment « navigation directe », mais vraisemblablement l'e-mail marketing et les favoris - parmi les milliers de signets que chacun(e) accumule jour après jour, il devient de plus en plus difficile de retrouver le bon à la volée - ne sont qu'une part marginale, les "type-ins" se taillant la part du lion.

En français, on pourrait appeler ça la "saisie directe" de l'URL (généralement un .com) dans la barre d'adresse. Exemple pratique, tapez http:// (ou www.) type-ins.com :

type-in.com :

typeins.com :

typein.com :
Vous ne trouvez pas qu'à première vue trois de ces quatre pages ressemblent étrangement au modèle AdSense for Domains de Google (soit plus de 750 000 pages vues par mois) ? Qui dit mieux parmi mon très cher lectorat !
Mais la démonstration ne s'arrête pas là, que non... [Début]

* * *
4. Explication

Pour bien comprendre de quoi on parle, il faut lire attentivement un avis de bourse du mois de décembre dernier, qui analyse les bienfaits de la navigation directe pour justifier auprès de ses investisseurs la hausse (de 25 à 30 $) du price target de Marchex, société américaine cotée au Nasdaq.

La navigation directe y est divisée en trois grands volets :
  • la saisie directe de noms communs génériques ("generic" intent)
  • la saisie directe de noms de marque ("branded" intent)
  • la saisie directe de coquilles (mistake traffic, « when the user makes a "typo" when entering a URL address »)
Et les prévisions de développement sont florissantes, puisqu'elles font état de résultats qui vont plus que doubler entre le 2ème trimestre 2005 et le 4ème trimestre 2006 (Q = trimestre et q/q d'un trimestre sur l'autre) :

  • revenus générés par domaine : de 28,93 $ à 60,91 $
  • revenus annualisés par domaine : de 116 $ à 244 $
  • revenus générés par la navigation directe : de 6,4 à 15,2 millions de dollars
Dans un même temps, leur portefeuille devrait passer de 221 000 à 249 000 domaines...

Et Marchex de nous expliquer qu'à terme sa stratégie compte se démarquer notablement de celle des autres acteurs qui occupent la scène de la navigation directe, en créant du contenu et des sites que les internautes pourront trouver soit par la saisie directe, soit par leurs recherches dans les OR, le premier pas consistant à relooker la mise en page. Exemple de loanconsolidation.com :
Avant
Après
Une question, 1., et une remarque, 2. :
  1. l'ancienne version ne vous semble-t-elle pas familière ?
  2. l'évolution graphique est sensible, et ne doit certes rien au hasard :
puisque toutes ces pages ont en commun un élément, invisible en apparence mais omniprésent, c'est-à-dire qu'elles respectent la règle du triangle d'OR, ou Golden Triangle, qui énonce que l'oeil du visiteur se pose d'emblée sur la partie supérieure gauche de l'écran. (cliquer sur l'image pour l'agrandir dans une nouvelle fenêtre)

En gros, nous dit l'étude, l'attention immédiate se concentre sur une zone en forme de F majuscule, où l'oeil balaye en priorité de haut en bas la hampe du F à la recherche d'indices visuels (mots qui ressortent, marques connues, etc.), avant de se déplacer de gauche à droite lorsqu'il capte un signal pertinent. J'avais d'ailleurs commenté cette info en son temps, ici et .

Les auteurs de l'étude poursuivent leur analyse et ont prévu de publier les résultats détaillés dans un livre blanc, à suivre donc.
En attendant, d'ici à ce qu'ils s'avisent de monnayer les premières adresses qui apparaissent dans le F majuscule, il y a pas loin ! [Début]

* * *

5. Du type-in au typo-in...

À venir dans un prochain billet !
[MàJ - 25-04-06] Paru aujourd'hui :
Google et le business des noms de domaine - Du type-in au typo-in...
[Début]


Tags : , , , , , , ,

mercredi 1 février 2006

Les IDN et Internet Explorer 7

Les IDN et Internet Explorer 7

Suite du billet d'avant-hier sur les IDN, ou domaines multilingues. Suite imposée par l'actualité, puisque j'ai posté « IDN : arnaque ou opportunité » la veille du jour où Microsoft annonce la sortie de la 2ème version beta d'IE7 :

La nouvelle a été postée hier sur le blog de Microsoft dédié à IE. Comme quoi c'est dans l'air du temps ! Ou alors c'est que je suis un peu en télépathie avec Bill ! :-)

Voyons donc quels sont les détails qui concernent la prise en charge des IDN et la navigation sécurisée pour faire face aux tentatives de phishing et de spoofing, autrement dit la pêche aux pigeons et les attaques homographes.
Concernant l'hameçonnage, tout en a déjà été dit ou presque, et on se demande encore comment tant de gens peuvent se faire appâter. Pour autant, IE7 prévoit un dispositif anti-phishing pour signaler automatiquement tout danger potentiel pour l'internaute :

Concernant les attaques homographes, c'est relativement plus récent puisque le boom de ce genre d'attaques remonte à début 2005. Observons par ailleurs que la plupart des infos disponibles en français sur les IDN s'arrêtent à cette époque et restent donc sous l'influence négative de ce phénomène d'usurpation d'adresse.

Or en un an, les choses bougent, surtout en informatique et sur Internet, et Microsoft explique dans le détail de quelle manière IE7 combat les lookalike attacks.
Je vais donc m'efforcer de décrire l'exemple en français, en prenant comme point de départ l'usurpation d'adresse de Paypal, dont le mécanisme est démontré sur le site de Secunia (en anglais), où il suffit de cliquer sur le lien ci-dessous

pour que s'ouvre une page avec l'adresse usurpée (si vous voyez apparaître http://www.xn--paypl-7ve.com/ dans la barre d'adresse, c'est que la fonction IDN de votre navigateur est désactivée).
Explication : le deuxième "a" est en alphabet cyrillique, valeur Unicode U+0430

et non pas en alphabet latin (valeur Unicode U+0061), comme nous l'avons vu dans mon précédent billet pour linéaires :

Copyright (c) Studio 92 Snc - 2006Différence parfaitement indétectable pour les navigateurs ignares que nous sommes ! Mais certes pas pour les machines :

Pourtant la parade à ce genre de problème est relativement simple, puisque lorsque vous enregistrez un IDN vous devez associer à chaque nom de domaine une langue, étiquetée comme langue d'enregistrement. Essayez d'enregister "linéaires" en l'étiquetant comme chinois, ça ne marchera pas. Donc dans le cas de Paypal, il suffit de rendre impossible l'enregistrement de caractères cyrilliques pour des noms ne comportant à l'origine que des caractères latins. CQFD !

La procédure est techniquement plus sophistiquée, c'est clair, mais cela donne déjà une idée de la façon dont le problème peut être géré. Et puisqu'on parle d'IE7, je terminerai ce billet en vous donnant un avant-goût de l'interface :

Seul "petit" souci pour l'installation, IE7 ne tourne que sur Windows XP SP2. Bonne navigation quand même (à ceux qui l'ont...) !


, , , , , ,

lundi 30 janvier 2006

Les IDN : arnaque ou opportunité ?

Tout d’abord, de quoi parle-t-on ? C’est quoi les IDN ?

Un puriste exigeant (pléonasme ?) me dirait qu’IDN est un acronyme, et qu’en bon français le sigle serait NDI.
Peut-être. Mais en puriste moi-même, je rétorquerais qu’un sigle francisé doit traduire une implantation terminologique adoptée, au moins par consensus à défaut de l’être par l’usage.
Or dans le cas des IDN, on n’a ni l’un ni l’autre. Si vous êtes chercheurs d'OR, saisissez dans votre outil de recherche préféré NDI + noms de domaine internationalisés, ou NDI + noms de domaine internationaux, et dans un cas comme dans l’autre vous trouverez quelques résultats ici et là, autant d’OVNI (occurrences variées non identifiées) qu’on peut compter sur les doigts de la main.
Noms de domaine accentués semble plus utilisé, mais l’acception est incorrecte : outre les caractères accentués, les IDN prennent en compte les signes diacritiques, les idéogrammes, etc.
Donc, je préfère garder le sigle anglais et parler de noms de domaine multilingues ou internationalisés, voire localisés. Voilà pour la partie terminologique.

* * *

Ça fait longtemps que je m’intéresse aux IDN, très exactement depuis le jour où j’ai découvert leur existence. J’ai alors cherché sur l’Internet francophone tout ce que je pouvais trouver sur la question, et j’ai vite dû déchanter : informations aussi négatives que dépassées, aucune analyse pertinente, tout au plus des anecdotes et une exploitation des angoisses de l’internaute lambda devant les risques du phishing, du spoofing et autres gentillesses, on dirait que les IDN suscitent la psychose collective ! En France du moins.
Mais il faudrait bien que l’on comprenne, dans notre cher pays, que la problématique des domaines multilingues dépasse largement le cadre de nos frontières, tant linguistiques que physiques. Les autres cultures ont d’ailleurs appréhendé la question dans toute sa mesure, des allemands aux chinois, des espagnols aux japonais, des russes aux coréens, etc., qui représentent des centaines de millions d'utilisateurs concernés par les IDN,

au même titre que les français, ceux-ci restant les seuls à faire de la résistance, comme Papy, comme toujours !
Or il suffirait d'examiner un instant notre taux de pénétration sur le Web pour comprendre qu’Astérix a vécu, et que l’exception culturelle à tort et à travers et a contrario, ça ne débouche sur rien d’autre que du vide.

L’Afnic, qui aimerait bien se présenter sous un beau jour en nous parlant de l’évolution des noms enregistrés sous .fr, soit 434.777 domaines au jour où j'écris ce billet (en prenant en compte tous les domaines et sous-domaines enregistrés, juste pour grossir un peu le chiffre…), nous montre une belle courbe :

Pourtant ils devraient aussi préciser que ça ne représente pas même 1% (et encore, en étant larges, disons qu’on est plus proches de 0,5% que de 1%) des quelque 63 millions de domaines actifs (chiffre qui ne comptabilise certainement pas les sous-domaines !).


Quant au taux de pénétration du nombre d’internautes par rapport à la population, nous ne sommes pas même dans la liste des 30 premiers pays !

Si là est l'évolution...

* * *

Passons maintenant au côté pratique.
Le seul centre d'enregistrement français agréé par l'ICANN pour enregistrer les IDN est Gandi. Or essayez d'aller y enregistrer un domaine multilingue, vous verrez que c'est pas gagné d'avance !

Et pourtant, ça va bientôt faire 3 ans que la première version des lignes directrices pour le déploiement des IDN a été approuvée, avant d'être publiée le 20 juin 2003. Pour information, voici une version traduite du projet de rédaction de la version 2.0, datée septembre 2005.

Donc, concrètement, en plus des caractères alphanumériques ASCII (A-Z, 0-9) et du tiret (-), qui sont pris en charge par le système actuel de nommage sur Internet (DNS - Domain Name System), nous avons essentiellement 14 caractères accentués pour le français (avec entre parenthèses la valeur hexadécimale ISO 646) :
  1. le a accent grave : à (00E0)
  2. le a accent circonflexe : â (00E2)
  3. le c cédille : ç (00E7)
  4. le e accent grave : è (00E8)
  5. le e accent aigu : é (00E9)
  6. le e accent circonflexe : ê (00EA)
  7. le e tréma : ë (00EB)
  8. le i accent circonflexe : î (00EE)
  9. le i tréma : ï (00EF)
  10. le o accent circonflexe : ô (00F4)
  11. le u accent grave : ù (00F9)
  12. le u accent circonflexe : û (00FB)
  13. le u tréma : ü (00FC)
  14. la ligature oe : œ (0153)
Maintenant, pour traduire un simple nom accentué en nom acceptable par le DNS, pas besoin de faire de savants calculs, il suffit de prendre un outil de conversion comme il y en a de nombreux sur Internet. Exemple avec Linéaires.com :

La conversion du nom s’effectue en 5 étapes :
  • Selon le protocole Nameprep (chargé de réduire les caractères au format Unicode à une forme canonique, cf. RFC 3491), la valeur Unicode (U+valeur hexadécimale ISO 646) du L majuscule (U+004C) est d’abord convertie en l minuscule (U+006C)
  • Une fois l’opération Nameprep terminée, on a la valeur Unicode du domaine, soit, dans le cas de linéaires, U+006C U+0069 U+006E U+00E9 U+0061 U+0069 U+0072 U+0065 U+0073 :
Copyright (c) Studio 92 Snc - 2006
  • Le nom en version Unicode est alors converti par le protocole Punycode : xn--linaires-d1a.com
  • Puis le nom ainsi codé en chaîne ACE (encodage compatible ASCII) est enregistré dans le système de nommage Internet (DNS – Domain Name System), qui peut désormais l’interpréter
  • Enfin, le nom de domaine est enregistré dans le Whois sous ses deux versions : xn--linaires-d1a.com + linéaires.com
Il ne vous reste plus qu’à développer un beau site (ou, encore mieux, un portail) pour exploiter à plein régime l’énorme potentiel du nom de domaine www.linéaires.com...


P.S. à votre avis, entre ces deux versions, www.lineaires.com et www.linéaires.com, quelle est celle qui aura la préférence de l’internaute francophone ?

, , ,

jeudi 26 janvier 2006

Qu'est-ce qu'une stratégie de liens

Les enjeux d’une stratégie de liens - Chapitre II

Avertissement : ce billet continue la série Stratégie de liens, qui est la traduction française du rapport « Linking Matters ». Pour ceux qui préfèrent, voir le chapitre original ; à noter qu'il peut y avoir quelques différences entre la version anglaise HTML, légèrement réaménagée par son auteur pour la mise en ligne, et la présente version française, qui traduit l'intégralité du rapport au format PDF.

II. Qu’est-ce qu’une stratégie de liens ?


Une stratégie de liens est une méthode permettant de faire pointer des liens entrants vers votre site pour vous aider à réaliser les objectifs commerciaux que vous vous êtes fixés.
La première condition pour bâtir une telle stratégie, c’est que votre site offre un contenu de qualité. Vous pouvez également proposer des liens sortants qui intéresseront vos visiteurs. En dernier lieu, élaborez une liste cible de sites extérieurs avec lesquels vous souhaitez établir un échange de liens.
En d’autres termes, vous devez capitaliser vos ressources dans trois banques différentes : une banque de contenu, une banque de liens sortants et une banque de liens entrants.

Stratégie de liens – Les trois banques

Pour pouvoir financer votre stratégie de liens, vous devez disposer d’un crédit de ressources dans chacune de ces trois banques :

Image © www.linkingmatters.com, 2003
  1. Banque de contenu – Vous disposez d’une source de contenu appropriée, présente et à venir
  2. Banque de liens sortants – Vous avez des liens sortants pas simplement pour échanger mais parce qu’ils sont vecteurs de valeur ajoutée
  3. Banque de liens entrants – Thésaurisez vos réserves de liens entrants, ils produiront durablement des intérêts
Toutefois, mettre en place une stratégie de liens n’est pas la panacée universelle, comme aimeraient faire croire les marchands de rêve qui vous font miroiter un enrichissement rapide.

Avoir des liens juste pour le plaisir d’en avoir ne vous sera d’aucune utilité. Cela pourrait même vous porter préjudice en diminuant votre indice de popularité. Oubliez par conséquent les solutions magiques du genre « fermes de liens » et autres inepties du même acabit. Quelques liens entrants provenant de sites éminents ont bien plus de valeur que de nombreux liens pointant de sites bas de gamme à très faible trafic.

Le principe élémentaire est le suivant :

« Créez du contenu de qualité, offrez des liens vers du contenu hautement qualitatif, et les sites à forte valeur ajoutée pointeront vers vous. »

Pour risquer une métaphore sportive, une stratégie de liens efficace permettra de promouvoir votre site d’une division inférieure à la série A et de vous faire jouer dans la cour des grands !

Cependant ne vous focalisez pas uniquement sur une stratégie de liens. Inscrivez-là plutôt dans le cadre global de votre politique d’e-marketing. Décidez à l’avance le temps à investir et les efforts que vous souhaitez déployer proportionnellement à l’ensemble de vos autres activités marketing, et, surtout, tenez-vous en à l’approche retenue. Implémentez enfin un suivi des résultats et, si nécessaire, sachez adapter votre stratégie en cours de route.

En dernier lieu, concentrez-vous sur les fondamentaux : faites de votre site un lieu convivial et publiez du contenu attractif pour vos visiteurs, autant actuels que potentiels, c’est-à-dire tous les nouveaux internautes que vous souhaitez capter grâce à la mise en place de ces « partenariats de liens ».

Une fois les fondamentaux acquis, l’expansion naturelle d’Internet prendra le dessus et votre indice de popularité augmentera de lui-même, physiologiquement.

Quel est l’indice de popularité des principaux sites marchands ?

Nous avons analysé certains secteurs spécifiques, en Angleterre et aux États-Unis : vente au détail, voyages, finances, santé et loisirs.

Voici les résultats des sites implantés aux États-Unis :


Sites implantés en Angleterre :

N.B. Bien qu’ils renvoient à un même site, les noms de domaine anglais ont souvent deux formes : www.easyjet.co.uk et www.easyjet.com, par exemple. Nous avons donc testé les deux extensions (.co.uk et .com) avant de faire la somme des résultats pour obtenir le score global.

(Parenthèse - Les exemples ci-dessus ont été créés pour un public anglo-saxon dans cinq domaines principaux, mais rien ne vous empêche de répéter ces recherches dans les thématiques - et les langues - les plus proches de vos centres d'intérêt. Note du Traducteur)

Quelle stratégie de liens souhaitez-vous mettre en œuvre ?

En tant que webmestre/propriétaire de site, parmi les options ci-après, laquelle choisissez-vous pour bâtir votre indice de popularité ?
  • Ne rien faire : le choix est catégorique et pourrait même s’avérer raisonnable si vous ne disposez que d’un « site-brochure ». Quoi qu’il en soit, si vous souhaitez que vos pages deviennent partie intégrante du Web et commencent à donner des fruits, ce n’est résolument pas l’option à prendre.
  • En apprendre davantage sur la stratégie de liens, en étudiant notre rapport, en explorant les liens vers d’autres ressources et en faisant des exercices pratiques. Après quoi vous devriez être suffisamment informé pour décider en connaissance de cause du chemin à parcourir.
  • Mener votre propre campagne, en procédant étape par étape et en suivant le processus que nous soumettons à votre attention : une option « éducative » qui vous permettra de vous former aux stratégies de liens et d’acquérir une vision d’ensemble de l’évolution de votre secteur sur Internet.
  • Confier la tâche à des spécialistes : la voie royale si vous disposez du budget adéquat, puisque ces experts mettront leur savoir-faire et leurs connaissances à votre profit. En termes d’impact, cela signifie obtenir beaucoup plus en beaucoup moins de temps.
  • Recruter quelqu’un pour le faire en interne. Là encore, si vous vous avez un budget suffisant, c’est une excellente option : le fait d’avoir sous la main les compétences nécessaires vous permettra de faire d’une pierre deux coups et d’ajuster l’ensemble de votre stratégie marketing.

À venir : III. Quelques légendes sur l’indice de popularité


Partager sur Facebook

, ,

mercredi 25 janvier 2006

Les co-occurrences, ou l'avenir de la recherche sur le Web



Suite : Booster son blog : mots clés et optimisation


Au début des années 2000 (ça semble hier, et c'est déjà si loin, en années-Internet...), tous les référenceurs nous disaient qu'il fallait optimiser son site en mettant en valeur les bons mots clés.
Or aujourd'hui, on parle de moins en moins de mots-clés, et de plus en plus de phrases-clés, une dénomination qui nous vient directement de l'anglais (keywords vs. keyphrases), mais qui est peu satisfaisante (le terme "phrase" véhicule l'idée d'un sens achevé, or peut-on définir "une phrase" une phrase qui n'a aucun sens ? Non ! Tout au plus un amas de mots décousus. Idem pour ces blocs de mots parfois saisis dans les moteurs). Mais là n'est pas la question...

Voici des conseils d'Olivier Andrieu, expert s'il en est, qui datent de décembre 2001 :

  • Les internautes saisissent un mot (30 à 40 % des saisies) ou deux mots (pourcentage à peu près équivalent au précédent) dans leurs requêtes, rarement plus (chiffres qui semblent d'ailleurs en opposition avec un sondage effectué par Abondance l'année précédente) :


  • Sur les moteurs de recherche, vous devrez optimiser les pages - donc leur code HTML - en tenant compte de mots clés uniques ou d'expressions majoritairement sur deux mots.

En mars 2002, une étude d'eStat et d'@position nous donne les chiffres suivants :

  • 28 % des requêtes n'ont qu’un seul mot
  • 34 % 2 mots
  • 37 % 3 mots ou plus.

En novembre 2003, selon Ad'oc, la répartition était la suivante :

  • 39% des requêtes sur 1 mot
  • 28% sur 2 mots
  • 15,4% sur 3 mots

En août 2004, d'après Onestat :

  • 19% des recherches sur 1 mot
  • 33% sur 2 mots clés
  • 25% sur 3 mots
  • 13% sur 4 mots
Enfin, plus récemment, en juillet 2005, selon Mediametrie :
  • 39 % des requêtes ont un mot clé
  • 33 % 2 mots clés
  • 17 % 3 mots clés
  • 11% plus de 3 mots clés


Donc, en gros, selon ces chiffres, dans près de 3/4 des requêtes la moyenne du nombre de mots saisis dans les moteurs iraient de 1 à 3.

Pourtant, avec l'accroissement exponentiel du Web, il semble bien que les requêtes sur 1 ou 2 mots clés diminuent fortement et laissent la place aux recherches sur 3, 4 mots et plus.

Pour en avoir le coeur net, puisque je dispose maintenant d'un échantillon représentatif, je me suis livré à quelques statistiques. Voici les résultats :

  • sur 1032 requêtes, j'obtiens un total de 5142 mots, soit une moyenne de 4,98 mots, arrondie à 5 mots par requête, bien plus que les chiffres cités plus haut !
  • en décomposant ces 1032 requêtes par mots réellement saisis, voici le détail :
  1. mot clé : 5 requêtes (0,5%)
  2. mots clés : 84 requêtes (8%)
  3. mots clés : 181 requêtes (18%)
  4. mots clés : 210 requêtes (21%)
  5. mots clés : 197 requêtes (19%)
  6. mots clés : 148 requêtes (14%)
  7. mots clés : 92 requêtes (9%)
  8. mots clés : 46 requêtes (4%)
  9. mots clés : 30 requêtes (3%)
  10. mots clés : 17 requêtes (1,5%)
  11. mots clés et plus : 21 requêtes (2%)
  • --> 72% des requêtes saisissent entre 3 et 6 mots, avec par ordre d'importance : 4 mots, 5 mots, 3 mots et 6 mots !
En conclusion, ces statistiques obtenues de façon empirique s'éloignent significativement de ce que j'ai pu lire ici et là sur le Web, puisque sur 1032 requêtes, le nombre de mots saisis va de 1 (dans 5 cas seulement) à 17 (!), avec une prépondérance (40%) des requêtes à 4 et 5 mots. Fini le temps où les requêtes sur 2 et 3 mots clés étaient majoritaires. Il y a même plus de requêtes sur 7 mots clés que sur 2 !

Ce qui voudrait dire, en reprenant le conseil d'Olivier Andrieu, que l'optimisation des pages d'un site doit maintenant prendre en compte les mots associés, ou, si l'on préfère, les co-occurrences clés.

J'ai donc fait quelques recherches pour voir si ce sujet était traité quelque part, et je n'ai trouvé qu'une source (mais si quelqu'un me lit et peut m'en signaler d'autres, je suis preneur), un billet de WebRankInfo intitulé : « Calculer l'indice de co-occurrence et le ratio E/F »

Je n'ai pas vraiment compris la signification du ratio E/F (Exposure/Frequency ?), mais j'ai voulu tester l'outil avec la co-occurrence "traduction anglais français" :

Donc, si j'en crois les explications données pour l'indice de co-occurrence, qui « mesure le relation entre les termes : plus cet indice est élevé, plus les termes sont reliés. Concrètement, plus l'indice est élevé, plus il est fréquent de trouver des documents qui contiennent les différents termes. », je ne devrais pratiquement jamais rencontrer "traduction anglais français", mais très souvent "traduction anglais" et "anglais traduction".

Vérification pratique sur Google :


Et encore, uniquement sur le Web francophone. J'ai essayé l'outil Suggest de Google (malheureusement, l'interface n'est disponible qu'en anglais pour le moment), qui vous suggère le nombre d'occurrences trouvées au fur et à mesure que vous tapez le mot dans l'onglet de recherche, et sur "traduction anglais français" les résultats (1 150 000) sont multipliés par plus de 20 :

traduction anglais français : 1150000 résultats

Donc, même si la pertinence de l'outil français présenté ci-dessus n'est pas au rendez-vous, ça va dans le bon sens !


, , , , , , , , , ,