Affichage des articles dont le libellé est cooccurrences. Afficher tous les articles
Affichage des articles dont le libellé est cooccurrences. Afficher tous les articles

mercredi 25 mars 2009

Recherche Internet : mots clés & allongement des requêtes



Dans un billet signalé par Tom sur l'augmentation de la longueur moyenne des requêtes, le blogueur conclut :
Il semble donc de plus en plus pertinent de vouloir baser sa stratégie de référencement naturel, voire même d’achat de mots-clés, sur des expressions longues, dans la mesure où celles-ci sont appelées à non seulement devenir plus populaires, mais à fournir une information plus qualifiée aux internautes… et par conséquent à offrir les meilleurs taux de conversion et de satisfaction en cas de réelle pertinence.
Chose que j'annonçais déjà en ... janvier et octobre 2006, dans deux billets respectivement intitulés « Les co-occurrences, ou l'avenir de la recherche sur le Web » et « Booster son blog : mots clés et optimisation », où j'observais ce qui suit :
Pourtant, avec l'accroissement exponentiel du Web, il semble bien que les requêtes sur 1 ou 2 mots clés diminuent fortement et laissent la place aux recherches sur 3, 4 mots et plus.
Selon mes « statistiques obtenues de façon empirique », j'indiquais « une prépondérance de 40% des requêtes à 4 et 5 mots », chose corroborée aujourd'hui :



avec 34,37% des requêtes à 4 mots et plus

En octobre 2006, je concluais ainsi :
Pour les mots uniques, mis à part les termes sur lesquels vous êtes déjà positionnés, il est pratiquement inutile de tenter l'aventure... Par conséquent les cooccurrences intéressantes sont celles entre 2 et 5 mots clés.
Soit aujourd'hui près de 70% des requêtes (68,85 pour être précis), ce qui laisse quand même une marge de manœuvre importante.

Dans le temps, on passe donc d'une moyenne de 1,2 mot par requête en 1998, à 2,44 mots en 2005 et 3,3 en 2006 selon Yahoo, avec la tendance suivante sur la décennie 2000-2009 :


Où le pourcentage représente le pourcentage cumulé sur 1 et 2 mots clés. Pour en arriver en mars 2009 avec le résultat suivant : 56,05% des requêtes ont 3 mots et plus, ainsi divisés :
  • 21,68% à 3 mots
  • 34,37% à 4 mots et plus…
Ma conclusion de l'époque est donc toujours valable :
L'optimisation des pages d'un site doit maintenant prendre en compte les mots associés, ou, si l'on préfère, les co-occurrences clés...
Sur ce, bonne optimisation ! Dont je proposais la recette suivante, certes pas pour chaque billet, spontanéité oblige, mais de temps en temps :
Identifier l'univers lexical de son blog en analysant les cooccurrences de mots clés significatives, puis définir une thématique précise par billet, en optimiser sémantiquement le contenu et intégrer la phrase clé centrale (entre 2 et 5 termes pondérés) dans l'URL.
En sachant que la façon dont vous optimisez votre blog (ou votre site) concourt sérieusement à la définition des pages de résultats dans votre moteur préféré...


Partager sur Facebook

, , , , , , , ,

mercredi 25 janvier 2006

Les co-occurrences, ou l'avenir de la recherche sur le Web



Suite : Booster son blog : mots clés et optimisation


Au début des années 2000 (ça semble hier, et c'est déjà si loin, en années-Internet...), tous les référenceurs nous disaient qu'il fallait optimiser son site en mettant en valeur les bons mots clés.
Or aujourd'hui, on parle de moins en moins de mots-clés, et de plus en plus de phrases-clés, une dénomination qui nous vient directement de l'anglais (keywords vs. keyphrases), mais qui est peu satisfaisante (le terme "phrase" véhicule l'idée d'un sens achevé, or peut-on définir "une phrase" une phrase qui n'a aucun sens ? Non ! Tout au plus un amas de mots décousus. Idem pour ces blocs de mots parfois saisis dans les moteurs). Mais là n'est pas la question...

Voici des conseils d'Olivier Andrieu, expert s'il en est, qui datent de décembre 2001 :

  • Les internautes saisissent un mot (30 à 40 % des saisies) ou deux mots (pourcentage à peu près équivalent au précédent) dans leurs requêtes, rarement plus (chiffres qui semblent d'ailleurs en opposition avec un sondage effectué par Abondance l'année précédente) :


  • Sur les moteurs de recherche, vous devrez optimiser les pages - donc leur code HTML - en tenant compte de mots clés uniques ou d'expressions majoritairement sur deux mots.

En mars 2002, une étude d'eStat et d'@position nous donne les chiffres suivants :

  • 28 % des requêtes n'ont qu’un seul mot
  • 34 % 2 mots
  • 37 % 3 mots ou plus.

En novembre 2003, selon Ad'oc, la répartition était la suivante :

  • 39% des requêtes sur 1 mot
  • 28% sur 2 mots
  • 15,4% sur 3 mots

En août 2004, d'après Onestat :

  • 19% des recherches sur 1 mot
  • 33% sur 2 mots clés
  • 25% sur 3 mots
  • 13% sur 4 mots
Enfin, plus récemment, en juillet 2005, selon Mediametrie :
  • 39 % des requêtes ont un mot clé
  • 33 % 2 mots clés
  • 17 % 3 mots clés
  • 11% plus de 3 mots clés


Donc, en gros, selon ces chiffres, dans près de 3/4 des requêtes la moyenne du nombre de mots saisis dans les moteurs iraient de 1 à 3.

Pourtant, avec l'accroissement exponentiel du Web, il semble bien que les requêtes sur 1 ou 2 mots clés diminuent fortement et laissent la place aux recherches sur 3, 4 mots et plus.

Pour en avoir le coeur net, puisque je dispose maintenant d'un échantillon représentatif, je me suis livré à quelques statistiques. Voici les résultats :

  • sur 1032 requêtes, j'obtiens un total de 5142 mots, soit une moyenne de 4,98 mots, arrondie à 5 mots par requête, bien plus que les chiffres cités plus haut !
  • en décomposant ces 1032 requêtes par mots réellement saisis, voici le détail :
  1. mot clé : 5 requêtes (0,5%)
  2. mots clés : 84 requêtes (8%)
  3. mots clés : 181 requêtes (18%)
  4. mots clés : 210 requêtes (21%)
  5. mots clés : 197 requêtes (19%)
  6. mots clés : 148 requêtes (14%)
  7. mots clés : 92 requêtes (9%)
  8. mots clés : 46 requêtes (4%)
  9. mots clés : 30 requêtes (3%)
  10. mots clés : 17 requêtes (1,5%)
  11. mots clés et plus : 21 requêtes (2%)
  • --> 72% des requêtes saisissent entre 3 et 6 mots, avec par ordre d'importance : 4 mots, 5 mots, 3 mots et 6 mots !
En conclusion, ces statistiques obtenues de façon empirique s'éloignent significativement de ce que j'ai pu lire ici et là sur le Web, puisque sur 1032 requêtes, le nombre de mots saisis va de 1 (dans 5 cas seulement) à 17 (!), avec une prépondérance (40%) des requêtes à 4 et 5 mots. Fini le temps où les requêtes sur 2 et 3 mots clés étaient majoritaires. Il y a même plus de requêtes sur 7 mots clés que sur 2 !

Ce qui voudrait dire, en reprenant le conseil d'Olivier Andrieu, que l'optimisation des pages d'un site doit maintenant prendre en compte les mots associés, ou, si l'on préfère, les co-occurrences clés.

J'ai donc fait quelques recherches pour voir si ce sujet était traité quelque part, et je n'ai trouvé qu'une source (mais si quelqu'un me lit et peut m'en signaler d'autres, je suis preneur), un billet de WebRankInfo intitulé : « Calculer l'indice de co-occurrence et le ratio E/F »

Je n'ai pas vraiment compris la signification du ratio E/F (Exposure/Frequency ?), mais j'ai voulu tester l'outil avec la co-occurrence "traduction anglais français" :

Donc, si j'en crois les explications données pour l'indice de co-occurrence, qui « mesure le relation entre les termes : plus cet indice est élevé, plus les termes sont reliés. Concrètement, plus l'indice est élevé, plus il est fréquent de trouver des documents qui contiennent les différents termes. », je ne devrais pratiquement jamais rencontrer "traduction anglais français", mais très souvent "traduction anglais" et "anglais traduction".

Vérification pratique sur Google :


Et encore, uniquement sur le Web francophone. J'ai essayé l'outil Suggest de Google (malheureusement, l'interface n'est disponible qu'en anglais pour le moment), qui vous suggère le nombre d'occurrences trouvées au fur et à mesure que vous tapez le mot dans l'onglet de recherche, et sur "traduction anglais français" les résultats (1 150 000) sont multipliés par plus de 20 :

traduction anglais français : 1150000 résultats

Donc, même si la pertinence de l'outil français présenté ci-dessus n'est pas au rendez-vous, ça va dans le bon sens !


, , , , , , , , , ,