L’hébergement, coût caché du référencement

1. Rapide rappel sur la notion de référencement

Le référencement est un ensemble de techniques « visant à optimiser la visibilité d’un site dans les différents outils de recherche disponibles sur Internet » (Source: L’Internaute). On distingue généralement le référencement payant (les liens sponsorisés sur les pages de résultats des moteurs, comme Google AdWords) et le référencement naturel (les liens organiques, non sponsorisés, sur les pages de résultats des moteurs de recherche).

Le référencement naturel est « gratuit » de base car il n’est pas nécessaire de payer pour apparaître sur les pages de résultats des moteurs.

2. Le référencement naturel, un référencement gratuit ?

Dans les faits, il faut distinguer référencement et visibilité : on peut être référencé par Google ou Bing et apparaître parmi les résultats mais encore faut-il apparaître le plus haut possible dans la liste pour avoir la chance d’être choisi par l’internaute ! C’est là que se situe le coût le plus connu du référencement naturel : investissement en temps et/ou en argent

  • Netlinking : obtenir des liens à partir d’autres sites de la même thématique et/ou à forte notoriété
  • Optimisation de contenu: identification des mots-clés pertinents, rédaction web, optimisation sémantique

La plupart de ces tâches sont aujourd’hui assurés par des agences web spécialisés pour le compte de leurs clients contre espèces sonnantes et trébuchantes.

Mais avant d’optimiser son référencement, il faut pouvoir être référencé. Et la seule façon d’apparaître sur la page de résultats d’un moteur de recherche est que le robot d’indexation de ce dernier visite  chaque page de votre site.

3. L’hébergement, le coût caché du référencement

Pour un blog de quelques dizaines ou centaines d’articles, l’effet est indolore (c’est d’ailleurs pour cela que les offres standards d’hébergement de sites à faible trafic incluent un trafic illimité).
Mais pour un site important à fort contenu avec des centaines de milliers de pages, la problématique est toute autre. D’autant plus que les robots d’indexation repassent de plus en plus souvent afin de disposer d’un contenu le plus « frais » possible (le temps réel est à la mode avec l’indexation des réseaux sociaux !) et que chaque moteur de recherche lance son propre robot à l’assaut du web.

Chaque visite de page sur un site, de la part d’un utilisateur ou d’un robot, génère 2 types de coût :

  • La bande passante : il s’agit du débit de données entre le client (le navigateur) et le serveur (le site web). La bande passante est facturée au propriétaire du site par l’hébergeur. Plus le débit est important, plus le coût est important
  • Les ressources machines : afin de délivrer une page à un utilisateur, un serveur web doit effectuer un certain nombre d’opérations (connexion et recherche dans une base de données, calculs, etc.) qui nécessite des ressources machines (temps de calcul processeur, mémoire vive, entrées/sorties par exemple sur le disque dur). L’hébergeur loue ces ressources au site soit sous la forme de serveurs physiques soit sous la forme de serveurs virtuels, c’est-à-dire des unités de ressources dans le nuage (cloud). Plus le nombre de pages demandées en simultané est importante, plus il faudra de ressources pour servir les pages aux utilisateurs en un temps raisonnable.

Tout créateur de site prévoit traditionnellement ces 2 postes budgétaires dans son business plan :

  • Le référencement pour attirer les visiteurs sur son site
  • L’hébergement pour fournir correctement un service (blog, e-commerce, etc.) à ces visiteurs et les inciter à « consommer » (voir plus d’articles, passer commande)

Mais il oublie très souvent celui induit par les 2 autres : les visites d’indexation du moteur de recherche sont nécessaires au référencement et génèrent comme toute visite un coût d’hébergement. C’est le coût caché du référencement.

4. Evaluation du coût caché du référencement à partir d’un cas concret

Je vais prendre l’exemple d’un site sur lequel j’ai travaillé : un site de contenu multilingue avec un moteur de recherche intégré totalisant 5 millions de pages référencées sur les moteurs et 2 millions de pages vues par jour. Cette statistique est fournie par un outil de mesure d’analyse d’audience (Xiti ou Google Analytics) qui exclut bien sûr tout visiteur non humain : il n’est donc pas possible de se baser sur ce type d’outil pour connaître le nombre de visites de pages provenant des robots d’indexation.

Il faut alors se tourner vers l’analyse des logs de connexion au serveur web et du user-agent : le serveur web est capable d’écrire dans un fichier toutes les requêtes qu’il reçoit indistinctement de l’expéditeur (humain ou robot).

Visiteurs humains
64,13%
Robots d’indexation
35,87%
      – Google Search
18,37%
      – Bing
7,59%
      – Google AdSense
4,69%
      – Baidu
3,93%
      – Google Mobile
0,77%
      – CrystalSemantics
0,15%
      – Yahoo
0,06%
      – Yandex
0,01%
      – Autres
0,29%
Total
100%

On voit donc que les robots d’indexation représentent plus de 35% des pages vues de ce site !
Sans surprise, les Google Bots totalisent 2/3 des visites de robots.

Google Webmaster Tools propose également de visualiser le nombre de pages et de kilo-octets téléchargés quotidiennement par Google bot:

Statistiques d’exploration Google Bot (Google Webmaster Tools)

5. Conclusion: un coût à prendre en compte au risque de subir des pertes

L’hébergement comme coût doit absolument être intégré dans toute stratégie de référencement web car il peut représenter jusqu’à un tiers des pages réellement servies par votre plateforme !

Ignorer ce coût peut avoir de sérieuses conséquences sur la rentabilité de votre activité web :

  • Facturation supplémentaire de la part de votre hébergeur, en particulier sur la consommation de bande passante
  • Nécessité de redimensionner votre plateforme (ajout de serveur ou de ressources machines)
  • Abandon d’utilisateurs, perte de chiffre d’affaires et de positionnement

En effet, si trop de visiteurs (humains ou pas) affluent en même temps sur votre site et qu’il n’est pas dimensionné pour supporter cette charge, certains d’entre eux ne seront pas servis ou trop lentement :

  • s’il s’agit d’un visiteur humain, il risque d’abandonner sa navigation et vous risquez de perdre un une commande ou même un client / utilisateur;
  • s’il s’agit d’un robot, votre site risque d’être mal indexé ou mal positionné

La performance d’un site (vitesse d’affichage) est en passe de devenir un critère de positionnement pour certains moteurs de recherche et Google affiche dans son Webmaster Tools la performance du votre :

Performance du site (Google Webmaster Tools)

Conclusion: anticipez bien le coût caché de votre stratégie de référencement afin que cette dernière ne se transforme pas en fossoyeur de votre positionnement et de votre rentabilité !

Partaget cette article sur

981 commentaires sur « L’hébergement, coût caché du référencement »

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *