Comment le fichier "sitemap.xml" peut optimiser votre référencement

Le fichier "sitemap.xml" est peut-être l'un des éléments les moins présents à l'esprit lorsque l'on évoque les techniques de référencement d'un site Web. Pourtant, c'est une pièce qui joue un rôle non négligeable dans la compréhension qu'ont les moteurs de recherche sur le contenu du site. Ce fichier est utilisé comme un moyen de communiquation directe entre le site Web et les moteurs de recherche pour les informer de la mise en ligne d'un contenu ou modifié très récement et favorise ainsi l'indexation plus rapidement de ce contenu.

Pour les auteurs de contenu, il est indispensable d'aider Google à déterminer précisément si votre site est l'auteur original du contenu. Nous allons voir au travers de cet article pourquoi il est important d'être identifié comme l'auteur d'un contenu et voir comment le fichier "sitemap.xml" peut optimiser votre référencement.

Le Sitemap, cet inconnu indispensable

C'est quoi un fichier Sitemap ?

En novembre 2006, Google, Yahoo et Microsoft se mettent d'accord pour supporter et reconnaitre le protocole Sitemaps. Ask.com a récemment rejoint les précurseurs en la matière, ce sont désormais les 4 principaux moteurs de recherche qui supportent ce protocole.

Le fichier "sitemap.xml" est un document lisible par les robots d'indexation, rédigé au formal XML (ou texte) qui répertorie les URL d'un site. Ce fichier ajoute également des informations complémentaires sur chaque adresse, comme sa date de dernière modification, sa fréquence de mise à jour et son importance par rapport aux autres adresses du site. Ce fichier permet donc aux robots des moteurs de recherche d'explorer le site plus intelligemment.

 

Indexation de contenu, Duplicate Content et Panda

Il n'est pas rare que les auteurs diffusent leur contenu sur d'autres sites que le leur. En outre, il est également courant pour les auteurs de voir le contenu de leur site "repris" par d'autres sites Web sans un accord formel de syndication.

Malheureusement, la définition de la curation de contenu est pour le moins floue et certains s'en arrangent. Seulement, pour l'auteur proposant du contenu syndiqué ou ayant du contenu partagé avec d'autres sites (avec ou sans permission), les enjeux ne sont pas exactement les mêmes aux yeux de Google.

L'annonce en février 2011 de la mise à jour de l'algorithme Panda était principalement axé sur la suppression de contenu dupliqué des pages des résultats de recherche du moteur de recherche. En clair, cela signifie que si un site n'est pas considéré comme étant l'auteur d'origine du contenu, il risque d'être exclu des pages de résultats.

En ce sens, les fichiers "sitemaps" sont un outil idéal qui peut aider les créateurs de contenu à définir leur rédaction comme étant la version originale du contenu.

Comment indiquer dans le fichier "sitemap.xml" qu'on est l'auteur d'origine du contenu ?

En théorie, on peut supposer que le contenu d'origine a probablement été indexé le premier. Nous allons voir qu'en réalité, il peut en être autrement. En effet, si l'auteur d'origine n'utilise pas de fichier "sitemap.xml", il y a de fortes chances que le site de curation ou de syndication aura le même contenu indexé plusieurs dizaines de minutes avant le contenu original:

 

Par où commencer ?

Tout d'abord, je vous encourage à lire les conseils fournis par Google qui vous donneront des clefs supplémentaires sur la création de ce fichier.

Si vous utilisez un CMS moderne de type Joomla, vous n'avez rien à faire puisque le fichier Sitemap est généré automatiquement à la racine de votre site.
Les utilisateurs de WordPress devront eux installer un plugin supplémentaire puisque leur CMS ne génère pas automatiquement de Sitemap...
Par la suite, ce fichier sera automatiquement mis à jour à chaque contenu ajouté ou modifié sur votre site Web.

Si vous n'utilisez pas un CMS, . vous devrez probablement créer votre propre fichier en utilisant un outil tel que xml-sitemaps.com. Cela vous imposera également de le mettre à jour régulièrement pour vous assurer que votre contenu et ses informations soient correctement indexés.

Si vous avez un très grand site Web, vous devrez probablement avoir recours à un index. Les moteurs de recherche n'indexent pas plus de 50 000 URL dans un Sitemap (ou 10 Mo). Si vous souhaitez répertorier plus de 50 000 URL, vous devez créer plusieurs fichiers Sitemap. Si vous fournissez plusieurs plans Sitemap, vous devez répertorier chaque fichier Sitemap dans un fichier d'index Sitemap. Vous trouverez toutes les informations nécessaires pour créer un index de Sitemap sur ce lien.

 

Soumettre votre Sitemap aux moteurs de recherche

Après avoir créé votre/vos Sitemaps, vous aurez besoin de le/s soumettre auprès des différents moteurs de recherche. A ce sujet, Google et Bing incitent les webmasters à soumettre leurs Sitemaps et leurs flux RSS feeds via Google Webmaster Tools et Bing Webmaster Tools.

Réaliser cette étape de soumission permet d'indiquer clairement aux moteurs de recherche où est situé votre Sitemap - ce qui veut dire que dès que le Sitemap est mis à jour, les moteurs de recherche peuvent indexer votre nouveau contenu. Par ailleurs, les agrégateurs de contenu peuvent utiliser votre flux RSS pour reprendre et afficher automatiquement votre contenu sur leurs sites.

L'enregistrement de votre Sitemap (et/ou de votre flux RSS) indique aux moteurs de recherche que votre contenu a été créé ou mis à jour avant qu'ils puissent le trouver sur d'autres sites. Ce processus est vraiment très simple à réaliser pour les deux moteurs.

Enregistrer un Sitemap sur Google Webmaster Tools :

  1. Vérifier d'abord que votre Sitemap est bien sur le serveur et accessible via son URL,
  2. Connectez-vous à Google Webmaster Tools.
  3. Dans la rubrique "Exploration", sélectionnez "Sitemaps",
  4. Cliquez sur le bouton rouge situé en haut à droite "Ajouter/tester un Sitemap".
  5. Entrez l'URL de votre Sitemap et cliquez sur "Soumettre le Sitemap".

Google Webmaster Tools

Google Webmaster Tools fournit également des détails sur les potentielles erreurs que pourraient contenir votre fichier Sitemap.

Enregistrer un Sitemap sur Bing Webmaster Tools :

  1. Vérifier d'abord que votre Sitemap est bien sur le serveur et accessible via son URL,
  2. Connectez-vous à Bing Webmaster Tools.
  3. Cliquez sur "Configurer mon site" puis sur "Sitemaps",
  4. Entrer l'URL complète de votre Sitemap dans le champ "Suggérer un Sitemap",
  5. Cliquez sur "Envoyer".

Bing Webmaster Tools

Pour les sites ayant différents types de contenus, il existe d'autres types de Sitemaps pour les images, les videos et le mobile. N'hésitez surtout pas à les utiliser pour faire indexer ces contenus.

 

Conclusion

Après avoir lu cet article, il ne fait plus aucun doute que votre site Web ne peut pas être visible sans avoir un (ou plusieurs) Sitemap. Nous l'avons vu également, avoir un Sitemap enlève une charge considérable de travail pour la soumission des URL. Générer un Sitemap n'est pas une affaire très compliquée, surtout avec les nombreux outils en ligne qui sont disponibles. Et nau vu des services rendus par ce fichier, ile st évident qu'il ne faut pas s'en priver.

N'hésitez pas à poser vos questions ou à partager vos remarques à ce sujet dans les commentaires ci-dessous.


Daniel Dubois

Daniel Dubois

Passionné par le Web depuis 2007, Daniel défend la veuve et l'orphelin du web en créant des sites respectueux du W3C. Fort d'une expérience de plusieurs années, il partage ses connaissances dans un état d'esprit open source.
Très impliqué dans la communauté Joomla depuis 2014, il est actif au sein de plusieurs projets, conférencier et fondateur du JUG Breizh.