Comment le fichier sitemap.xml peut optimiser votre référencement

Et si le fichier sitemap boostait votre référencement ?

Le fichier sitemap.xml est peut-être l'un des éléments les moins présents à l'esprit lorsque l'on pense au référencement d'un site web. Pourtant, c'est une pièce importante dans la compréhension qu'ont les moteurs de recherche du contenu du site. Ce fichier est utilisé comme un moyen de communiquation directe entre le site web et les moteurs de recherche pour les informer de la mise en ligne d'un contenu ou modifié très récement. Cela favorise ainsi l'indexation plus rapidement de ce contenu.

Pour les auteurs de contenu, il est indispensable d'aider Google à déterminer précisément si votre site est l'auteur original du contenu. Nous allons voir au travers de cet article pourquoi il est important d'être identifié comme l'auteur d'un contenu et voir comment le fichier "sitemap.xml" peut optimiser votre référencement.

C'est quoi un fichier Sitemap.xml ?

En novembre 2006, Google, Yahoo et Microsoft se sont mis d'accord pour supporter et reconnaitre le protocole Sitemaps. Ask.com les a rejoint récemment et ce sont désormais les 4 principaux moteurs de recherche qui supportent ce protocole.

Le fichier sitemap.xml est un document lisible par les robots d'indexation, rédigé au formal XML (ou texte) qui répertorie les URL d'un site. Ce fichier ajoute également des informations complémentaires sur chaque adresse, comme la date de dernière modification, la fréquence de mise à jour et son importance par rapport aux autres adresses URL du site. Ce fichier permet donc aux robots d'explorer le site plus intelligemment.

Indexation de contenu, Duplicate Content et Panda

Il n'est pas rare que les auteurs diffusent leur contenu sur d'autres sites que le leur. De plus, il est également courant pour les auteurs de voir le contenu de leur site "repris" par d'autres sites Web sans un accord formel de syndication.

Malheureusement, la définition de la curation de contenu est pour le moins floue et certains s'en arrangent. Seulement, pour l'auteur proposant du contenu syndiqué ou ayant du contenu partagé avec d'autres sites (avec ou sans permission), les enjeux ne sont pas exactement les mêmes aux yeux de Google.

L'annonce en février 2011 de la mise à jour de l'algorithme Panda était principalement axé sur la suppression de contenu dupliqué des pages des résultats de recherche du moteur de recherche. En clair, cela signifie que si un site n'est pas considéré comme étant l'auteur d'origine du contenu, il risque d'être exclu des pages de résultats.

En ce sens, les fichiers sitemaps sont un outil idéal qui peut aider les créateurs de contenu à définir leur rédaction comme étant la version originale du contenu.

Comment indiquer dans le fichier sitemap.xml qu'on est l'auteur d'origine du contenu ?

En théorie, on peut supposer que le contenu d'origine a probablement été indexé le premier. Nous allons voir qu'en réalité, il peut en être autrement. En effet, si l'auteur d'origine n'utilise pas de fichier sitemap.xml, il y a de fortes chances que le site de curation ou de syndication aura le même contenu indexé plusieurs dizaines de minutes avant le contenu original:

Par où commencer ?

Tout d'abord, je vous encourage à lire les conseils fournis par Google qui vous donneront des clefs supplémentaires sur la création de ce fichier.

Si vous utilisez un CMS moderne de type Joomla, vous n'avez rien à faire puisque le fichier Sitemap est généré automatiquement à la racine de votre site.
Les utilisateurs de WordPress devront eux installer un plugin supplémentaire puisque leur CMS ne génère pas automatiquement de Sitemap...
Par la suite, ce fichier sera automatiquement mis à jour à chaque contenu ajouté ou modifié sur votre site Web.

Si vous n'utilisez pas un CMS, . vous devrez probablement créer votre propre fichier en utilisant un outil tel que xml-sitemaps.com. Cela vous imposera également de le mettre à jour régulièrement pour vous assurer que votre contenu et ses informations soient correctement indexés.

Si vous avez un très grand site Web, vous devrez probablement avoir recours à un index. Les moteurs de recherche n'indexent pas plus de 50 000 URL dans un Sitemap (ou 10 Mo). Si vous souhaitez répertorier plus de 50 000 URL, vous devez créer plusieurs fichiers Sitemap. Si vous fournissez plusieurs plans Sitemap, vous devez répertorier chaque fichier Sitemap dans un fichier d'index Sitemap. Vous trouverez toutes les informations nécessaires pour créer un index de Sitemap sur ce lien.

Soumettre votre Sitemap aux moteurs de recherche

Après avoir créé votre/vos Sitemaps, vous aurez besoin de le/s soumettre auprès des différents moteurs de recherche. A ce sujet, Google et Bing incitent les webmasters à soumettre leurs Sitemaps et leurs flux RSS feeds via Google Search Console et Bing Webmaster Tools.

Réaliser cette étape de soumission permet d'indiquer clairement aux moteurs de recherche où est situé votre Sitemap - ce qui veut dire que dès que le Sitemap est mis à jour, les moteurs de recherche peuvent indexer votre nouveau contenu plus rapidement. Par ailleurs, les agrégateurs de contenu peuvent utiliser votre flux RSS pour reprendre et afficher automatiquement votre contenu sur leurs sites.

L'enregistrement de votre Sitemap (et/ou de votre flux RSS) indique aux moteurs de recherche que votre contenu a été créé ou mis à jour avant qu'ils puissent le trouver sur d'autres sites. Ce processus est vraiment très simple à réaliser pour les deux moteurs.

Enregistrer un Sitemap sur Google Search Console :

  • Vérifier d'abord que votre Sitemap est bien sur le serveur et accessible via son URL,
  • Connectez-vous à votre Google Search Console.
  • Dans la rubrique "Index", sélectionnez "Sitemaps",
  • Entrez l'URL de votre Sitemap et cliquez sur "Envoyer".

Google Search Console fournit également des détails sur les potentielles erreurs que pourraient contenir votre fichier Sitemap.

Google Search Console

Enregistrer un Sitemap sur Bing Webmaster Tools :

  • Vérifier d'abord que votre Sitemap est bien sur le serveur et accessible via son URL,
  • Connectez-vous à Bing Webmaster Tools.
  • Cliquez sur "Configurer mon site" puis sur "Sitemaps",
  • Entrer l'URL complète de votre Sitemap dans le champ "Suggérer un Sitemap",
  • Cliquez sur "Envoyer".

Pour les sites ayant différents types de contenus, il existe d'autres types de Sitemaps pour les images, les videos et le mobile. N'hésitez surtout pas à les utiliser pour faire indexer ces contenus.

Bing Webmaster Tools

Conclusion

Après avoir lu cet article, il ne fait plus aucun doute que votre site Web ne peut pas être visible sans avoir un (ou plusieurs) Sitemap. Nous l'avons vu également, avoir un Sitemap enlève une charge considérable de travail pour la soumission des URL. Générer un Sitemap n'est pas une affaire très compliquée, surtout avec les nombreux outils en ligne qui sont disponibles. Et nau vu des services rendus par ce fichier, ile st évident qu'il ne faut pas s'en priver.

N'hésitez pas à poser vos questions ou à partager vos remarques à ce sujet dans les commentaires ci-dessous.

Le fichier sitemap.xml est peut-être l'un des éléments les moins présents à l'esprit lorsque l'on pense au référencement d'un site web. Pourtant, c'est une pièce importante dans la compréhension qu'ont les moteurs de recherche du contenu du site. Ce fichier est utilisé comme un moyen de communiquation directe entre le site web et les moteurs de recherche pour les informer de la mise en ligne d'un contenu ou modifié très récement. Cela favorise ainsi l'indexation plus rapidement de ce contenu.

Pour les auteurs de contenu, il est indispensable d'aider Google à déterminer précisément si votre site est l'auteur original du contenu. Nous allons voir au travers de cet article pourquoi il est important d'être identifié comme l'auteur d'un contenu et voir comment le fichier "sitemap.xml" peut optimiser votre référencement.

C'est quoi un fichier Sitemap.xml ?

En novembre 2006, Google, Yahoo et Microsoft se sont mis d'accord pour supporter et reconnaitre le protocole Sitemaps. Ask.com les a rejoint récemment et ce sont désormais les 4 principaux moteurs de recherche qui supportent ce protocole.

Le fichier sitemap.xml est un document lisible par les robots d'indexation, rédigé au formal XML (ou texte) qui répertorie les URL d'un site. Ce fichier ajoute également des informations complémentaires sur chaque adresse, comme la date de dernière modification, la fréquence de mise à jour et son importance par rapport aux autres adresses URL du site. Ce fichier permet donc aux robots d'explorer le site plus intelligemment.

Indexation de contenu, Duplicate Content et Panda

Il n'est pas rare que les auteurs diffusent leur contenu sur d'autres sites que le leur. De plus, il est également courant pour les auteurs de voir le contenu de leur site "repris" par d'autres sites Web sans un accord formel de syndication.

Malheureusement, la définition de la curation de contenu est pour le moins floue et certains s'en arrangent. Seulement, pour l'auteur proposant du contenu syndiqué ou ayant du contenu partagé avec d'autres sites (avec ou sans permission), les enjeux ne sont pas exactement les mêmes aux yeux de Google.

L'annonce en février 2011 de la mise à jour de l'algorithme Panda était principalement axé sur la suppression de contenu dupliqué des pages des résultats de recherche du moteur de recherche. En clair, cela signifie que si un site n'est pas considéré comme étant l'auteur d'origine du contenu, il risque d'être exclu des pages de résultats.

En ce sens, les fichiers sitemaps sont un outil idéal qui peut aider les créateurs de contenu à définir leur rédaction comme étant la version originale du contenu.

Comment indiquer dans le fichier sitemap.xml qu'on est l'auteur d'origine du contenu ?

En théorie, on peut supposer que le contenu d'origine a probablement été indexé le premier. Nous allons voir qu'en réalité, il peut en être autrement. En effet, si l'auteur d'origine n'utilise pas de fichier sitemap.xml, il y a de fortes chances que le site de curation ou de syndication aura le même contenu indexé plusieurs dizaines de minutes avant le contenu original:

Par où commencer ?

Tout d'abord, je vous encourage à lire les conseils fournis par Google qui vous donneront des clefs supplémentaires sur la création de ce fichier.

Si vous utilisez un CMS moderne de type Joomla, vous n'avez rien à faire puisque le fichier Sitemap est généré automatiquement à la racine de votre site.
Les utilisateurs de WordPress devront eux installer un plugin supplémentaire puisque leur CMS ne génère pas automatiquement de Sitemap...
Par la suite, ce fichier sera automatiquement mis à jour à chaque contenu ajouté ou modifié sur votre site Web.

Si vous n'utilisez pas un CMS, . vous devrez probablement créer votre propre fichier en utilisant un outil tel que xml-sitemaps.com. Cela vous imposera également de le mettre à jour régulièrement pour vous assurer que votre contenu et ses informations soient correctement indexés.

Si vous avez un très grand site Web, vous devrez probablement avoir recours à un index. Les moteurs de recherche n'indexent pas plus de 50 000 URL dans un Sitemap (ou 10 Mo). Si vous souhaitez répertorier plus de 50 000 URL, vous devez créer plusieurs fichiers Sitemap. Si vous fournissez plusieurs plans Sitemap, vous devez répertorier chaque fichier Sitemap dans un fichier d'index Sitemap. Vous trouverez toutes les informations nécessaires pour créer un index de Sitemap sur ce lien.

Soumettre votre Sitemap aux moteurs de recherche

Après avoir créé votre/vos Sitemaps, vous aurez besoin de le/s soumettre auprès des différents moteurs de recherche. A ce sujet, Google et Bing incitent les webmasters à soumettre leurs Sitemaps et leurs flux RSS feeds via Google Search Console et Bing Webmaster Tools.

Réaliser cette étape de soumission permet d'indiquer clairement aux moteurs de recherche où est situé votre Sitemap - ce qui veut dire que dès que le Sitemap est mis à jour, les moteurs de recherche peuvent indexer votre nouveau contenu plus rapidement. Par ailleurs, les agrégateurs de contenu peuvent utiliser votre flux RSS pour reprendre et afficher automatiquement votre contenu sur leurs sites.

L'enregistrement de votre Sitemap (et/ou de votre flux RSS) indique aux moteurs de recherche que votre contenu a été créé ou mis à jour avant qu'ils puissent le trouver sur d'autres sites. Ce processus est vraiment très simple à réaliser pour les deux moteurs.

Enregistrer un Sitemap sur Google Search Console :

  • Vérifier d'abord que votre Sitemap est bien sur le serveur et accessible via son URL,
  • Connectez-vous à votre Google Search Console.
  • Dans la rubrique "Index", sélectionnez "Sitemaps",
  • Entrez l'URL de votre Sitemap et cliquez sur "Envoyer".

Google Search Console fournit également des détails sur les potentielles erreurs que pourraient contenir votre fichier Sitemap.

Google Search Console

Enregistrer un Sitemap sur Bing Webmaster Tools :

  • Vérifier d'abord que votre Sitemap est bien sur le serveur et accessible via son URL,
  • Connectez-vous à Bing Webmaster Tools.
  • Cliquez sur "Configurer mon site" puis sur "Sitemaps",
  • Entrer l'URL complète de votre Sitemap dans le champ "Suggérer un Sitemap",
  • Cliquez sur "Envoyer".

Pour les sites ayant différents types de contenus, il existe d'autres types de Sitemaps pour les images, les videos et le mobile. N'hésitez surtout pas à les utiliser pour faire indexer ces contenus.

Bing Webmaster Tools

Conclusion

Après avoir lu cet article, il ne fait plus aucun doute que votre site Web ne peut pas être visible sans avoir un (ou plusieurs) Sitemap. Nous l'avons vu également, avoir un Sitemap enlève une charge considérable de travail pour la soumission des URL. Générer un Sitemap n'est pas une affaire très compliquée, surtout avec les nombreux outils en ligne qui sont disponibles. Et nau vu des services rendus par ce fichier, ile st évident qu'il ne faut pas s'en priver.

N'hésitez pas à poser vos questions ou à partager vos remarques à ce sujet dans les commentaires ci-dessous.

Daniel Dubois - auteur à web-eau.net

A propos de Daniel

Passionné par le Web depuis 2007, Daniel défend la veuve et l'orphelin du web en créant des sites respectueux du W3C. Fort de son expérience, il partage ses connaissances dans un état d'esprit open source. Très impliqué en faveur du CMS Joomla depuis 2014, il est également conférencier et fondateur du Joomla User Group Breizh.

web-eau.net

29800 Landerneau

06 74 50 27 99

daniel@web-eau.net