Pour être franc, les URLs dupliquées sont la hantise des propriétaires de site Web. Personne n'est à l'abri d'avoir une ou plusieurs URLs qui pointe vers la même page de son site. Les moteurs de recherche considèrent cela comme du contenu dupliqué et ils n'aiment pas vraiment ça ! Mais pour commencer, nous allons d'abord voir qu'est ce qu'une URL dupliquée, pourquoi cela peut être préjudiciable pour le référencement de votre site web et comment s'en prémunir efficacement.

URL ou contenu dupliqué ?

Pour être précis, ce ne sont pas les URLs qui sont dupliquées mais le contenu vers lesquelles ces multiples URLs renvoient l'internaute. Voyons donc d'abord ce qu'est un contenu dupliqué.

Qu'est ce que le contenu dupliqué ?

Voici la définition contenue dans le glossaire du web :

Le contenu dupliqué, c'est le fait de pouvoir accéder au même contenu à partir de plusieurs URLs différentes.
Il faut néanmoins différencier deux types de contenu dupliqué :
  • le contenu dupliqué externe : c'est le contenu d'un site qui est recopié totalement ou partiellement sur un autre site,
  • le contenu dupliqué interne : la même page d'un site web est accessible par plusieurs URLs différentes.

Attention : il ne faut pas confondre URL dupliquée et URL identique.
La première indique un contenu qui est accessible via plusieurs URLs différentes.
La seconde est impossible dans Joomla car ce CMS ne permet pas de créer deux URLs rigoureusement identiques.

Quel est le problème du contenu dupliqué ?

Pour les moteurs de recherche, une URL est associé à une page de contenu.
Donc si deux ou plusieurs URLs affichent le même contenu, Google ne sait pas qu'il s'agit de la même page et ne pourra pas identifier clairement quelle est la page la plus pertinente pour les internautes. Il va donc considérer ces URLs comme étant dupliquées.
Conséquence : le moteur de recherche va donc reléguer l'une des deux URLs au fond des résultats de recherche tandis que l'autre risque d’être très mal positionnée. Dans les deux cas, ce n'est pas brillant.
De plus, un trop fort taux de contenu dupliqué sur un site risque de le pénaliser dans sa totalité. Il faut donc prendre ce problème au sérieux.

Les URLs dupliquée et Joomla

Soyons honnêtes, il existe un problème avec les URLs canoniques (canonical) dans Joomla, même si ce problème n'est pas spécifique à ce CMS...

De quoi parle-t-on ?
Une URL canonique doit fournir une URL unique quelle que soit la méthode d'appel de tel ou telle page. On parle ici de l'adresse unique d'accès à un article. Le problème avec le plugin système SEF de Joomla est que les URLs canoniques... ne le sont pas.
En effet, selon la méthode d'appel d'une page, l'URL canonique peut-être différente. Pour constater cela, il suffit d'aller regarder dans son compte Google Search Console où vous verrez des balises titre et meta description en double (dupliquées) en grand nombre.

Pour éviter d'être pénalisé par un moteur de recherche, nous allons donc devoir remédier au problème du contenu dupliqué interne. Et pour cela, nous allons voir qu'il existe plusieurs solutions.


1. Les liens de menu

Vous devez commencer par identifier l'origine de vos URLs dupliquées sur votre site web.
Supposons que le contenu de votre site soit affiché via deux menus (un principal et un secondaire) et que vous ayez fait pointer un lien de chaque menu vers le même article :

https://www.mon-site-web.fr/categorie/titre-de-mon-article.html

Dans ce cas, vous avez certainement modifié l'alias de l'URL d'un des deux liens de menu car Joomla ne permet pas d'avoir deux URLs identiques.

Commencez par définir quel est le menu à partir duquel votre contenu doit être accesible.
Choisissons le menu principal dans cet exemple.
Ouvrez alors le lien de menu du menu secondaire qui pointe vers le même article.
Au lieu de choisir "Article" comme type de lien de menu, sélectionnez "URL externe" dans les "Liens divers".
Copiez / coller ici l'URL du lien de l'article relié au menu principal.
Voilà, c'est aussi simple que ça (dans ce cas). Votre URL externe permet de spécifier la même URL, ce qui supprime le problème.

Si vous souhaitez avoir plusieurs éléments de menu qui pointent vers le même article, ne recréez surtout pas un nouveau lien de menu de type "Article" mais choisissez un lien de menu de type "Alias de lien de menu". Cela permet de récupérer les paramètres liés à l'alias sélectionné (c'est à dire de reprendre l'URL originale du sous élément de menu vers lequel pointe cet alias). Dans ce cas, Joomla ne générera pas de nouvelles URLs.

URLs dupliquées Joomla


2. Indiquer la balise canonical

Si vous n'êtes pas en mesure d'identifier l'origine des vos URLs dupliquées, vous avez probablement un souci de canonicalisation de vos URLs.

Il faut donc ajouter une balise du type <link href="/url-canonique-de-votre-contenu"/ rel="canonical"> sur chacune des pages concernées.
En définissant ainsi la balise canonical sur la bonne page, vous indiquez aux moteurs de recherche quelle est la page à indexer et quelles sont les URLs à ne pas indexer.
Si vous ne définissez pas de façon correcte cette balise, vous risquez d'obtenir un résultat catastrophique pour votre référencement.

Dans ce cas, la meilleure solution pour mette en place cette balise sur votre site est sans doute d'installer une extension tierce.
Le Joomla extensions directory dispose d'une section exclusivement réservée à la canonicalisation des URLs.

Ainsi, toutes les pages dupliquées de Joomla contiendront cette balise dans la partie <head> de leur page. Vous indiquerez à Google de ne pas indexer les URLs dupliquées, qui resteront néanmoins toujours accessibles.


3. Définir des règles dans le fichier .htaccess

Grâce au fichier .htaccess présent à la racine de votre site Joomla, vous avez la possibilité de résoudre un nombre important d'URLs dupliquées en indiquant certaines règles au serveur.

  • Choisissez avec ou sans les www. Si vous ne définissez pas de règles claires et strictes sur ce point, votre site sera accessible sur les deux formes du nom de domaine et donc, toutes vos URLs seront considéres comme dupliquées. Ajoutez cette règle dans votre fichier .htaccess :

    RewriteEngine on RewriteCond %{HTTP_HOST} ^mon-site-web.fr$ RewriteRule ^(.*) http://www.mon-site-web.fr/$1 [QSA,L,R=301]
  • Supprimez les slash à la fin de vos URLs. Dans le même ordre d'idée, votre site (et toutes ses URLs) est accessible via https://www.mon-site-web.fr mais également via https://www.mon-site-web.fr/. Pour les mêmes raisons évoquées ci-dessus, nous allons donc indiquer au serveur de ne retenir que la version sans le slash. Ajoutez cette règle dans votre fichier .htaccess :

    RewriteEngine On RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^(.+)/$ http://%{HTTP_HOST}/ [R=301,L]
  • Définissez des redirection permanentes. Pour rediriger les requêtes d'une URL vers une autre, l'utilisation de la redirection 301 est une solution possible et efficace. Techniquement, cela revient à indiquer l'adresse URL d'une page et de renvoyer les internautes (et les moteurs de recherche) vers l'adresse canonique. Ajoutez cette règle dans votre fichier .htaceess :

    RewriteCond %{HTTP_HOST} ^www.mon-site-web.fr/url-dupliquee RewriteRule ^(.*) http://www.mon-site-web.fr/url-canonique [QSA,L,R=301]

    Cette méthode est très efficace mais elle peut être assez chronophage si vous avez de nombreuses URLs dupliquées à rediriger.


    Bon à savoir :Il est également possible de définir des redirections depuis le panneau d'administration de Joomla via le composant Redirections (et son plugin associé).

4. Utiliser le fichier robots.txt

Nous l'avons vu dans l'article consacré au fichier robots.txt qu'il est possible de donner instruction aux robots des moteurs de recherche de ne pas indexer les URLs contenant certains caractères ou paramètres. Pour cela, ajoutez cette règle dans votre fichier robots.txt :

Disallow: /*?* Disallow: /*? Disallow: /*&

Pour aller plus loin

Je vous invite à lire les recommandations de Google sur le sujet qui sont un complément indispensable à cet article : https://support.google.com/webmasters/answer/66359?hl=fr.


Si vous souhaitez approfondir ce sujet, je vous conseille également de lire : Duplicate content, ce que vous devez savoir.

Conclusion

Vous connaissez et maîtrisez maintenant toutes les subtilités qui permettent d'éviter et de supprimer les URLs dupliquées sur votre site.
Vérifiez très régulièrement dans votre compte Google Search Console que de nouvelles URLs dupliquées n'aient pas été indexées. Si vous avez suivi les conseils données ci-dessus, vous devriez en venir à bout en quelques jours / seamines suivant la taille de votre site.

web-eau.net

29800 Landerneau

+33 674 502 799

daniel@web-eau.net