Blog de web-eau.net

Lorsque l'on se préoccupe un tant soit peu de son site web, les données statistiques de celui-ci sont une des parties qui sont régulièrement au centre de l'attention. En effet, avoir un site web qui fonctionne est une chose, savoir comment et pourquoi en est une autre. Mais encore faut il avoir pour cela des données propres pour en tirer des conclusions fiables.

Une des principales plaies du web aujourd'hui est probablement le spam referrer. C'est une technique frauduleuse qui consiste à envoyer de fausses données dans les systèmes d'analyses statistiques d’un site web au moyen de robots. Si cela n’a aucune conséquences sur le référencement des sites victimes, cette "pollution" fausse néanmoins vos statistiques et par ricochet, l’analyse que vous en ferez. L'objectif de cet article est de vous expliquer comment fonctionne ce type de pollution et de vous donner des clefs pour vous en prémunir.

Comment supprimer le spam referrer de vos statistiques ?

Pourquoi le spam referrer ?

Ne cherchez pas plus loin, la principale motivation des spammeurs est encore et toujours l'argent.
Ils ne cherchent qu'à vous inciter à cliquer sur un lien inconnu qui apparait dans votre suivi statistique pour découvrir l'origine de ce visiteur étrange venu sur vos pages. Vu la masse énorme de sites en circulation qui sont concernés par cette pollution, cela permet de générer un trafic monstrueux qu'il est ensuite facile de monétiser.

 

Quel est le problème du spam referrer ?

Comme nous l'avons vu en introduction, le principal souci du spam referrer est de complétement fausser les statistiques du trafic du site pollué.
Afin d'avoir la vision la plus objective possible de ce qui se passe réellement sur vos pages, il est donc essentiel d'avoir des chiffres fiables. La preuve par l'image :

Comment supprimer le spam referrer de vos statistiques ?

Nous constatons ici que trois sites référents sont manifestement du spam referrer : share-buttons.xyz, web-revenue.xyz et с.новым.годом.рф. Ces trois sites représentent à eux seuls, plus de 7.5% des sessions (deuxième colonne) et qu'ils génèrent par ailleurs des taux rebonds (dernière colonne) qui pourrissent la moyenne générale.
Accessoirement, cela vous fait perdre du temps que vous pourriez consacrer le temps mobilisé au nettoyage à faire tout autre chose de bien plus gratifiant.
Il est donc essentiel pour vous de lutter conter le spam referrer, comme nous allons le voir maintenant.

 

Comment bloquer le spam referrer ?

Avant de commencer à sortir la sulfateuse et la dynamite, sachez qu'il existe deux types de spam referrer : le Ghost Spam et le Crawl Spam Referrer . Les deux ne se combattent ni de la même manière ni avec les mêmes armes.

 

Ghost Spam

On l'appelle fantôme (ghost, en anglais) car cette méthode est "invisible". Les spammeurs génèrent des combinaisons aléatoires de profils Google Analytics sous la forme UA-XXXXXX-Y et attaquent directement les rapports sans même passer par votre site web (donc, vous ne la voyez pas). Ils ne vous visent pas en particulier, ils ciblent tout le monde !

C’est la technique la plus utilisée mais également la plus agressive. Du fait de la nature du procédé utilisé, les protections côté serveur sont totalement inefficaces car aucune donnée ne transite via le site web. Dans ce cas présent, il va donc falloir protéger vos données statistiques.

Comment supprimer le spam referrer de vos statistiques ?

Je profite de ce paragraphe pour vous soumettre une petite question qui me trotte dans la tête : pourquoi Google avec ses moyens énormes n'élimine pas définitivement cette pollution de ses data ? (Vous avez 3 heures...)

Vous trouverez de très nombreux tutoriels sur le web qui vous expliquent comment bloquer le Ghost Spam en créant des règles dans votre compte Google Analytics. Si ces solutions sont efficaces, elles sont chronophages et potentiellement risquées si vous ne maîtrisez pas ces manipulations.
Dans son infinie bonté, le Grand Concepteur a créé des outils online qui feront le "job" à votre place (ou presque). Avouez que ce serait dommage ne pas les utiliser !

L'ami @loran750 a très justement attiré mon attention sur le fait qu'un service comme referrer-spam.help faisait également le job mais qu'il récupérait au passage nos données pour les comparer aux leurs. Je vous invite donc à être prudents si vous décidez de l'utiliser.

Accessoirement, on peut tout à fait se passer de Google Analytics pour le suivi statistiques de son site. Il existe quelques alternatives crédibles à ce sujet.

 

Crawl Spam Referrer

L’autre méthode employée par les vilains consiste à envoyer des robots à travers toute la Toile pour crawler les sites web, tout comme le font les robots des moteur de recherche. Contrairement au Ghost Spam, l y a effectivement bien une visite sur le site web. Dans ce cas, il faudra privilégier les solutions de blocages côté serveur qui seront les plus efficaces notamment grâce au fichier .htaccess. Afin de pouvoir mettre en place ce type de blocage, il faut que votre serveur soit de de type Apache (à valider auprès de votre hébergeur).

Si la modification de ce type de fichier ne vous fait pas peur, je vous propose de télécharger un fichier texte contenant un peu plus de 600 spam referrer qu'il vous suffira de copier/coller directement dans votre fichier .htaccess. C'est cadeau !

Si vous ne savez pas comment effectuer cette petite intervention chirurgicale, laissez-moi un message.

Une fois mis en place, vous aurez bloqué la porte d'entrée de votre site à ces robots pourrisseurs de données statistiques.

Comment supprimer le spam referrer de vos statistiques ?

Conclusion

Les spammeurs redoublent d'imagination pour vous inciter à cliquer n'importe où afin de se remplir les poches. La technique du spam referrer, si elle n'est pas nocive pour votre SEO, peut l'être pour votre stratégie de content marketing.
Au delà de ces considérations bassement égoïstes, assainir le web (et non pas l'inverse) devrait être une préoccupation constante de chaque propriétaire de site.

Un dernier conseil : n'oubliez pas de consulter de temps à autre vos rapports statistiques sur les sites référents afin d'y glaner de nouvelles sources de spam referrer que vous ajouterez à vos systèmes de sécurité.


 

A PROPOS DE L'AUTEUR :
Webmaster freelance passionné par Joomla depuis 2007, Daniel défend la veuve et l'orphelin du web en créant des sites respectueux du W3C. Fort d'une expérience de plusieurs années, il partage ses connaissances avec les néophytes aussi bien qu'avec les personnes plus expérimentées.

1 1 1 1 1 1 1 1 1 1 Rating 0.00 (0 Votes)

Ajouter vos commentaires

Poster un commentaire en tant qu'invité

0
Vos commentaires sont soumis à la modération de l'administrateur.

Participant à cette conversation

  • Bonjour,

    comment ne pas vous remercier de ce gros travail, mais encore, comme ai-je pu passer à côté de votre site depuis tout ce temps! Honte à moi. En fait, depuis l'apparition des Spams Référrer dans GA, je n'ai eu de cesse de chercher des solutions, à partir des filtres proposés par GA bien-sûr puis en passant par .htaccess. Je pense qu'avec la liste que vous fournissez, on pourrait faire une croix sur cette problématique.

    Et pour répondre à cette question: pourquoi Google ne supprime-t-il pas les Ghost une bonne fois pour toute, je pense que cela ne figure pas encore dans ses priorités. Déjà, comment peut-on croire que des Spams peuvent faussés l'identité des propriétaires des sites dans le Search Console? C'est quand même grave docteur! Mais encore, les attaques des Spams sont aussi plus performantes et plus soignées, ce qui rend sans doute les choses encore plus difficiles.

    C'était un humble avis d'un passionné du web, mais je pense que la question mérite bien le détour.

    Dernier point, je n'ai pas pu obtenir la liste des Spam Référrer via le lien de téléchargement, je pense qu'il faut laisser mon mail, alors, si possible, passez-moi cette liste via mon mail.

    Ok, bah, à plus et merci pour cet article! :)

  • En réponse à: Parfait R.

    Merci d'avoir pris le temps de lire cet article et d'avoir rédigé ce commentaire complet ;)

    Concernant Google, ils ont largement les moyen de contrer et d'éradiquer tout ça, à mon humble avis. Le jour où cela pénalisera les résultats financier et/ou l'image de marque de Google, les choses bougeront...

    Oui, vous devez laisser votre adresse mail pour recevoir le fichier .txt contenant + 600 NDD considérés comme spammy.
    Je tâcherai de la mettre à jour régulièrement.

  • Miryam

    Mer et sinon toi tu utilises quoi pour les ghost spam exactement ?

  • En réponse à: Miryam

    Bonjour Myriam,

    Je donne 3 liens dans l'article qui permettent d'agir directement sur Google Analytics pour contrer le Ghost Spam.
    J'ai essayé celui-ci https://referrerspamblocker.com qui me semble pas mal du tout.

  • Parfait R.


    Je pense qu'il a déjà souillé son image vis-à-vis des Utilisateurs d'Analytics. C'est quand même un gros travail de nettoyer des données qui sont sensées aider les webmasters non leurs donner un autre travail.

    De mon côté, je vais expérimenter tout cela, espérant que ça marche ;)

    Encore une fois merci pour l'article... :)

    Dernière édition du commentaire il y a environ 2 ans par Daniel
  • En réponse à: Parfait R.

    Re bonjour :)

    La genèse de cette histoire est que Google a voulu bien faire les choses au départ en donnait accès a de nombreuses données aux webmasters avec G-Analytics (en même temps, si ils veulent récupérer nos données, ils ont intérêt à nous dorloter aussi). Le hic, c'est que ce sont les vilains qui ont su tirer parti de cela en utilisant le Measurement Protocol de Google pour aller directement marquer leurs infos parasites dans nos comptes Google Analytics.

    Bref, Google est prit à son propre piège et les utilisateurs ne sont pas encore trop remontés (mais jusqu'à quand ?). De mon côté, j'estime qu'ils doivent avoir les moyens techniques (financiers, j'en parle même pas) de faire le ménage, dans l'intérêt du plus grand nombre. Nous sommes les victimes de ce spam et nous devons faire leur ménage ...

    J'espère que vous réussirez à réduire cette pollution de vos statistiques. N'hésitez pas à repasser nous tenir au courant de vos résultats.

web-eau.net is not affiliated with or endorsed by the Joomla! Project or Open Source Matters. The Joomla! name and logo is
used under a limited license granted by Open Source Matters the trademark holder in the United States and other countries.