Le duplicate content & Google :
une relation compliquée

Le duplicate content ou duplication de contenu, peut-être à l’origine d’une pénalité Google.

Ce type de contenu est produit par quatre causes différentes :

  • Le vol de contenu, peu efficace car très bien détecté par Google notamment grâce aux algorithmes Pinguin et Panda.
  • Un problème de développement touchant la génération des url. Un contenu devient accessible sous différentes url au lieu de ne l’être que par une seule et unique. Il suffit d’une erreur 404 ou d’un lien vers une url dupliquée pour que tout le site se duplique.
  • Un défaut dans la navigation du site, laissant indexer des pages inutiles par les robots de moteurs de recherche (pages de résultats du moteur de recherche interne, filtres e-commerce, taxonomies diverses…).
  • La création de contenus très proches les uns des autres en utilisant des techniques de paraphrases ou d’automatisation (Content Spinning).

Quoiqu’il en soit, il vous faudra donc sortir de ces situations délicates qui  peuvent même s’empiler et utiliser des outils simples et adaptés à ces situations. La priorité donc est la suppression des sources de duplication, puis la désinfection et la vaccination.

Le duplicate content sur le moteur de recherche Google

Avant tout nettoyer les pages dupliquées

Un de vos contenus est dupliqué ? Il vous faut isoler la source du problème et la supprimer.
Voici quelques idées pour pour y parvenir. N’oubliez pas de vacciner votre site avec les url canoniques après le grand nettoyage :

 

Source du problème de duplicationSolution
Un texte générique est présent sur toutes vos pages.Intégrez sur toutes vos pages un contenu original représentant plus de 66% du contenu de la page.Hormis sur la page d’accueil par exemple où ce contenu sera intégré en HTML, intégrez ce texte générique dupliqué dans une iframe ou dans une image.
Mes pages sont accessibles sous différentes url, avec ou sans wwwAjoutez une redirection 301 à la volée de toutes requêtes sans les www pour les réécrire avec www (fichier .htaccess) :RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.
RewriteRule ^(.*)$ http://www.%{HTTP_HOST}/$1 [R=301,L]
Mes pages sont accessibles avec les www alors que je ne veux pas que ce soit le cas.L’inverse de la situation précédente (fichier .htaccess) :RewriteEngine On
RewriteCond %{HTTP_HOST} !^example\.com$ [NC]
RewriteRule ^(.*)$ http://mondomaine.tld/$1 [R=301,L]
J’ai des url avec des doubles //, voire triples slashs…Intégrez ceci dans le .htaccess :RewriteEngine on
RewriteRule (.*)  http://www.mondomaine.tld/$1  [R=301,L]
RewriteRule ^index\.php$ http://www.mondomaine.tld/  [QSA,L,R=301]
Mes filtres e-commerce (attributs de tailles, coloris…) sont indexés et créent de la duplication.
  • Les filtres doivent être activables seulement par des boutons radio, cases à cocher. Supprimez si ce sont des liens ou intégrez un attribut nofollow si la suppression n’est pas possible
  • Intégrez une balise no-index, no-follow dans le header
  • Intégrez une url canonique pointant vers l’url de la catégorie mère
  • Ajoutez une règle disallow dans le robots.txt pour toutes les urls intégrant un paramètre de filtrage (ex : ?filtre=)
Les contenus de mon panier, ou les pages de mes résultats de recherche sont indexés et dupliquent des contenus.
  • Intégrez une balise no-index, no-follow dans le header de ces modèles de pages
  • Intégrez une url canonique pointant vers l’url de la page d’accueil
  • Ajoutez une règle disallow dans le robots.txt pour toutes les urls intégrant un paramètre de filtrage (ex : ?cart= ; ?search=)

Ce tableau est loin d’être exhaustif, nous vous encourageons à vous rapprocher d’un expert SEO ou de votre agence SEO pour cela !

solution contre la duplication chez 1ère Position

Le vaccin contre la duplication : La balise link rel canonical

Pour des raisons d’ergonomie, ou du fonctionnement de votre CMS, vous pouvez générer des pages très similaires avec seulement quelques différences : URL, title, titre éditorial. Le reste du contenu étant totalement dupliqué.

Cela peut être le cas notamment sur des pages de catégories de blog, de catégories e-commerce (dans le cas de produits multi-catégories). Grâce à la balise link rel canonical vous pouvez indiquer aux Bots lorsqu’ils crawlent votre site web, quel est l’emplacement d’origine d’un contenu.

C’est-à-dire celle que vous indiquez sur les pages dupliquées où se trouve la véritable source de contenu. Attention cependant, les urls canoniques ne suppriment pas la duplication, elles évitent sa formation : c’est un outil préventif, ce n’est pas un outil curatif ! La création systématique d’url canonique est une forme de vaccination contre la duplication. L’URL canonique est une balise dans le code html placée dans la zone <head>.

<link rel=”canonical” href=”https://www.domaine.tld/mon-contenu-canonique.html”>

Par contre, si différentes pages ont des similitudes, mais ne sont pas identiques sur le fond, vous devrez résoudre le problème par la rédaction d’un contenu unique avec son propre champ lexical. C’est ainsi que vous allez améliorer la visibilité de votre site internet sur les moteurs de recherche (être présent sur une diversité de requêtes).  

Pour en savoir plus sur l’utilisation de l’url canonique : https://support.google.com/webmasters/answer/139066?hl=fr

Les différentes pages pointant vers une URL canonique, n’apparaîtront pas dans les résultats du moteur de recherche. Seule la page avec l’URL canonique sera indexée et donc visible. Si vous mettez en œuvre les canoniques sur un contenu déjà dupliqué, il vous faudra supprimer les pages dupliquées en utilisant notamment les balises noindex dans le <head> de ces pages.

L'article spinning vu par 1ère Position

Un poison ou une opportunité : l’article Spinning

L’article spinning (spinning veut dire “rotation”)est une technique qui permet de produire une quantité infinie de contenus en se servant d’un article original unique, en automatisant la création de paraphrases (utilisation de synonymes pour le vocabulaire, les verbes, noms…). Voici à quoi ressemble le principe :

Phrase de référence :

La tartiflette est une recette qui a été mise au point dans les années 1980. Cette recette moderne s’inspire d’un plat réellement traditionnel appelé la Pela.

Master Spin :

La tartiflette est {une recette|un plat|un art culinaire} qui a été {mise au point|inventé|développé} dans les années {1980|80|quatre-vingt}. Cette {recette|préparation} {moderne|contemporaine} {s’inspire|est une déclinaison} d’un plat {réellement|} {traditionnel|authentique} {appelé| : } la Pela.

Dans cet exemple on peut générer plusieurs milliers de textes quasi similaires. Ne pensez pas qu’il s’agisse d’une solution miracle, Google sait très bien détecter ce genre de spins, grâce à l’algorithme “Panda” et vous attrapera tout de suite ! Il faut dans les faits concevoir des spin de spin de spin à minima pour arriver à un résultat satisfaisant, et limiter le processus à la rédaction d’une dizaine de textes. In fine, vous allez passer autant de temps à créer un master spin complexe qu’à rédiger pour de bon des contenus originaux avec des angles éditoriaux différents !

Le content spining peut donc devenir rapidement une fausse bonne idée et vous apporter des problèmes. Si vous êtes sur un secteur particulièrement concurrentiel, soumis à du référencement local notamment (ex : “entretien de jardin + %ville”), ou que vous ayez d’importants problèmes de ressources humaines,  le content spining de haut-niveau, réalisé à partir de X contenus pertinents et originaux pourra vous aider, mais il vous faudra faire alors appel à une agence SEO pointue pour y parvenir sans risques.

En conclusion privilégiez donc la création de contenus uniques, pertinents et non plagiés. Intégrez les dans un contenant étanche à la duplication et utilisez les url canoniques.

UN PROJET EN RÉFÉRENCEMENT NATUREL SEO ?

Être recontacté !

Selon votre besoin, consultez directement notre équipe d’experts

Vous souhaitez

Connaître nos offresNous proposer vos services

Vous êtes

Une grande entrepriseUn grand compteUn artisanUne TPEUne PME

Votre besoin

Référencement Naturel SEORéférencement Payant SEAAuditRéseaux SociauxRédaction de contenuFormation

Votre projet

J’accepte les conditions | Lire

Une agence certifiée

Nous contacter