Le Contenu Dupliqué en SEO

Par Mathieu ALLART , le 13 novembre 2021 , mis à jour le 11 novembre 2024 — audit seo, SEO - 7 minutes de lecture

Le fonctionnement des moteurs de recherche se base sur différentes étapes dont le crawl et l’indexation de pages Web. Le but d’un moteur de recherche est de proposer la réponse la plus pertinente à l’internaute. Il doit donc faire un travail préparatoire avant l’indexation des pages. Lorsque qu’une page d’un site Internet est découverte, crawlée, le moteur de recherche va isoler le contenu de cette page. Ce contenu est transformé en une empreinte numérique afin de pouvoir être plus facilement comparé à d’autres empreintes numériques. À noter que ces contenus peuvent aussi bien être interne (duplicate content intrasite) qu’externe (duplicate content intersite).

Afin de ne pas indexer des contenus identiques, le moteur va classer les empreintes en fonction de leurs similitudes :

  • Aucune similitude, le contenu est original, unique et sera indexé,
  • Quelques similitudes, en fonction du taux de similarité, c’est le moteur qui va décider si votre contenu est original ou dupliqué,
  • Trop de similitude, le contenu sera considéré comme un contenu dupliqué ou duplicate content dans sa version anglaise et ne sera peut-être pas indexé, mais alors comment le moteur va choisir le contenu canonique à indexer ?

Le contenu dupliqué est donc le fait d’avoir deux ou plusieurs contenus identiques (ou presque) sur son site ou sur d’autres sites. Un audit de référencement naturel réalisé par un expert SEO certifié QASEO peut vous permettre de découvrir et corriger ces problématiques !

Au menu de cet article !

Comment savoir si le contenu de votre site est dupliqué ?

Tout d’abord il faut traiter séparément le contenu dupliqué interne et le contenu dupliqué externe.

Comment repérer une duplication de contenu interne ?

Très souvent lié à la configuration de votre CMS (WordPress, Joomla, Drupal), de votre plateforme e-commerce (Woocommerce, Prestashop, Magento) ou de votre SaaS (Shopify, Salesforce Marketing Cloud), la duplication de contenu interne s’identifie facilement.

Vérifier manuellement si votre site accessible en http:// vous renvoie bien vers la version https://.
Si ce n’est pas le cas, votre site http et https sont en duplication de contenu interne.

Vérifier manuellement l’accès à votre page d’accueil (avec et sans /, /index.html, etc..).
Êtes-vous redirigé vers la page d’accueil canonique ? Si ce n’est pas le cas, c’est ce qu’on appelle le DUST pour Diffrent Url Same Text c’est à dire un même contenu pour une URL différente. Cela peut également s’appliquer sur vos pages internes (fiches produits, pages catégories, etc…)

Si votre site est volumineux, qu’il comporte beaucoup de pages alors ce travail manuel est trop important : vous devrez utiliser des outils ou faire appel à une agence SEO à Lille ou ailleurs.

À l’aide de la Google Search Console, contrôler les pages exclues à l’aide du rapport Couverture.

À l’aide de Screaming Frog, un outil de crawl, vous pouvez lancer un spider qui va explorer votre site. En lui indiquant les zones redondantes (header, footer, aside) à ne pas prendre en compte pour la duplication de contenu, l’outil peut vous indiquer les potentielles pages exposées à une duplication interne.

Comment repérer une duplication de contenu externe?

Si vous souhaitez savoir si les contenus de votre site sont uniques et originaux, vous devrez vous munir de quelques outils. Le plus connu d’entre eux et très utilisé par les consultants SEO :

Google….lui-même ! En effet, vous pouvez tester en copiant-collant des morceaux de contenus dans le moteur et visualiser ses réponses. Évidemment, c’est très fastidieux pour des sites à gros volume, mais pour faire quelques tests rapides cela fonctionne bien.

Pour repérer une duplication de contenu externe, les consultants SEO utilisent des outils comme Copyscape . Il vous permet de détecter les contenus similaires entre votre site et d’autres.
Vous pouvez également utiliser Duplichecker lorsque vous rédigez un nouveau contenu pour votre site et ainsi vous assurer qu’il sera unique et original.

Pourquoi les moteurs de recherche combattent-ils le contenu dupliqué ?

Google et Microsoft sont des entreprises. Comme toute entreprise elles cherchent à faire du profit. C’est pourquoi, les moteurs de recherche de ces deux firmes vont faire très attention aux coûts :

en allouant un budget de crawl pour explorer les pages de votre site

en indexant des contenus uniques et originaux.

Le poids des pages indexées, stockées sur les serveurs de Google est gigantesque. Cela représente un coût considérable et il est donc logique que Google cherche à limiter, supprimer les copies et les contenus de mauvaises qualités.
C’est notamment le rôle des filtres algorithmiques Google Penguin et Google Panda.

Autre aspect, moins pécunier cette fois-ci, c’est la pertinence de la réponse. Pour que l’utilisateur vive la meilleure expérience possible, il doit obtenir une réponse à sa demande le plus rapidement possible. Le moteur de recherche se doit de proposer des résultats uniques avec de la valeur ajoutée. Les contenus de mauvaise qualité, copiés ou bourrés de mots clés ne sont clairement pas les bienvenus. Veillez toujours à valoriser vos contenus existants : optimisés, originaux et plus riche que la concurrence pour plaire à l’utilisateur.

Quels sont les risques liés au duplicate content ?

Avant de voir les risques liés au business (au travers du référencement de vos pages), la duplication de contenu est une atteinte aux droits d’auteurs, il peut donc y avoir des risques juridiques.

Au-delà des aspects légaux, les risques liés à la duplication de contenus ont une conséquence sur votre visibilité sur le Web et donc sur votre business.

Le risque majeur de la duplication de contenu est la désindexation de votre page !

En effet, comme vu précédemment lorsque Google, lors du crawl, détecte une similarité trop importante avec d’autres pages (intrasite comme intersite) alors il fait entrer en jeu plusieurs critères pour définir le contenu original, l’url canonique. Les autres contenus plagiés sont alors considérés comme dupliqués. Ils seront déclassés au profit du contenu original.

Google a longtemps communiqué sur 2 critères principaux pour définir le contenu original et le contenu plagié : la date de 1er crawl et le page Rank. Il semblerait que ce soit plus complexe, comme l’a bien expliqué Olivier Andrieu dans sa vidéo sur le contenu dupliqué selon Google

Le risque mineur de la duplication de contenu est le déclassement de votre page !

Si votre contenu n’est pas désindexer, mais est considéré comme duplicate, alors celui-ci ne vous aménera aucun trafic puisque Google va vous déclasser. Vous pouvez envisager plusieurs cas de figure :

Vous êtes l’auteur du contenu, mais Google ne vous a pas considéré ainsi. Alors vous pouvez tenter de joindre les administrateurs des sites qui vous ont plagié et tenter de résoudre ce fait à l’amiable. Si ce biais ne vous donne pas satisfaction, alors il existe le recours à une plainte auprès de Google : la DMCA

Vous n’êtes pas l’auteur du contenu, alors vous devriez travailler à nouveau sur la rédaction de votre contenu pour l’enrichir et lui apporté plus de valeur ajouté. Un contenu doit être unique et original, apporté une réponse à une question que l’internaute est en droit de se poser.

Comment résoudre le contenu dupliqué ?

Si vous avez des soucis de duplication de contenus, vous chercherez légitimement à trouver une solution. Avec quelques connaissances dans le digital (développement Web, rédaction Web), vous pouvez corriger les problèmes les plus fréquents :

  • Corriger les problèmes de DUST
    • Navigation à facette
    • PHPSESSID
    • Url rewriting
    • Redirection 301 non-www vers www
    • Redirection 301 http vers https
  • Corriger les problèmes d’indexation de vos contenus, de vos pièces-jointes et leurs partages
    • PDF
    • WORD
    • POWERPOINT
    • les pages générés par votre CMS (tag, author, etc…)
  • Corriger les problèmes de copier-coller
    • Flux RSS
    • Résumé d’articles
    • Fiche produits de votre site e-commerce

Un problème seo suite à une migration comme de la duplication de contenu peut subvenir. Les enjeux sont plus importants et il faudra alors faire appel à un consultant SEO pour réaliser un audit webmarketing. Vous obtiendrez toutes les recommandations à mettre en place soit par vous-même, soit par une agence SEO, soit par le consultant lui-même s’il n’est pas dans une démarche de conseil uniquement.

Mathieu ALLART

Expert SEO certifié QASEO avec près de 20 ans d'expérience dans le digital. Fondateur de l'agence Mael & Zélie à Lille. Je mets mon expertise technique et ma pédagogie au service de vos projets digitaux.

Voir les publications de l'auteur