9 min. de lecture

Le contenu dupliqué et son impact sur le SEO

Contenu rédigé à 100% par un vrai humain, et non une IA ✍️

Au programme de cet article :

En tant que formateur et créateur de contenu en ligne depuis 2016, j’ai écrit de nombreux textes et j'ai observé beaucoup de rédacteurs en publier également. Je vois de nombreux freelances se lancer avec l'ambition de créer du contenu "différent", mais aussi un certain nombre faire le choix de la facilité en s'inspirant très fortement de contenus déjà publiés quand ils rédigent.

Selon Semrush, le contenu dupliqué concerne plus de 50% des sites internet. Au-delà des questions éthiques, ces contenus copiés-collés ont des impacts négatifs à long-terme pour ces rédacteurs (et leurs clients).

Dans cet article, je vous explique en détails ce qu’est le duplicate content et les risques qu’il représente pour votre référencement. Je partage aussi avec vous les solutions que vous pouvez mettre en place pour diminuer le risque de copier ou d'être copié. C'est parti !

Le contenu dupliqué : de quoi parle-t-on ?

Définition - Qu'est-ce que le duplicate content ?

Le contenu dupliqué, ou "duplicate content" en anglais, c'est tout simplement une forme de "copier-coller". Concrètement, il s'agit d'un même texte utilisé sur des URL différentes, c'est-à-dire plusieurs pages web et/ou sites internet qui utilisent partiellement ou complètement les mêmes mots.

Donc c’est du plagiat ? Pas forcément ! Le plagiat est plutôt une notion juridique : copier le contenu de quelqu'un sans le mentionner ou le rémunérer implique de potentielles poursuites judiciaires (et je vous le déconseille très fortement si vous êtes rédacteur web). Mais en la matière, Google ne s'intéresse pas tellement aux droits d'auteur.

Dans le cas du duplicate content, on fait plutôt référence à une notion technique liée au fonctionnement des moteurs de recherches. Ces derniers ont un seul objectif : proposer du contenu de qualité, c'est à dire qui répond au besoin des internautes. Or, un contenu copié-collé n'apporte aucune nouvelle information au visiteur. Il a très peu de valeur. Il n'a donc aucun intérêt pour Google.

Sur les moteurs de recherche, les algorithmes visitent régulièrement les pages de votre site web et les évaluent pour vérifier si elles méritent toujours d'être visibles, et à quel place elles sont positionnées pour répondre à une intention de recherche. Ce sont eux qui vont remarquer les premiers si votre site contient du contenu dupliqué. S'ils repèrent un texte identique sur deux pages web (en partie ou entièrement), il le considère comme dupliqué.

Le taux de duplication est évalué en comparant le texte identifié comme original et celui qui serait copié. Un texte qui reprend l’entièreté d’un autre recevra un taux de 100%, alors que si quelques mots ou phrases sont similaires, on s’approchera plus de 10% ou 15%.  Au-delà de 30 % de duplicate, on considère que la copie ou la duplication est évidente. A titre personnel, je vous conseille de viser un score de 0 et d'éviter de dépasser les 10%.

Vous l’aurez deviné, plus le score de duplicate est haut, plus votre référencement naturel est impacté négativement.

Les différents types de contenu dupliqué et leurs conséquences

On distingue deux catégories de contenu dupliqué :

-             Le contenu dupliqué externe désigne les textes identiques (ou très similaires) présents sur votre site et sur un autre site web. Il peut s’agir d’un accident ou d'un choix volontaire : par exemple, beaucoup de e-commerçants ont le même texte sur leurs fiches produits et sur Amazon.

-              Le contenu dupliqué interne consiste à utiliser les mêmes textes sur différentes pages de votre propre site internet. Les fiches produits en sont souvent la première source. Par exemple, les différents variants d’un même produit ont des fiches produits très ressemblantes, voire identiques.

Il peut y avoir des contenus dupliqués sur votre site web pour plusieurs raisons. Si vous vendez des variations d'un même produit, il est probable que vous n'avez pas réécrit tout votre contenu d'une page à l'autre. D'ailleurs, sur certains sites e-commerce, vous n'avez quasiment pas le choix !

Le doublon de contenu peut aussi être le résultat d'une erreur, surtout si votre site ou votre blog indexe beaucoup de pages. Sur les sites e-commerce, où les fiches produits sont parfois créées en masse, c'est très souvent le cas. S'il vous est déjà arrivé de dupliquer une page de votre blog pour éviter de re-créer une structure de 0, vous êtes peut-être aussi tombé dans ce piège.

Si vous travaillez avec des partenaires, il peut aussi arriver qu'ils vous fournissent un contenu qu'ils ont déjà publié sur leur propre site ou transmis à d'autres créateurs. Si vous utilisez ce contenu standard dans un article sans le modifier, vous créer du duplicate content. Votre texte n'a aucune valeur ajoutée auprès des moteurs de recherches et vous risquez d'être pénalisé. Gardez en tête que votre valeur ajoutée en tant que rédacteur, c'est d'apporter votre créativité ! Ne vous contentez jamais d'une description standardisée.

Dans certains cas, le contenu est délibérément dupliqué entre plusieurs domaines. En général, l'objectif est d’essayer de manipuler les algorithmes en créant du volume et des liens entre différentes pages pour donner l'impression d'être une référence. Spoiler alert : à long terme, ça ne marche pas et le SEO est fortement pénalisé.

Qu'il s'agisse de votre propre site internet ou de celui d'un client, vous devez tenter d'éviter au maximum le contenu identique.

Le contenu dupliqué et l'impact sur le SEO

Les conséquences du duplicate content sur votre site

Que vous preniez délibérément du contenu sur un autre site ou pas, vous vous exposez à des risques. Et c’est aussi le cas si votre contenu est copié par quelqu'un d'autre.

Lorsque l’algorithme de Google détecte du contenu dupliqué sur votre site, il y a de fortes chances pour qu’il sanctionne votre site par le biais du SEO. Google n'aime pas les tricheurs.

Votre page web dupliquée risque de se retrouver tout en bas des résultats de recherches, voire d'être rendue invisible. Cette action impacte fortement et durablement le trafic sur votre site internet - et donc vos revenus s'ils en dépendent.

Vous courez aussi le risque que Google n'indexe plus vos nouvelles pages web, même si elles sont originales. C'est assez rare, mais je vous déconseille de prendre le risque.

L'impact sur votre crédibilité

Pour choisir quels résultats apparaissent en haut des pages de recherche, les algorithmes ont plusieurs critères. Parmi eux, le fait que le contenu réponde correctement à l’intention de recherche.

Vous l’aurez compris, si votre contenu est dupliqué et n'apporte rien de nouveau, Google n'a aucun intérêt à le rendre visible. Si une autre page web plus ancienne propose déjà votre texte, elle sera probablement référencée à la place de la votre.

En plus de votre visibilité, vous perdez donc une chance de partager votre propre point de vue sur une thématique et d'être considéré comme un expert sur votre sujet. A vous de décidez si vous préférez être considéré comme un créateur ou un copieur...

Comment éviter le contenu dupliqué ?

Il n’existe aucune solution miracle pour éviter que votre contenu soit copié. Il peut même arriver que vous produisiez accidentellement un contenu très proche d'un autre, surtout si vous parlez d'un sujet vu et revu. Mais rassurez-vous, il existe tout de même quelques techniques pour limiter les risques.

Les astuces pour éviter le copier/coller

1) Utiliser la balise canonique

La balise canonique : « rel="canonical" » est une balise HTML à renseigner dans la section <head> de votre page web. Elle indique à Google qu’il s’agit d’une page canonique – la page principale et originale, donc celle qui doit être indexée.

Elle est particulièrement utile pour les sites de e-commerce qui possèdent plusieurs pages pour chaque variation d’un même produit. Cela permet au moteur de recherche d’identifier la page à indexer et de ne pas considérer les autres comme des duplicates.

2) Utiliser la balise de citation

La balise de citation <blockquote> est à utiliser lorsque vous faites... une citation.

Elle indique au moteur de recherche qu’il s’agit d’une citation que vous êtes allé chercher ailleurs. Si elle se retrouve sur d'autres pages web, Google comprendra que vous ne vous êtes pas approprié ce contenu.

3) Utiliser une balise qui bloque l'indexation

La balise « content=’’noindex’’ » est insérée dans la section <head> de vos pages pour que Google comprenne qu’il ne faut pas les indexer. Cette manœuvre vous permet de bénéficier de doublons sur votre site sans qu'ils pénalisent votre référencement naturel SEO.

4) Empêcher le clic droit

Il est possible d’empêcher tout utilisateur de faire un clic droit sur votre site – et de copier votre contenu par la même occasion. Rares sont ceux qui auront vraiment la détermination de recopier à la main votre texte ! Pour bloquer le clic droit, il suffit d’insérer la ligne de code suivant dans la section <head> de votre site :

<script>document.addEventListener('contextmenu',function(e){e.preventDefault();e.stopPropagation();});document.addEventListener('copy',function(e){e.preventDefault();e.stopPropagation();});document.addEventListener('cut',function(e){e.preventDefault();e.stopPropagation();});</script><style>.jw-album-image img, .jw-element-image img { pointer-events: none; -webkit-touch-callout: none; }.pswp__share-tooltip .pswp__share--download { display: none; }</style>

5) Paramétrez vos URLs

Sur Google, l'outil d'inspection d'URLs permet de demander au moteur de recherche de ne pas parcourir certaines de vos pages. Vous pouvez aussi indiquer à Google que votre contenu dupliqué est intentionnel et qu’il ne doit pas être pris en compte sur une url. En gros, si vous prenez les devants, Google ne vous pénalise pas.

6) Utilisez les redirections

Si vous avez créé plusieurs pages avec du contenu similaire, pensez à la redirection 301. Vous choisissez l’URL à garder et redirigez toutes les autres vers celle-ci sur votre site internet. Cela vous permet de transférer l’autorité des pages redirigées vers une unique page maîtresse identifiée par Google.

7) Modifier vos pages dupliquées

La dernière solution, qui ne doit être utilisée qu'en dernier recours, est de modifier le texte de vos pages dupliquées. Cependant, il peut se passer beaucoup de temps avan que Google remarque vos modifications et vous pouvez continuer à perdre beaucoup de trafic en attendant.

Quelques outils utiles pour analyser votre site internet

Il existe différents outils pour vérifier si certains de vos contenus sont dupliqués ou copiés. Voici une première liste pour vous aider :

- Copyscape : cet outil détecte le contenu dupliqué externe. Si vous renseignez un extrait de votre contenu dans le logiciel, il vous indique s'il est copié quelque part sur le web. Utile pour aller demander au copieur de vous rendre des comptes, ou de modifier son texte.

- Siteliner vous permet de détecter le duplicate content sur votre propre site. L'avantage de cet outil, c'est qu'il identifie aussi des informations sur la structure de votre site, comme le nombre de liens internes et externes, et les pages comportant des erreurs HTTP. Il vous aide à vous rendre compte des erreurs que vous avez pu commettre au moment de créer votre contenu, pour les corriger.

- Killduplicate : cet outil (payant) scanne internet pour trouver si votre contenu a été dupliqué et surveille les contenus liés à votre site en continu.

- Screaming Frog se concentre sur le contenu dupliqué interne de votre site.

- Duplichecker : permet de comparer des documents ou de détecter le plagiat. Si vous y entrez un texte, il vous donne le pourcentage de ressemblance avec d'autres sources disponibles en ligne. C'est un bon moyen de vérifier dans quelle mesure le contenu fourni par vos partenaires doit être réécrit ou pas.

Vous pouvez aussi faire certaines vérifications par vous-même. Par exemple, vérifiez combien de vos pages sont indexées sur Google en tapant la requête : "site:votresiteinternet.com". Si le nombre de pages indiqué vous paraît très élevé par rapport au contenu que vous avez produit, peut être que certaines ont été dupliquées et ajoutées à l'index.

Contenu dupliqué - vérifier index Google

Vous pouvez aussi utiliser l’outil d’inspection URL de Google sur la Search Console pour trouver les informations précises sur les versions indexées de vos pages.

Et si vous constatez que quelqu'un a volé votre contenu, vous pouvez déposer une plainte DMCA auprès de Google ou tenter de trouver une solution à l'amiable pour éviter que vos sites respectifs soient pénalisés.

Ecrivez du contenu original

Ça tombe peut-être sous le sens, mais la meilleure façon d’éviter le contenu dupliqué est de créer votre propre contenu. Si vous faites preuve de créativité en écrivant des textes originaux, ils seront forcément différents de ceux qui existent déjà en ligne.

Bien sûr, vous allez peut-être vous inspirer d'articles déjà existants avant d'écrire le votre - et rien ne vous en empêche. Mais vous devez partager votre propre analyse, revisitée, pour que le contenu soit différent.

Et si vous vendez des produits, vous pouvez toujours ajouter une touche personnelle aux fiches produits. Le contenu original est celui qui vient de vos propres idées.

Faites attention sur les réseaux sociaux

Si vous êtes rédacteur web, vous cherchez sans doute à rendre vos textes plus visibles. Si votre stratégie marketing utilise les réseaux sociaux en ce sens, ne copiez surtout pas vos articles dans leur intégralité sur Linkedin ou une autre plateforme.

Au contraire, pensez à publier seulement une partie ou une reformulation de votre article. D'une part, cela donnera envie au lecteur de se rendre sur votre site pour lire la suite. D'autre part, vous allez éviter le duplicate.

Si vous avez vraiment un doute, vous pouvez aussi publier une image qui reprend votre texte : cela n'est pas pris en compte par Google et sert aussi votre stratégie marketing.

Soyez des créateurs, pas des copieurs !

Bien que la duplication de contenu puisse être accidentelle, elle représente tout de même une menace importante pour votre référencement naturel et donc pour le trafic sur votre site.

Soyez vigilant lorsque vous vous inspirez de diverses sources pour écrire votre contenu. Il serait dommage que les heures passées à écrire votre contenu soient perdues... Commencez donc par écrire du contenu de qualité original, partagez votre point de vue et tentez d'apporter une vraie valeur ajoutée lorsque vous rédigez un texte. Et si vous souhaitez en apprendre plus sur le référencement naturel et sur les bonnes pratiques du SEO, n’hésitez pas à faire un tour sur mon guide de l’écriture en ligne !

Aucun commentaire n'a été posté
Poster un commentaire
Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *
Merci ! Veuillez patienter, votre commentaire va être publié...
Recharger la page
Oops! Something went wrong while submitting the form.

Envie de progresser en écriture ?

Inscrivez-vous à notre mini-cours gratuit par email et commencez à améliorer vos textes, dès maintenant.

apprendre écrire article de blog

5 jours pour écrire de meilleurs articles de blog

Découvrez les stratégies, principes et tactiques à utiliser pour écrire des articles de référence.

C'est parfait. Rendez-vous dans votre boîte email pour valider
votre inscription !
Oops, petit erreur. 
Merci d'actualiser la page et de réessayer !
apprendre écrire article de blog

Masterclass Copywriting Gratuite

Comment doubler ton chiffre d’affaires en tant que freelance Copywriter, en 2024
(quand tout le monde a peur des IA et croit que le marché est saturé)

C'est parfait. Rendez-vous dans votre boîte email pour valider
votre inscription !
Oops, petit erreur. 
Merci d'actualiser la page et de réessayer !

Pour poursuivre votre lecture

Voir toutes les ressources
Lancer et monétiser sa newsletter

Créer sa newsletter LinkedIn : est-ce vraiment une bonne idée ?

Plusieurs influenceurs ont lancé leur newsletter LinkedIn. Est-ce une bonne idée ? Voici mon retour d'expérience (j'envoie des newsletters depuis 2018)

7 min. de lecture
Vaincre ses peurs et dépasser les blocages d'écriture

Comment les outils d'intelligence artificielle impactent les métiers de la rédaction en 2024 ?

L'arrivée des intelligences artificielles rédactionnelles est une vraie révolution. Dans cet article, j'explore les conséquences de ces outils sur les métiers de la rédaction et du marketing.

8 min. de lecture
Progresser en écriture

Le contenu dupliqué et son impact sur le SEO

Le contenu dupliqué concerne plus de 50% des sites internet. Ces contenus copiés-collés ont un fort impact négatif à long-terme pour le SEO. Je vous explique comment vous pouvez éviter ce piège.

9 min. de lecture

Ce qu'ils disent à propos de Sauce Writing