Duplication de contenu
Une duplication de contenu, qu’est-ce que c’est ?
Il s’agit d’un concept utilisé en stratégie de contenu pour dupliquer intelligemment une partie ou une page Web entière vers une autre. Les contenus dupliqués semblent en effet identiques et ne présentent parfois que quelques légères modifications. On recense deux types de duplications : la duplication de contenu interne nommée DUST (Duplicate Url Same Text) et la duplication de contenu provenant d’un autre site.
LA DUPLICATION DE CONTENU INTERNE
La duplication de contenu interne, appelée également auto-duplication, correspond au fait de publier le même contenu sur une ou plusieurs pages au sein de son propre site Web. Ce type de duplication ne pose pas de problèmes et ne présente pas de risques selon Google.
LA DUPLICATION DE CONTENU EXTERNE
La duplication de contenu est dite externe lorsque qu’une partie ou la totalité d’une page Web est reproduite à l’identique dans deux domaines différents. Cette action est tout à fait illégale et réprimée par Google, ce qui peut engendrer des conséquences très dommageables, dans la mesure où c’est une pratique qui est considérée comme du référencement abusif.
Quelques outils pour recenser les contenus dupliqués existants
Pour vérifier le contenu éventuellement dupliqué, il est important d’utiliser certains outils adaptés pour détecter ce type de pratique. Dans les faits, le taux de duplication toléré ne doit, en aucun cas, dépasser les 10 %. Parmi les outils les plus utilisés, citons deux d’entre eux :
SCREAMING FROG
Screaming analyse les pages de votre site et vous fait un état des lieux précis en vous donnant le nombre d’éléments concernés. Vous avez la possibilité de sortir la liste des urls concernées en filtrant les titles, les méta descriptions dupliquées. Vous pouvez, alors identifier les problèmes de duplicate content, et entreprendre de corriger efficacement vos pages pour un meilleur référencement.
POSITEO
Cet outil, facile à utiliser, permet d’identifier le texte copié ainsi que sa provenance, c’est-à-dire le site Web du duplicateur. Il délivre aussi le pourcentage des mots dupliqués par rapport à la page source dont il est issu.
COPYSCAPE
Copyscape propose une vérification gratuite des articles plagiés d’un site Web à un autre. Il propose également deux solutions professionnelles, Copyscape Premium et Copysentry qui permettent de prévenir et se prémunir contre le vol de contenu des pages Web. Plusieurs options sont disponibles pour éviter la présence d’éventuels plagiaires. Copyscape utilise également les services Giga Alert et Siteliner pour obtenir de bons résultats de recherche Google. Une particularité intéressante de Copyscape est sa capacité à comparer entre eux, deux textes spécifiques ou deux pages Web particulières.
Mes contenus sont dupliqués : que faire ?
Lorsque deux domaines distincts ont des contenus très similaires, notamment le contenu textuel des balises, c’est le signe qu’il y a forcément une duplication de contenu. Une fois détecté, cet acte est pénalisé par Google, ce qui entraîne de sérieux désagréments en matière de référencement. Une charte de la rédaction Web a donc été éditée afin d’éviter les risques encourus. Google préconise en effet aux Webmasters de publier des articles accessibles à tout public, uniques et interactifs.
Si votre site Web est victime de duplication de contenu externe, Google va pouvoir rechercher la page source du contenu dupliqué et pénaliser le copieur.
Quelles sont les pénalisations appliquées par Google en cas de duplication ou plagiat ?
Il est communément admis qu’il ne faut pas plagier le contenu d’un autre site Web. Le plagiat ou vol de contenu est d’ailleurs également sanctionné juridiquement lorsque le propriétaire du contenu détient des droits d’auteur sur son contenu. Voici une liste de quelques pénalisations définies par Google :
RISQUES SUR LE RÉFÉRENCEMENT
Le référencement détermine la position d’un site Web dans les résultats naturels des moteurs de recherche. Motivé par le souhait de fournir aux visiteurs des contenus dits qualitatifs et uniques, Google réprimande donc systématiquement la publication de contenu en double en pénalisant lourdement son référencement : c’est pourquoi un contenu dupliqué est souvent très mal référencé.
BAISSE DE POSITIONNEMENT
En cas de duplication de contenu, le moteur de recherche va rétrograder le positionnement du site copieur parmi ses résultats. Cela peut même aller jusqu’au retrait du site des résultats de recherche, dans la mesure où il va être jugé comme site « polluant » ou « non pertinent ». Cela se traduit immédiatement par une baisse de positionnement, voire un déclassement total de la page dupliquée ou du site complet.
Du côté des internautes, cela entraîne une réduction du trafic et un manque de confiance de vos visiteurs qui se demanderont qui est l’auteur du contenu qu’ils lisent.
Si Google juge que cette pratique a été utilisé pour tromper ou manipuler le moteur de recherche, le site peut être, alors, retiré des résultats de recherche et contraint le propriétaire du site à consulter les consignes aux webmasters et à demander le réexamen par Google.
Si vous constatez que le contenu de votre site est utilisé par un autre site, sans votre autorisation et que ce dernier ne respecte pas les règles de droits d’auteur, vous pouvez demander à l’hébergeur de retirer ce contenu ou déclarer les faits à Google via un formulaire qu’on appelle une demande DCMA pour faire votre réclamation.
La sanction étant lourde, elle a l’avantage de décourager plus d’une velléité de plagiat !
LINK JUICE OU JUS DE LIEN
En cas de duplication de contenu, Google ne prend en compte que le premier lien, c’est-à-dire celui qui correspond au contenu le plus ancien. Il arrive toutefois, dans certains cas, qu’aucune page ne soit bien référencée. Le moteur de recherche va diluer le Link juice, le “jus de référencement” transmis par le backlink d’un contenu dupliqué.
Comment éviter la duplication de contenu ?
BALISE CANONIQUE
Installer une balise canonical unique pour chaque groupe de pages dupliquées va avoir un réel impact sur le comportement des robots de Google : prenons l’exemple d’un t-shirt proposé en plusieurs couleurs, pour homme ou pour femme, à manches longues ou à manches courtes. Pour ce faire, il suffit d’ajouter une balise canonical dans le code source de l’url de base. Cela empêche Google et les autres moteurs de recherche d’indexer ces urls plusieurs fois.
STRATÉGIE DE LINKING EN SILO
Le but de la stratégie de linking en Silo est d’échapper à la dilution de référencement. Cette technique concerne surtout les gros sites disposant de centaines, voire de milliers de pages. Elle permet d’obtenir le plus de jus de lien possible, tout en favorisant le référencement de son propre site web. Cela consiste en fait à relier les pages de votre site entre elles, selon le thème. Cette option est un peu délicate et demande un important travail manuel, assez chronophage.
REDIRECTIONS 301 OU CODE 301
Des occurrences de noms de domaine sont souvent identifiées pour des raisons techniques. Un nom de domaine en http, un nom de domaine en https, un nom de domaine avec l’acronyme world wide web (www) et un nom de domaine sans, sont considérés comme quatre urls différentes même s’ils pointent vers une seule et même page. Pour éviter que cela soit interpréter comme une duplication de contenu, il faut supprimer les pages concernées. Il est donc conseillé de choisir la version de l’url principale et de rediriger en 301 la version non choisie vers la version originale. Cette possibilité a pour avantage d’être bien lue par les robots de Google et d’éviter ainsi les pénalisations du moteur de recherche.
Certains CMS génèrent des pages distinctes pour chacune des images qui sont intégrées à vos pages, ce qui génère des pages vides qui sont considérées comme de la duplication de contenu. Vous devez désactiver cette option ou mettre les attributs alt de vos images en « no index » afin de préserver votre référencement naturel.
DESCRIPTIONS UNIQUES
On rencontre souvent la duplication de contenu dans les sites e-commerce. On y trouve divers produits dont les caractéristiques diffèrent mais qui restent cependant très similaires. Cela va provoquer une duplication de contenu et des pénalisations par Google. Il est donc important de rédiger une description unique et d’opter pour des mots-clés très concurrentiels pour chaque produit, tout en restant unique, attrayant et qualitatif. Il s’agit d’une étape qui va prendre beaucoup de temps mais qui s’avère prépondérante en termes de référencement du site concerné.
MODIFICATION D’URL
Cette technique semble la plus facile à utiliser par les Webmasters et les agences SEO. Lors d’une duplication de contenu, il faut simplement créer de nouvelles urls ou mettre un “no-index” pour les pages dupliquées. Cette option va vous faire gagner du temps et est également une excellente solution pour éviter la duplication de contenu. Google favorise les contenus Web de qualité jugés pertinents, uniques et interactifs. Des règles sont alors mises en place pour empêcher la duplication de contenu. Tous les contenus Web doivent être distincts d’un site Web à un autre. Le non-respect de cette charte entraine diverses pénalisations par le moteur de recherche leader.
Nous vous recommandons d’anticiper ce type de scénario sans forcément attendre d’y être confronté, afin de préserver votre référencement, de vous protéger plus efficacement contre les voleurs éventuels de contenu et ainsi limiter les risques de voir vos performances se dégrader.
La duplication de contenu peut également concernée les blog, les réseaux sociaux et bien d’autres contenus web.
On peut également rencontrer du contenu dupliqué sur les sites internationaux qui sont destinés à des internautes de certains pays. Pour éviter une mauvaise interprétation des moteurs, il est préférable de proposer un contenu unique à l’audience concernée avec un vocabulaire adapté à la langue locale et d’indiquer à Google, dans le webmaster tools, le pays ciblé pour chacun de vos sites.
Pour élaborer votre stratégie de contenu et produire un contenu de qualité pour votre site ou autre plateforme comme les réseaux sociaux, privilégiez le professionnalisme d’une agence seo ou de rédacteurs web. Afin d’éviter les mauvaises surprises, il est conseillé de contacter plusieurs prestataires et de demander, au préalable, des devis afin de faire le meilleur choix.
Un Consultant Senior dédié
1 outil unique au monde
17 années d’existence
+ de 1.000 sites optimisés
+100 experts
10 chercheurs
Les principaux objectifs du référencement naturel
Le marketing viral
Créer un livre blanc
Associer le SEO et le Brand Content
La curation de contenu
Créer du contenu de qualité
Réussir sa stratégie de contenu
Le réseau de diffusion de contenu (cdn)
Infographie SEO local
Gérer un bad buzz
Le E-Marketing
Le marketing digital
Stratégie de contenus
Réunissez l’équipe marketing digital qui gagne
L’importance du rédacteur web SEO
Définir un contenu de qualité pour le SEO
Comment choisir le contenu pour améliorer le SEO d’un site ?
Développer sa présence digitale grâce au contenu
Définir les objectifs d’une stratégie de contenus SEO
Améliorer le Content Marketing pour améliorer le SEO ?
Présence sur internet
Comment assimiler les bases du SEO
10 techniques pour booster votre SEO
Comment rédiger les balises html importantes pour le SEO ?
Publier du contenu sur votre site web
Les résultats naturels et le fonctionnement des moteurs de recherche
Comment comprendre et utiliser la contribution des canaux entre eux, à travers un modèle d’attribution, pour optimiser ses investissements publicitaires ?
Les résultats naturels
Le SEO dans un projet de création de site
Le trafic SEO
Structurez votre site
Algorithme Google : les mises à jour d’algorithme en 2019
Le contenu est l’un des piliers du référencement naturel. Dans le cadre d’une stratégie marketing, la rédaction de n’importe quel contenu Web impose de respecter certaines règles pour se différencier des concurrents, pour l’optimisation et la bonne performance d’un site internet en termes de lisibilité mais aussi de visibilité sur le web. Un contenu de qualité et optimisé est indispensable : il doit être spécifique, adapté, facile à comprendre et surtout interactif. Néanmoins, la duplication de contenu est à éviter à tout prix, sous peine de pénalités. Un contenu optimisé et unique permet d’assurer un meilleur référencement de votre site internet.