SEO : Comment vérifier si mon contenu web est dupliqué ?

Une des clés du bon référencement SEO, c’est l’originalité du contenu de votre site web. Si la tentation est grande de dupliquer un article ou un blog, cela peut s’avérer préjudiciable pour la visibilité de votre entreprise sur la toile. Pour vérifier le caractère original de vos écrits, il existe des outils performants. 6 vérificateurs de contenu dupliqué sont passés au banc d’essai.


Un contenu dupliqué, c’est quoi ? 


Pour comprendre ce qu’il faut éviter de faire, il est impératif de bien définir l’écueil ! Pour l’expliquer simplement, le contenu dupliqué (ou duplicate content) c’est le « copié-collé » du web ! Plus précisément, la redondance est avérée lorsque sont retrouvés sur deux URLs distinctes des contenus textuels similaires, voire identiques. Il peut s’agir d’une page web entière mais un simple paragraphe dupliqué intègre cette catégorie. Quel pourcentage peut dès lors être copié sans risque ? Difficile de répondre avec précision. En la matière, il semble qu’à partir de 70% de contenu identique, Google le considère comme dupliqué. 


D’un point de vue technique, deux types de duplicate content peuvent être recensés : 

 

 

  • Duplicate externe : c’est la pratique la plus grossière. Elle consiste à reprendre in extenso un contenu déjà existant sur un site externe et à le dupliquer sur un site domicilié à une autre adresse URL. 
  • Duplicate interne : il résulte davantage d’une erreur que d’une véritable intention de copier. Il peut s’agir par exemple d’un problème purement technique du système de gestion de contenu (SGC) ou content management system en anglais (CMS). Un même site génère par exemple des url automatiques et crée ainsi du duplicate interne. 

 

Quelle que soit l’origine du duplicate, volontaire ou simplement technique, les moteurs de recherche pénalisent le contenu dupliqué. 


Pourquoi un contenu original est essentiel pour les moteurs de recherche ? 


Les moteurs de recherche, Google en tête, visent la meilleure expérience client. Pour répondre à une requête et assurer à l’internaute une variété de résultats, les crawlers web (les robots) affichent donc par préférence les résultats les plus pertinents. S’ils découvrent deux pages web au contenu identique, les robots feront un choix. Ils n’ont en effet aucun intérêt à stocker et à indexer des contenus similaires.

Comment s’opère ce choix ? La réponse n’est pas tranchée (elle n’est pas officielle non plus !), mais les Bot informatiques mènent leur enquête et collectent des indices. Pour garantir un contenu original, plusieurs pistes sont passées au crible. Sans être exhaustif, en voici quelques-unes : la première, la date de publication de la page. L’antériorité est ici garante d’originalité. Le moteur choisira donc par préférence la plus ancienne. Le nombre et la qualité des backlinks sont aussi pris en considération. Troisième information : l’autorité du domaine (domain Authority ou DA). Cette notion, mesure la force d’un site Web sur une échelle de 0 à 100 et prédit son classement par les moteurs de recherche. Enfin, les habitudes des internautes sur le site peuvent aussi influencer l’indexation : nombre de visites, durée de la visite, taux de rebond, etc.. 


Pour toutes ces raisons, il est essentiel de toujours proposer une réponse unique et originale à l’internaute. 


Les outils pour identifier le plagiat 


Pour mettre tous les atouts du côté de votre entreprise ou de votre marque, mieux vaut vérifier la qualité du contenu proposé. Heureusement, des outils en ligne existent. 6 méritent votre attention :


Screaming Frog : le couteau suisse 
Pour réaliser un audit complet de votre site, le logiciel en ligne va crawler l’ensemble des pages et déceler tous les éléments potentiellement dupliqués : les titres de pages, descriptions dupliquées…
Mais cette « grenouille hurlante » (Screaming Frog en anglais !) ne se limite pas à cet exercice. Il identifie les liens cassés, checke les redirections, analyse les métadonnées ainsi que les balises titles et les URL bloquées…du tout-en-un pour améliorer le référencement naturel de votre site internet.

 

Duplichecker : simple et efficace 
Comme son nom l’indique, le logiciel propose de vérifier le contenu dupliqué. Un simple « copier-coller » du contenu dans la barre de recherche permet une identification immédiate des textes suspects. Pratique, il est aussi possible de télécharger un document (.tex, .txt, .doc, .docx, .odt, .pdf, .rtf) s’il compte plus de 1 000 mots. Pour une meilleure lecture, le site donne le pourcentage d’authenticité du texte qui lui est soumis.
Petit plus de la plateforme : il vérifie la grammaire et l’originalité des images ! 

 

Siteliner : l’ergonomie au service de votre référencement
Parmi les logiciels anti plagiat, Siteliner est d’une simplicité presque enfantine ! Le design épuré de la home page annonce la couleur. Pour identifier les doublons, le temps de chargement des pages, le nombre de mots par page, les liens internes et externes…il suffit d’entrer l’URL dans le moteur. Quelques instants plus tard, le site rend son analyse. Pour faciliter la lecture et l’appropriation des d’informations, Siteliner présente ses résultats sous forme de graphiques. Le rapport peut ensuite être téléchargé en format PDF. Rapide et performant ! 

 

CopyScape : pour identifier les copieurs
Pour gagner quelques positions dans votre référencement, vous pouvez aussi opter pour CopyScape. Le site propose ni plus ni moins la recherche de contenu dupliqué externe à votre site ! Idéal pour cibler les « voleurs de contenu » ! Il permet aussi de s’assurer du caractère original du texte remis par votre rédacteur. Un système d’alerte permet en outre de débusquer quotidiennement les plagiats de vos propres textes. 

 

Grammarly : autodisciplinez votre plume ! 
L’outil se présente comme un auxiliaire de rédaction. Si vous êtes allé puiser l’inspiration sur d’autres sites (ce n’est pas interdit !), mieux vaut vérifier le degré d’originalité de votre plume ! C’est ce que propose Grammarly. Il localise les phrases copiées et propose synonymes et paraphrases pour aider à la reformulation. Si votre contenu est validé, le logiciel délivre sa médaille ! « Votre texte est exempt de problèmes d'écriture ». Très gratifiant ! 

 

Copyleaks : l’IA pour aller à la source
L’intelligence artificielle gagne du terrain et la détection de textes similaires n’y échappe pas ! Copyleaks propose de détecter la source d’inspiration d’un texte. Identique, similaire ou paraphrase ? Dans plus d’une centaine de langues, la plateforme retrace le contenu textuel d’une copie. À noter, cette IA est en mesure également de détecter le plagiat de code ! 

 


Ces outils permettent d’améliorer la performance de votre référencement.

L’arrivée récente de ChatGPT sur le marché a pu éveiller les craintes….L’intelligence artificielle va-t-elle mettre au chômage les rédacteurs de contenu ? En l’état, c’est peu probable. L’outil, au même titre que ceux évoqués ci-dessus, vient compléter la boite à outils au service des écrivains du web, mais il n’est pas encore en mesure de remplacer leur expertise. Au moment d’inventer des titres accrocheurs, de jouer sur les mots et de créer un contenu original, c’est encore sur l’esprit humain qu’il faut compter.

Notre agence web est à votre disposition pour effectuer un checkup complet de votre site. 

Incroyable ce billet ! un autre ! Incroyable ce billet ! un autre !