En SEO (Search Engine Optimization), il est important d’accorder de l’attention au contenu dupliqué quand vous créez votre site internet ou même votre blog.
En effet, Google peut pénaliser lourdement ces sites en mettant à mal leur référencement voire même en les désindexant totalement ! De plus, un contenu répété donne une mauvaise image de votre site aux utilisateurs qui n’auront plus envie d’y retourner. S’il s’agit d’un site de e-commerce, les visiteurs n’achèteront pas les produits. Un minimum d’originalité est grandement appréciée !
Tout d’abord il est important d’expliquer ce que l’on entend exactement par le terme de « contenu dupliqué »: C’est un ensemble de contenu d’un même site présentant une similarité ou étant identique. Il existe deux types de contenu dupliqué, à savoir:
- Le contenu dupliqué interne: Deux contenus similaires sur un seul et même site
- Le contenu dupliqué externe: Deux contenus similaires figurant sur deux sites séparés (cependant non pénalisé par Google)
Selon Google, les choses suivantes sont considérées comme du contenu dupliqué :
– Des citations copiées-collées
– Des URL dirigeant vers une page identique
– La répétition des balises « titres » et « meta description »
– S’il y a des doublons (par exemple site existant à la fois en http et https)
Les solutions pour éviter cela ?
Il faut faire preuve d’une très grande prudence et d’éviter au maximum de publier du contenu identique ou similaire.
Ensuite, il convient de ne jamais faire de copié-collé. Il faut écrire des textes qui soient propres à l’identité du site, des textes avec notre propre personnalité. N’oublions pas que quand vous créez du contenu sur internet, vous vous adressez d’abord aux visiteurs de votre site et non aux moteurs de recherche Google ! Soyez le plus naturels possibles, ne tentez pas d’imiter qui que ce soit. Ce contenu doit être le votre et uniquement le votre.
Programmez votre serveur afin qu’il effectue des redirections 301. Ceci est particulièrement utile quand Google indexe des liens vers des pages de blocs dupliqués d’un site identique.
Il faut également « canoniser » des URL. On appelle aussi cela la « canonicalisation », c’est en fait un processus consistant indiquer aux moteurs de recherche les pages à indexer dans le cas où des pages d’un même site présentent du contenu dupliqué. Ainsi, le moteur de recherche ne considèrera pas ces pages se ressemblant entre elles comme du contenu dupliqué. Une URL canonique doit être placée dans la balise « head » de la page et des pages au contenu semblable.
Notons que de cette manière, la page sera juste explorée par Google mais pas indexée, ce qui s’avère plutôt pratique non ?
Il vaut mieux permettre l’exploration de la page plutôt que de la cacher, car la dissimulation entraine souvent des sanctions de référencement.
Il ne faut pas omettre de bien gérer l’indexation du site via Search Console et de soumettre un sitemap à Google contenant les URL dupliquées.
Enfin, vous avez à disposition des outils de prévention du contenu dupliqué, tels que par exemple:
- « Kill Duplicate » (pour le contenu dupliqué externe. Il détecte automatiquement les sites qui plagient votre site et qui permet de contacter les administrateurs de ces sites)
- Siteliner (contenu dupliqué interne)
Il en existe bien sûr plein d’autres, la liste n’est bien entendu pas exhaustive.