# Contenu dupliqué

> Le contenu dupliqué désigne des blocs de texte identiques ou très similaires qui apparaissent à plusieurs adresses (URL), au sein d'un même site ou entre plusieurs domaines. Pour les moteurs de recherche comme Google, il complique le choix de la version à indexer et à classer, ce qui dilue le signal de pertinence entre les pages concurrentes. Le contenu dupliqué n'entraîne généralement pas de pénalité manuelle, mais il gaspille le budget de crawl, fragmente la valeur des liens et peut écarter la bonne page des résultats. Il provient le plus souvent de causes techniques : paramètres d'URL, versions http/https et www, pages d'impression, contenu syndiqué ou fiches produits répétées. La résolution passe par la balise canonical, les redirections 301, une gestion propre des paramètres et la consolidation des pages redondantes vers une version unique de référence.

[source]: https://luwiz.io/glossaire/contenu-duplique

---

Le contenu dupliqué est l'un des problèmes techniques les plus fréquents et les plus sous-estimés en référencement. Il ne s'agit pas de plagiat au sens juridique, mais d'un signal ambigu envoyé aux moteurs de recherche lorsqu'un même contenu existe à plusieurs adresses.

## Comment ça marche

Quand Google découvre plusieurs URL au contenu identique, il tente de regrouper ces pages dans un même « cluster » et d'en élire une comme version canonique. Si vous ne lui indiquez pas laquelle, il décide à votre place — et pas toujours en faveur de celle que vous vouliez positionner. Résultat : la valeur des liens se disperse, le [budget de crawl](/glossaire/crawl-budget) est gaspillé sur des doublons, et votre signal de pertinence s'affaiblit.

On distingue la duplication interne (paramètres d'URL, versions http/https, pages de tri ou de filtre, fiches produits quasi identiques) de la duplication externe (contenu repris sur d'autres domaines, syndication, scraping).

## Exemple concret

Une boutique e-commerce affiche le même produit via trois URL : `/produit?couleur=rouge`, `/produit?couleur=bleu` et `/produit`. Le texte descriptif est identique. Sans signal, Google indexe les trois et dilue leur autorité. La solution : une [balise canonical](/glossaire/canonical) sur chaque variante pointant vers l'URL principale.

<Callout label="À retenir">Le contenu dupliqué ne se traite pas en réécrivant tout, mais en choisissant et en signalant clairement la version de référence.</Callout>

## Pourquoi c'est important

Maîtriser la duplication, c'est concentrer toute l'autorité d'un sujet sur une seule page forte plutôt que de la répartir entre des doublons faibles. C'est un prérequis pour un site sain, mieux crawlé et mieux classé. À l'ère des moteurs IA, cette clarté compte doublement : un contenu de référence unique et bien structuré a bien plus de chances d'être cité comme source faisant autorité.
