Le duplicate content
- Détails
- Catégorie : SEO
- Créé le 13 septembre 2010
- Mis à jour le 14 juin 2011
- Écrit par Administrateur
- Affichages : 3504
Le duplicate content, ou contenu dupliqué, a été mis en avant par Google en 2008 via un nouveau filtre visant à déclasser dans les résultats de recherche les pages ayant un contenu copié depuis page déjà existante.
Définition
Concrètement, une page est considérée comme dupliquée lorsque qu'une bonne partie de son contenu se retrouve sur plusieurs URL différentes. Je ne sais pas être beaucoup plus précis que "une bonne partie", disons simplement que Google par exemple sait repérer des expressions clés, ou paragraphes, ou synonymes dans un texte. Le fait de prendre un texte et de le modifier en changeant quelques mots ou en inversant des paragraphes n'empêchera pas les meilleurs moteurs de le considérer dupliqué par rapport à l'original.
Il est donc inutile d'essayer de tricher à moins de transformer complètement le texte original, ce qui peut prendre plus de temps que de partir d'une feuille blanche.
Voici quelques exemple de cas de figure peuvent faire entrer une page en duplicate :
- Un webmaster décide d'inscrire son site dans 2000 annuaires automatiques pour quelques euros. Waouh, quelle offre intéressante. Il soumet donc un titre, une description, quelques infos de base. Ces infos se retrouvent donc dupliquée ssur les 2000 annuaires
- Une page A est crée par un webmaster tout à fait sérieux. Un petit bloggeur sans scrupule trouve le contenu A intéressant et décide de le récupérer sur son blog B via un simple copié-collé
- Sur un même site, une page peut être accessible depuis plusieurs URL. Cela arrive souvent par exemple sur les sites qui ont une version mobile, ou une version imprimable. On parle alors de duplicate interne à un site.
Les conséquences du duplicate content
Les conséquences peuvent être mineures, tout comme elles peuvent être catastrophiques pour un site. Il faut d'abord savoir que Google déclasse un contenu dupliqué, c'est à dire qu'il le garde en général dans son index, mais le positionne loin dans les résultats de recherche, là ou personne ne va en gros. Le moteur peut par exemple déclasser quelques pages d'un site qu'il considérera comme dupliquées, ce qui n'est pas bien grave sur un gros site. Cependant, si trop de pages sont considérées comme dupliquées sur un même site, celui ci sera pénalisé en totalité, Les visiteurs en provenance de Google en deviendront quasiment inexistants.
En reprenant l'exemple des annuaires qui ne demandent pas de descriptions uniques (contrairement à Net-Addict), les 2000 annuaires que nous avons cité plus haut sont tous en duplicate content sur la majorité de leur contenu, le filtre a pour conséquence tout simplement de les faire fermer car leur trafic a chuté du jour au lendemain. Ceci est bien évidemment le pire des scénarios et nous verrons plus bas qu'il est possible de sortir du filtre en fournissant un peu de travail.
Copier coller Créer
Eviter d'entrer dans le filtre
Pour ne pas entrer dans le filtre du duplicate content, le plus simple est encore de produire du contenu original, en évitant d'utiliser le contenu des autres. Google à de son coté prévu la balise html "canonical", permettant d'indiquer aux robots qu'une url possédant cette balise est à prendre en priorité sur les autres pouvant posséder le même contenu. Une page ayant cette balise est en gros la page originale.
Cette balise est à placer en début de page, entre les balise <head> et </head>, de la manière suivante : <link rel="canonical" href="/mon url" />
Dans le cas des sites ayant une version mobile par exemple, le mieux est d'indiquer aux moteur de ne pas indexer les url version mobile grâce à l'attribut "noindex"
Sortir du filtre
Le plus simple pour sortir du filtre est de supprimer, ou réécrire tout contenu dupliqué. Le réécrire est un travail de longue haleine, mais permet de conserver du contenu. Une fois qu'un site est vidé de son contenu dupliqué, Google semble le sortir du filtre environ un mois après. Si certaines pages ne reviennent pas dans les résultats de recherche, il sera judicieux d'aider à leur référencement en leur apportant de nouveaux backlinks.
Les limites
La "pénalité" mise en place par Google et relative au contenu dupliqué est une très bonne chose pour la qualité et la pertinence de résultat Google. En effet personne n'aimerais parcourir les deux première pages des résultats Google pour voir des sites affichant tous la même chose. Cependant ce filtre a ses limites et n'est pas toujours efficace. Les gros sites ayant beaucoup de poids ne semblent par exemple pas touchés.
Imaginons que vous ayez un petit site que vous essayez de lancer. Il suffit qu'un gros site reprenne votre contenu, et c'est vous même qui serez pénalisé, le gros site semblant avoir plus d'intérêt aux yeux de Google.
Et Net-Addict dans tout ça ?
Après avoir lu ceci, vous devez sans doute commencer à comprendre pourquoi Net-Addict (ainsi que d'autres annuaires de qualité) demande des textes uniques dans son annuaire et ses publications. Le fait d'autoriser des descriptions dupliquées sur d'autres sites pénaliserait le site complet. Mais il faut aussi savoir que cela ne favoriserait pas non plus votre propre référencement car les fiches ne recevraient que très peu de trafic moteur, et les liens vers vos sites n'auraient que peu de poids aux yeux des moteurs de recherche.
Photo : whatleydude




Commentaires
quel est le but d'un annuaire ? Non pas de faire des liens par plaisir pour les webmestres mais pour avoir un annuaire de qualité et faire payer ses publicités et gagner de l'argent
On voit déjà apparaitre les limites du duplicate content puisque des "annuaires de qualité "(sic) proposent de faire écrire un nouveau texte en payant bien sur. Ensuite l'auteur pourrait demander des droits d'auteurs....
Ça n'est pas parce qu'on est dans les biens immatériels qu'on doit faire n'importe quoi
Cordialement
ps : les ventes sur internet , pour une bonne société doivent se situer autour de 10%
Qui sait, le filtre du duplicate content va peut être faire le bonheur des rédacteurs web.
Egalement d'accord sur le fait qu'un annuaire n'est aujourd'hui plus une ferme à liens, un annuaire se doit d'être de qualité. L'administratio n n'est pas toujours facile et le fait de le monétiser par la pub en échange d'un service gratuit est une très bonne chose
Sinon, je ne suis pas d'accord avec toi gege061, la plupart des annuaires ont un service gratuit, enfin pour les annuaires dit de qualité.
Je pense que ca dépend surtout du poids du site en question. Plus un site est jeune et petit, plus il faut être strict en matière de DC (mais ce n'est que mon avis, d'autre pourront peut etre apporter plus d'infos sur ce point)
Qu'en est il de la suite de 7 mots identiques?
Ces critéres sont ils variables dans le temps?
Mais faire des descriptions uniques est très profitable pour tout le monde, le webmaster du site est de qualité et l'annuaire encore plus, ce qui met dehors les sites peu scrupuleux.
Au moins il y a du travail de fait pour le référencent.
Merci pour cet annuaire Net-Addict
Il est vrai que à force de faire de l'unique, cela ne sera plus unique ou alors toutes les combinaisons seront prises, donc seule les premiers profiteront de cette "mane" de texte, donc les annuaires ...
à méditer
à moins que l'on invente de nouveaux mots ou que l'on écrive en sms: 1 Kfé ou 1T ? Je prendrais un jus d'orange !
Concernant le texte unique à fournir aux annuaires et autres site de CP... eh oui, c'est pas toujours évident, mais faut faire avec
Perso je recommanderais de ne faire qu'une trentaine d'annuaires de qualité, puis de passer aux services de publications d'articles sur lesquels il est bien plus facile de faire de l'unique car on est pas obligé de faire une description globale de son site, et on peut réellement diversifier ses textes.
Une question !
Une explication qui est reprise sur plusieurs pages du même site est-elle considérée comme du duplicate content?
Exemple :
Pour information
Quand un article est mentionné Fin de série, c'est qu'il ne sera pas reconduit à la fabrication. De ce fait, les tailles de maillots de bain et couleurs en ruptures de stock ne pourront plus être disponibles à nouveaux à la vente. Nous finissons les différentes tailles encore en stock et l'article sera enlevé de la boutique. Donc, plus disponible à l'achat. Tous les ans La Marque Leg Avenue retire certaines références de sont catalogue, pour donner du travail à nos chers Designers et également pour votre plaisirs de voir de magnifiques et originales nouveautés.
S’abonner au flux RSS pour les commentaires de cet article.