Vous êtes ici : Accueil Blog Catégories SEO Le duplicate content

Le duplicate content

Note utilisateur:  / 3
MauvaisTrès bien 

Le duplicate content, ou contenu dupliqué, a été mis en avant par Google en 2008 via un nouveau filtre visant à déclasser dans les résultats de recherche les pages ayant un contenu copié depuis page déjà existante.


Définition

Duplicate contentConcrètement, une page est considérée comme dupliquée lorsque qu'une bonne partie de son contenu se retrouve sur plusieurs URL différentes. Je ne sais pas être beaucoup plus précis que "une bonne partie", disons simplement que Google par exemple sait repérer des expressions clés, ou paragraphes, ou synonymes dans un texte. Le fait de prendre un texte et de le modifier en changeant quelques mots ou en inversant des paragraphes n'empêchera pas les meilleurs moteurs de le considérer dupliqué par rapport à l'original.

 

Il est donc inutile d'essayer de tricher à moins de transformer complètement le texte original, ce qui peut prendre plus de temps que de partir d'une feuille blanche.

 

Voici quelques exemple de cas de figure peuvent faire entrer une page en duplicate :

  • Un webmaster décide d'inscrire son site dans 2000 annuaires automatiques pour quelques euros. Waouh, quelle offre intéressante. Il soumet donc un titre, une description, quelques infos de base. Ces infos se retrouvent donc dupliquée ssur les 2000 annuaires
  • Une page A est crée par un webmaster tout à fait sérieux. Un petit bloggeur sans scrupule trouve le contenu A intéressant et décide de le récupérer sur son blog B via un simple copié-collé
  • Sur un même site, une page peut être accessible depuis plusieurs URL. Cela arrive souvent par exemple sur les sites qui ont une version mobile, ou une version imprimable. On parle alors de duplicate interne à un site.


Les conséquences du duplicate content

Les conséquences peuvent être mineures, tout comme elles peuvent être catastrophiques pour un site. Il faut d'abord savoir que Google déclasse un contenu dupliqué, c'est à dire qu'il le garde en général dans son index, mais le positionne loin dans les résultats de recherche, là ou personne ne va en gros. Le moteur peut par exemple déclasser quelques pages d'un site qu'il considérera comme dupliquées, ce qui n'est pas bien grave sur un gros site. Cependant, si trop de pages sont considérées comme dupliquées sur un même site, celui ci sera pénalisé en totalité, Les visiteurs en provenance de Google en deviendront quasiment inexistants.

En reprenant l'exemple des annuaires qui ne demandent pas de descriptions uniques (contrairement à Net-Addict), les 2000 annuaires que nous avons cité plus haut sont tous en duplicate content sur la majorité de leur contenu, le filtre a pour conséquence tout simplement de les faire fermer car leur trafic a chuté du jour au lendemain. Ceci est bien évidemment le pire des scénarios et nous verrons plus bas qu'il est possible de sortir du filtre en fournissant un peu de travail.

 

Copier coller Créer

 

Eviter d'entrer dans le filtre

Pour ne pas entrer dans le filtre du duplicate content, le plus simple est encore de produire du contenu original, en évitant d'utiliser le contenu des autres. Google à de son coté prévu la balise html "canonical", permettant d'indiquer aux robots qu'une url possédant cette balise est à prendre en priorité sur les autres pouvant posséder le même contenu. Une page ayant cette balise est en gros la page originale.

Cette balise est à placer en début de page, entre les balise <head> et </head>, de la manière suivante : <link rel="canonical" href="/mon url" />

Dans le cas des sites ayant une version mobile par exemple, le mieux est d'indiquer aux moteur de ne pas indexer les url version mobile grâce à l'attribut "noindex"

 

Sortir du filtre

Le plus simple pour sortir du filtre est de supprimer, ou réécrire tout contenu dupliqué. Le réécrire est un travail de longue haleine, mais permet de conserver du contenu. Une fois qu'un site est vidé de son contenu dupliqué, Google semble le sortir du filtre environ un mois après. Si certaines pages ne reviennent pas dans les résultats de recherche, il sera judicieux d'aider à leur référencement en leur apportant de nouveaux backlinks.

 

Les limites

La "pénalité" mise en place par Google et relative au contenu dupliqué est une très bonne chose pour la qualité et la pertinence de résultat Google. En effet personne n'aimerais parcourir les deux première pages des résultats Google pour voir des sites affichant tous la même chose. Cependant ce filtre a ses limites et n'est pas toujours efficace. Les gros sites ayant beaucoup de poids ne semblent par exemple pas touchés.

Imaginons que vous ayez un petit site que vous essayez de lancer. Il suffit qu'un gros site reprenne votre contenu, et c'est vous même qui serez pénalisé, le gros site semblant avoir plus d'intérêt aux yeux de Google.

 

Et Net-Addict dans tout ça ?

Après avoir lu ceci, vous devez sans doute commencer à comprendre pourquoi Net-Addict (ainsi que d'autres annuaires de qualité) demande des textes uniques dans son annuaire et ses publications. Le fait d'autoriser des descriptions dupliquées sur d'autres sites pénaliserait le site complet. Mais il faut aussi savoir que cela ne favoriserait pas non plus votre propre référencement car les fiches ne recevraient que très peu de trafic moteur, et les liens vers vos sites n'auraient que peu de poids aux yeux des moteurs de recherche.

 

Photo : whatleydude

Commentaires   

 
gege061
0 # gege061gege061 14-09-2010 15:20
Bonjour,
quel est le but d'un annuaire ? Non pas de faire des liens par plaisir pour les webmestres mais pour avoir un annuaire de qualité et faire payer ses publicités et gagner de l'argent
On voit déjà apparaitre les limites du duplicate content puisque des "annuaires de qualité "(sic) proposent de faire écrire un nouveau texte en payant bien sur. Ensuite l'auteur pourrait demander des droits d'auteurs....
Ça n'est pas parce qu'on est dans les biens immatériels qu'on doit faire n'importe quoi
Cordialement

ps : les ventes sur internet , pour une bonne société doivent se situer autour de 10%
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
Net-Addict
0 # Net-AddictNet-Addict 14-09-2010 15:54
L'idée d'un service payant pour la rédaction d'une description est plutôt intéressante je trouve, du moins si la dite description est rédigée correctement et optimisées pour les moteurs.
Qui sait, le filtre du duplicate content va peut être faire le bonheur des rédacteurs web.

Egalement d'accord sur le fait qu'un annuaire n'est aujourd'hui plus une ferme à liens, un annuaire se doit d'être de qualité. L'administratio n n'est pas toujours facile et le fait de le monétiser par la pub en échange d'un service gratuit est une très bonne chose :-)
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
dietetique
0 # dietetiquedietetique 16-12-2010 16:45
Merci pour ces précisions sur le filtre anti-duplicate! ! Ce que j'aurai aimé savoir, c'est à partir de combien de pourcentage de contenu duplicate la page est-elle considérée comme duplicate??
Sinon, je ne suis pas d'accord avec toi gege061, la plupart des annuaires ont un service gratuit, enfin pour les annuaires dit de qualité.
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
gege
0 # gegegege 16-12-2010 19:24
Pour completer ces informations il semblerait que le 'duplacate" soit vérifié par des robots et que pour ne pas apparaitre il faille changer environ tous le 7 mots.
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
Net-Addict
0 # Net-AddictNet-Addict 16-12-2010 22:47
@dietetique : pour le pourcentage, pas de chiffre précis à donner malheureusement . D'après les témoignages que j'ai pu lire, il semblerait que quelques suites de mots sur un texte peuvent suffire à mettre un page en DC.
Je pense que ca dépend surtout du poids du site en question. Plus un site est jeune et petit, plus il faut être strict en matière de DC (mais ce n'est que mon avis, d'autre pourront peut etre apporter plus d'infos sur ce point)
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
Limonade
0 # LimonadeLimonade 06-05-2011 04:32
Bonsoir, comment citer un morceau de texte provenant d'un autre site, sans que ce texte soit considéré comme étant du DC ? Il existe une balise pour encadrer le texte ? Merci pour l'article. ;-) :-)
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
Eva
+1 # EvaEva 22-06-2011 16:31
Article on ne peut plus d'actualité avec l'arrivée du gros Panda ! ^^
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
immobilier côte dazur
0 # immobilier côte dazurimmobilier côte dazur 04-08-2011 07:25
Les critéres du DC doivent intéresser tout le monde?
Qu'en est il de la suite de 7 mots identiques?
Ces critéres sont ils variables dans le temps?
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
bankai
+2 # bankaibankai 13-08-2011 17:05
Je suis d'accord avec Net-Addict, mais moi simple webmaster avec un blog, comment ne pas faire du duplicate content au bout de la cinquantième soumissions, beaucoup d'annuaires de qualités sont présent, Cela devient dur de faire des descriptions uniques au bout d'un moment.
Mais faire des descriptions uniques est très profitable pour tout le monde, le webmaster du site est de qualité et l'annuaire encore plus, ce qui met dehors les sites peu scrupuleux.
Au moins il y a du travail de fait pour le référencent.
Merci pour cet annuaire Net-Addict
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
jeux gratuits
0 # jeux gratuitsjeux gratuits 15-08-2011 22:07
Qu'en est t'il actuellement concernant le DC et la fameuse suite des 7 mots, cela change, et avec panda ?
Il est vrai que à force de faire de l'unique, cela ne sera plus unique ou alors toutes les combinaisons seront prises, donc seule les premiers profiteront de cette "mane" de texte, donc les annuaires ...
à méditer ;-)
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
yves
0 # yvesyves 15-08-2011 22:53
Oui bien dit!

à moins que l'on invente de nouveaux mots ou que l'on écrive en sms: 1 Kfé ou 1T ? Je prendrais un jus d'orange !
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
Olivier
0 # OlivierOlivier 15-08-2011 23:10
Jamais entendu parlé de l'histoire des 7 mots. A ma connaissance il n'y a pas de taux officiel (j'entends par là pourcentage ou nombre de mots/expression s/pharases identiques sur deux pages distinctes) permettant de savoir si un page est dupliquée ou non.
Concernant le texte unique à fournir aux annuaires et autres site de CP... eh oui, c'est pas toujours évident, mais faut faire avec :P
Perso je recommanderais de ne faire qu'une trentaine d'annuaires de qualité, puis de passer aux services de publications d'articles sur lesquels il est bien plus facile de faire de l'unique car on est pas obligé de faire une description globale de son site, et on peut réellement diversifier ses textes.
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
yves
0 # yvesyves 15-08-2011 22:50
Bonjour à tous!

Une question !


Une explication qui est reprise sur plusieurs pages du même site est-elle considérée comme du duplicate content?

Exemple :
Pour information

Quand un article est mentionné Fin de série, c'est qu'il ne sera pas reconduit à la fabrication. De ce fait, les tailles de maillots de bain et couleurs en ruptures de stock ne pourront plus être disponibles à nouveaux à la vente. Nous finissons les différentes tailles encore en stock et l'article sera enlevé de la boutique. Donc, plus disponible à l'achat. Tous les ans La Marque Leg Avenue retire certaines références de sont catalogue, pour donner du travail à nos chers Designers et également pour votre plaisirs de voir de magnifiques et originales nouveautés.
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
Olivier
0 # OlivierOlivier 15-08-2011 23:01
Si un paragraphe est répété sur plusieurs pages, mais que ce paragraphe ne représente qu'une petite partie du contenu de chaque page (le reste du contenu de chaque page étant unique), je ne pense pas que cela soit pénalisant en terme de duplicate :-)
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
kakémono
0 # kakémonokakémono 25-10-2011 19:15
Il existe un très bon outil pour savoir si une page web a été copié/dupliqué. Il s'agit de l'outil "duplicate content" sur le site positeo. Je le recommande!
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
Eréputation
0 # EréputationEréputation 01-02-2012 19:17
Pour le duplicate content même si les conséquences sont mineures la meilleure chose à faire et de miser sur du contenu unique afin de ne pas tomber sur le filtre de google. D'ailleurs avec panda les portails qui se veulent de qualité ne badine pas avec.
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
Housse de couette
0 # Housse de couetteHousse de couette 13-02-2012 19:22
Merci pour cet excellent article. En fait mieux vaut miser sur le contenu unique et éviter le "duplicate content" et surtout de se faire épingler que ce soit par Google ou les autres moteurs
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
cadeaux comite entreprise
0 # cadeaux comite entreprisecadeaux comite entreprise 21-02-2012 12:20
Tout à fait. Il faut juste privilégier le contenu unique que dupliqué, c'est vrai que c'est devenu un travail difficile pour le référenceur mais ça vaut la peine puisse que le résultat est éminent.
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 
 
cours particuliers
0 # cours particulierscours particuliers 23-02-2012 15:25
@kakémono j'ai eu à tester cet outil que tu as mentionné mais au bout de trois recherches ça plante ou je ne comprend pas peut être les recherches sont limitées à trois ou bien?
Répondre | Répondre en citant | Citer | Signaler à l’administrateur
 

Ajouter un Commentaire


Code de sécurité
Rafraîchir