Vous êtes ici : Miss SEO Girl » Articles invité » Eviter le contenu dupliqué, un point essentiel du SEO d’un site e-commerce

Eviter le contenu dupliqué, un point essentiel du SEO d’un site e-commerce

mikeHello les amis. Aujourd’hui je vous propose un article invité rédigé par Mike Vandenhooft.

Mais qui est Mike ? Non, ce n’est pas Mike Delfino des Desperates Housewives, un peu de sérieux quand même 🙂

Notre Mike d’aujourd’hui, a été le premier à avoir lancé en 1998 une agence consacrée à 100% au référencement web en Belgique nommée Extenseo. Il est aujourd’hui Confondateur et Marketing Manager chez Newpharma, une des plus grandes pharmacies en ligne d’Europe.

Depuis un moment avec Mike nous échangeons par mail sur différents sujets et c’est tout naturellement que je l’ai invité pour nous parler d’un sujet super intéréssant : le contenu dupliqué pour le e-commerce ! Un sujet important et délicat pour le e-commerce ! Découvrez son avis et ses astuces sur le sujet !

Le contenu dupliqué

Selon Gary Illyes, 60% du web serait du duplicate content, c’est-à-dire que sur toutes les URL disponibles sur la toile, 3/5 du contenu serait recopié. C’est fou, vous ne trouvez pas ? Mais il indique aussi que la plupart du temps, ce contenu n’est pas volontairement dupliqué. Il s’agit d’oublis de la part des webmasters ou encore d’une certaine négligence de leur part mais sans volonté de nuire à quelqu’un.

Aujourd’hui, nous allons nous concentrer spécifiquement sur le contenu dupliqué dans l’e-commerce. En effet, si vous êtes e-commerçants, vous risquez de rencontrer des problèmes avec Google ou de ne pas atteindre les positions désirées sur les moteurs de recherche si votre contenu est pris d’autres sites ou dupliqué au sein de votre propre site (description produits, marques, catégories…) car votre site sera considéré comme moins qualitatif. Il existe plusieurs techniques pour lutter contre le contenu dupliqué, pour en faire part à Google ou tout simplement améliorer la manière dont les crawlers interprètent votre contenu lorsqu’il est dupliqué.

Qu’est-ce que le contenu dupliqué ?

Le contenu dupliqué est la reproduction partielle ou totale de contenu existant sur son site ou sur un site extérieur. En général, on distingue 2 types de contenu dupliqué qui se traitent de façon totalement différente.

Premièrement, le contenu dupliqué interne, et donc le fait de dupliquer du contenu entre les différentes pages d’un site sur un même nom de domaine. Il est en effet compliqué de penser à tous les aspects d’un site e-commerce (fiches produits, articles de contenu, catégories…).

Ensuite, nous avons le contenu dupliqué externe. La duplication de ce contenu implique que quelqu’un reproduise exactement ou partiellement le contenu de votre site ou inversément. Le contenu sera donc présent sur un autre nom de domaine. Cette approche est aussi valable pour la duplication entre vos noms de domaines géographiques comme par exemple : votresite.fr et votresite.be.

En quoi le contenu dupliqué pourrait-il être un frein à l’évolution de votre site e-commerce ?

contenu-blog-qualiteLe contenu dupliqué (externe ou interne) donne du travail à Google pour rien puisque son robot devra lire et indexer le contenu de toutes les pages dupliquées 2 fois. Cette approche force aussi Google à faire des choix entre différents contenus tout en choisissant le contenu qui lui semble le plus pertinent à ses yeux pour l’utilisateur. Vous aimez quand on vous fait perdre du temps vous ? 🙁

Plus spécialement dans l’e-commerce, les positions sont très importantes dans les moteurs de recherche. Le contenu dupliqué n’apporte rien à votre site mais il ne le pénalise pas non plus sauf si Google remarque que vous le faites de façon à le tromper. Google choisira quelle est la version originale en fonction de la date de première indexation et de la popularité du site. La version dupliquée ne gagnera pas d’autorité grâce à ce contenu recopié.

Comment repérer du contenu dupliqué ?

Il existe certainement plusieurs manières de détecter du contenu dupliqué mais en matière de contenu dupliqué externe, je vous conseille de commencer avec le site Plagiarism Checker. Ce site gratuit permet de détecter si du contenu est dupliqué sur le web et de déterminer le pourcentage de duplication. Si vous êtes professeur, cela pourra également vous aider à repérer des petits malins qui copient leurs textes sur internet 🙂 , mais là je m’écarte du sujet …

Bien entendu si vous cherchez un programme plus complet et payant pour analyser tout le contenu dupliqué interne de votre site, il en existe quelques-uns qui pourront répondre à vos besoins. Par exemple Killduplicate.

Contenu dupliqué interne dans l’e-commerce

contenu-critere-referencementAvoir un beau site d’e-commerce, c’est bien mais avoir un site bien codé, original et avec beaucoup de contenu, c’est mieux.

Il existe de nombreux types de contenu dupliqué interne et multiplier les pages sans changer le contenu peut avoir des effets indésirables sur votre site (perte de ventes, baisse de qualité du site et baisse des rankings).

Vous pouvez modifier ce contenu vous-même. Certaines améliorations mettront évidemment beaucoup de temps à être réalisées tandis que d’autres seront plus rapides à être déployées. Nous allons en passer plusieurs en revue.

Contenu dupliqué dans les descriptions de produits et de marques

contenu-liensUne erreur typique de beaucoup d’e-commerçants au sujet de la reproduction de contenu est de reprendre une description de produit ou de marque “universelle” et d’ensuite la dupliquer sur plusieurs fiches produit ou pour plusieurs pages marques du site.

Par exemple, vous vendez des produits de la gamme “X” et à la place de décrire chaque produit individuellement et d’expliquer ses spécificités et différences, vous parlez de la gamme X et ce texte revient sur plusieurs produits. Cela n’est pas pertinent dans le contexte et Google le sait très bien. C’est aussi valable pour vos produits en différents conditionnements. Il est en effet lourd (mais nécessaire) de développer une description différente pour une boite de 30 gélules et une de 50 si vous avez des fiches produit différentes pour chaque conditionnement (le top, c’est une seule fiche produit avec un menu déroulant comprenant les différents conditionnements).

Dans un premier temps, il convient évidemment de ne pas dupliquer les pages entières entre les différentes parties de votre site. Parfois certaines pages sont cachées ou oubliées par le webmaster, même si elles sont toujours indexées. Par exemple, vous avez une page à propos d’une huile Nuxe qui apparaît à deux URL différentes :

  • votresite..com/nuxe-huile
  • votresite..com/nuxe-huile-corps

Dans un deuxième temps, parfois, selon les différentes étiquettes ou pages marques dans lesquelles vous insérez vos produits pour mieux les classer se crée une nouvelle URL. Ces pages sont parfois mal organisées au sein d’un même site et comportent de nombreux doublons.

Exemple :

  • votresite/sante/shampoings/shampoing-kilo-bio
  • votresite/produits/shampoing-kilo-bio

Ce contenu ne sera pas apprécié par Google puisque vous lui donnez inutilement du travail en trop et qu’en plus cela disperse les visiteurs d’une même page sur deux pages différentes. Dans ce cas spécifique, l’installation d’une redirection 301 ou d’un rel=”canonical” s’impose. C’est très important pour garder la structure de votre site tout en indiquant à Google votre page préférée et sans perdre le précieux Link Juice. Pensez utilisateur, pensez Google.

Contenu dupliqué dans le code HTML

Selon la manière dont vous organisez et codez votre site, il se peut que certaines parties de code soient dupliquées à différents endroits.

Balises META

Parlons-donc des balises META. La Google Search Console vous avertira si certaines balises META sont dupliquées entre les différentes pages de votre site. Cela arrive régulièrement et pénalise les sites web puisque chaque page est censée avoir son but et que ce but doit être décrit dans la META title et dans la META description.

Globalement, veillez à avoir des titres et descriptions considérés comme uniques par Google. Ce point peut être contrôlé via la Search Console de Google Webmaster Tools qui vous avertira lorsque des éléments sont dupliqués.
META en double

Proportion du template dans la totalité de la page

En tant qu’e-commerçant, vous aurez certainement des infos qui se retrouveront à de nombreux endroits comme par exemple vos informations de livraison qui se trouvent sur chaque fiche produit. Elles ne sont pas en lien direct avec le contenu original de la marque mais elles font partie de ce que j’appelle le template/modèle de page.

Il faut être vigilant à ce que le template ne prenne pas trop de place dans le code HTML et dans le contenu de votre page. En effet, l’aspect le plus important d’internet et de tout site web est son contenu et non sa mise en forme. Si vous avez des éléments qui restent identiques lorsque vous changez de page (footer, navigation, colonnes, etc.), veillez à ce que ces éléments ne contiennent pas (trop) de contenu. Il est préférable d’alléger le template et de favoriser le contenu original qui change entre chaque clic.

La solution au contenu dupliqué interne ?

Il vous faudra un peu d’huile de coude, surtout si vous disposez de nombreux produits. La solution optimale est de personnaliser votre description (description produit et META description) et le titre (H1 et META title) de chaque produit individuellement et manuellement, ce qui vous apportera plus de pertinence et de meilleurs rankings.

Il arrive de voir plusieurs catégories sur un site d’e-commerce qui ont la même dénomination et la même description. Par exemple, si vous découpez votre site par catégorie d’âge, il y a une catégorie vitamines pour les personnes de plus de 50 ans et une catégorie vitamines pour les personnes plus jeunes. Si vos catégories ne peuvent pas comporter des descriptions différentes, regroupez-les.

Contenu dupliqué externe dans l’e-commerce

annee-2017-seo

Vis-à-vis de sites externes (spam, concurrence…)

En dehors des aspects légaux, et que ce soit avec ou sans autorisation, un contenu copié-collé ne pénalisera donc pas votre site.

Google le confirme : “Le contenu en double n’entraîne pas de conséquences négatives particulières pour votre site sauf si l’objectif semble être de tromper et de manipuler les résultats des moteurs de recherche. En cas de problèmes de contenu en double, et si vous ne suivez pas nos recommandations, nous nous chargeons de choisir la version du contenu à afficher dans nos résultats de recherche.”

Par rapport à cette déclaration, vous vous en doutez, l’antériorité est un facteur important dans ce cas mais aussi la qualité. Google donnera la visibilité à la page qui est apparue en premier et qui sera qualitative. D’un autre côté, Google donnera peu de visibilité aux reproductions. Légalement parlant, faites attention aux lois sur le plagiat et la propriété intellectuelle si vous récupérez un contenu sur un site sans autorisation de la part de son auteur.

google-SERP-fastwebmediaUne fois que votre texte est posté et qu’il a été copié par John Doe votre concurrent, ce qui arrive parfois, c’est que les moteurs de recherche se trompent en identifiant le texte original car les 2 textes ont été publiés quasiment en même temps et que les crawlers passent en premier sur le site de John et ils définissent donc que son texte est le texte original. Il prendra donc également une meilleure place dans les moteurs de recherche.

Dans ce cas, gardez bien les preuves que vous êtes l’auteur du texte et vous pouvez également signaler la violation de vos droits d’auteurs à Google (demande DMCA).

Ensuite, je dirais qu’une erreur commune en SEO est de reprendre la description produit que votre fournisseur vous a envoyée et de la copier-coller sur votre site. En effet, cette description se retrouvera à la fois sur le site du fournisseur mais aussi sur les sites des autres vendeurs. L’autorité sera donnée à la version originale, c’est-à-dire probablement la version de votre fournisseur.

Gardez donc le contenu intéressant pour vos lecteurs et reformulez cette description. Cela ne pourra qu’être profitable pour vous et vous apportera un plus ! Encore mieux, cherchez des informations supplémentaires sur les produits de votre fournisseur et améliorez-en la description ! Si vous en formez une de toute pièce, cela vous donnera la chance d’être la seule version originale.

Si vous n’avez pas le temps de modifier cette version, créez un lien vers la version originale du texte. Google verra ainsi que vous êtes conscients que ce texte existe à d’autres endroits et prendra en compte votre transparence.

Entre vos propres noms de domaines

Autant les démarches pour diminuer le contenu dupliqué de vos concurrents peuvent prendre du temps et être très lourdes à exécuter, autant diminuer le contenu dupliqué entre vos propres sites peut être très facile (cela ne dépend que de vous !).

Noms de domaines géographiques

Votre site comporte plusieurs extensions géographiques ? Vous vendez dans plusieurs pays en Europe et chaque site a sa plateforme ? Dans ce cas, cette astuce va certainement vous plaire.

Il existe un moyen très simple de signaler à Google qu’il existe plusieurs fois la même page et qu’elle est juste reproduite en fonction de la région géographique. Par exemple, si vous postez un texte à destination de vos clients français suivi d’un texte à destination de vos clients belges sur 2 URL différentes mais que les 2 textes sont identiques, il vous suffit de le signaler grâce à ce petit bout de code à placer dans le header de chaque page dupliquée :

  • <link rel=”alternate” href =”newpharma.be pharmacie/bio-oil/416890/bio-oil-huile-regenerante-60ml-promo.html hreflang=”fr-be”>
  • <link rel=”alternate” href=”newpharma.fr/bio-oil/416890/bio-oil-huile-regenerante-60ml-promo.html” hreflang=”fr-fr”>

Dans l’exemple ci-dessus, la première ligne indique que la page Newpharma.be et donc la page belge est la page en français pour la Belgique et la deuxième ligne indique que la page newpharma.fr lui est identique mais que ces deux pages sont mises en place pour toucher une audience différente, à savoir les internautes belges dans le premier cas et les internautes français dans le second.

Les alias de votre URL

Ensuite, il y a encore un point très important auquel il faut faire attention. Lorsque vous configurez votre serveur web, pensez à installer une redirection 301 sur les variations de votre URL par exemple : avec ou sans www, http ou https…

Si vous ne faites pas cela, Google indexera toutes les pages en double, considèrera que ce sont deux sites distincts et les analysera séparément. C’est donc un peu comme si vous vous faisiez de la concurrence à vous-même. C’est aussi valable pour vos sous-domaines s’ils ont une quelconque ressemblance avec votre site racine.

C’est également valable pour les sites sur lesquels vos développeurs travaillent et sur vos sites de tests s’ils ont une quelconque ressemblance avec des pages de votre site racine. Veillez à ce qu’ils ne soient pas indexables par les robots (en les protégeant par mot de passe, par exemple).

Pour conclure

sortir-du-lotVous l’aurez compris, la lutte contre le contenu dupliqué prend du temps et ce n’est pas une chose facile. Je terminerai sur ce point : l’originalité. Lorsque nous sommes sur le web à la recherche d’un produit ou d’un contenu, nous recherchons la meilleure expérience possible avec un site web original, bien écrit, complet. Soyez ce site, soyez unique, soyez LE bon élève qui se démarquera des autres grâce à son originalité et à son souci du détail.

J’espère que ces informations vous seront utiles, n’hésitez pas à poser des questions ou à rajouter des points en commentaire. Je me ferai un plaisir de vous répondre .

Please wait...

14 réflexions au sujet de « Eviter le contenu dupliqué, un point essentiel du SEO d’un site e-commerce »

  1. Très bel article, bravo.

    J’apporterai une nuance cependant quand vous dites que : que Google décide en fonction de la date de première indexation et de la popularité du site.

    Pour moi c’est soit l’un, soit l’autre, mais pas en aucun cas un mélange des deux. Par expérience je peux dire que Google décide en fonction de la popularité du site. Il suffit de regarder les problèmes qu’on les e-commerçants lorsqu’ils envoient leur flux produit à des marketplace comme amazon et autres…

  2. Bonjour,

    Vous connaissez un outil pour vérifier qu’une personne ne “pique” pas mon contenu et que je m’assure que celui-ci est unique ?

    Merci !

  3. Bonjour Thibault,

    Plagiarism checker ou Positeo pour le vérifier manuellement. Pour le détecter de façon automatique, Kill duplicate.

    Mike

  4. Bonjour,
    Reprendre le texte d’une fiche-produit pour un argumentaire Pinterest et un article de boutique Facebook est il assimilé à du duplicate content ?
    (même e-commercant / même produit)
    Merci de m’éclairer 🙂

  5. Merci pour ce contenu qui explique bien les contraintes des e-commerçants. Il y a un outil bien pratique pour détecter le contenu dupliqué en interne : http://www.siteliner.com/
    Permet de voir sur l’ensemble du site le % de contenu commun entre plusieurs pages.

  6. Pour info si vous faites du guest blogging, je vous recommande x50 d’utiliser des logiciels pour le détecter car une fois j’ai pris peur en voyant certains textes sur mon site !

  7. Bonjour,
    J’aurais bien aimé avoir une réponse à ma question s’il vous plait ?
    La réutilisation des textes de fiches-produit pour une boutique Facebook et des épingles Pinterest, est-elle considérée par google comme du contenu dupliqué ?
    Merci

  8. Bonjour Marie,

    Etant donné que le contenu des pages publiques Pinterest est indexé par Google, oui. Copier-coller certaines parties de votre fiche produit dans vos épingles Pinterest pourrait nuire à votre SEO (attention, je ne dis pas que vous ne pouvez pas reprendre un extrait de quelques lignes si votre article/page a beaucoup de contenu et surtout si votre épingle Pinterest comprend un lien vers la fiche produit en question).

    Mais… il vaut toujours mieux reformuler vos textes quand c’est possible 😉

  9. Bonjour Alexandra,

    Est-ce que vous avez une idée sur ça svp : est-ce qu’un contenu traduit, corrigé par des mains humaines et modifié un peu fait l’objet d’un plagiat et donc d’une pénalisation par google ? La modification que je fais : Ajout de sous titres, changement du grand titre et correction de toute erreur empêchant la compréhension du lecteur ..). Si oui, comment remédier à ça svp ?

    Merci de me répondre svp, je suis en grande difficulté et je risque de perdre mon poste.
    Cdt

  10. Bonjour Alexandra, Mike,

    Merci pour cet article !
    J’ai un soucis de contenu dupliqué sur mon site : une agence de reco produit a installé un module sur mon CMS qui a eu pour conséquence de dupliquer “sans faire exprès” (hum…) des centaines de pages produits

    Exemple : http://www.monsite*com/huile/huile-fleur-tiare VS http://www.monsite*com/huile/huile-fleur-tiare?ruuid=c06e7725-a4ed-4a4e-96e1-b7eaa87a8e17_1

    Si je comprends bien, il faudrait que je crée des 301 pour toutes ces pages ? Pourtant, ces pages n’ont aucun intérêt SEO, pas de jus, nada… Est-ce qu’une 410 n’est pas préférable ?

    Merci pour vos lumières !

  11. Bonjour,

    Super article !

    J’ai lu votre article et le trouve super intéressant, avec lequel nous sommes en adéquation d’ailleurs. D’autre part, je vous propose de prendre connaissance de notre article qui parle du même sujet : https://www.keyboost.fr/contenu-duplique/

    J’aimerais également attiré votre attention sur l’utilisation de la balise canonique qui se fait lorsque le contenu dupliqué est inévitable.
    Nous avons menée une étude sur le sujet. Vous pouvez en prendre connaissance par ici : https://www.keyboost.fr/la-balise-canonique-2-3-chiffres/

  12. Bonjour,
    La lutte contre le duplicate content peut s’avérer fastidieuse, surtout si vous n’avez pas appliqué les bonnes pratiques dès le départ. Mais clairement, c’est un travail qu’il faut prendre le temps de faire.
    Merci pour votre article.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

CommentLuv badge

Les liens des commentaires peuvent être libérés des nofollow.