Vous êtes ici : Miss SEO Girl » Articles invité » Plagiat et Duplicate Content

Plagiat et Duplicate Content

Aujourd’hui je vous propose cet article invité traitant du plagiat et du contenu dupliqué, sujet très en vogue en ce moment, écrit par Mathieu Chartier.

Mathieu est l’auteur du livre Le guide du référencement web, un très bon livre que je suis en train de lire actuellement. Sans trop m’avancer, car je ne suis même pas encore à la moitié du livre, je pense vraiment que c’est du même niveau que La Bible du référencement d’Olivier Andrieu. En tout cas, je vous donne mon avis final dès que j’ai fini sa lecture. :)

Mathieu est également quelqu’un de très intéressant, très bavard, avec qui j’adore échanger sur les sujets seo, et pas que :)

Je vous souhaite bonne lecture et bon courage pour tout lire ! ;)

Qu’est-ce que c’est et quels sont les risques ?

voleur-googleLe web est bondé de contenus et il faut être de plus en plus prévenant lorsque nous rédigeons des articles sur des blogs, des fiches-produits sur des boutiques en ligne ou même des paragraphes commerciaux sur des sites d’entreprises. Le plagiat est à la portée de tous et les contenus peuvent rapidement être récupérés sans que nous nous en apercevions, il convient donc de rester vigilant.

Avec l’omniprésence de Google, le problème des vols de contenus va encore plus loin puisque le moteur de recherche chasse les fraudeurs. Lorsque des contenus sont volés et dupliqués sur d’autres sites web, l’algorithme et les filtres de Google ne font pas toujours la différence entre la source réelle et le voleur, mais les sanctions tombent et peuvent engendrer d’énormes pertes de trafic. Nul doute que la majorité des fraudeurs ne pense pas à ces effets collatéraux, mais en plus d’être dans l’illégalité, ils peuvent entraîner des chutes de positionnement dans les moteurs de recherche, c’est donc une double sanction pour les victimes.

Pour résumer, le « duplicate content » est une expression anglaise qui détermine deux types d’actions chassées par Google et certains de ses acolytes :

  • Les contenus identiques visibles sur plusieurs pages ayant des noms différents
  • Les pages doublons, à savoir des pages web qui ont exactement le même contenu mais dont les URL sont différenciées, ou des pages variées avec une URL similaire.

Nous verrons que ce type de pratique peut arriver par accident, il ne faut pas nécessairement le concours de fraudeurs pour tomber dans le piège. Balayons déjà devant notre porte mais n’oublions pas de surveiller si d’autres personnes accentuent les risques en volant nos contenus.

Au-delà des problèmes de positionnement dans les moteurs de recherche, le vol de contenus est soumis au droit d’auteur, moral et patrimonial, régit notamment par les articles L.111-1 et L.123-1 du code la propriété intellectuelle. Pour résumer, la loi reconnaît en tant qu’auteur toute personne physique qui crée une œuvre de l’esprit quel que soit son genre (littéraire, musical ou artistique), sa forme d’expression (orale ou écrite), son mérite et sa finalité (artistique ou utilitaire). L’auteur est libre de faire ce qu’il souhaite de son œuvre (donc de ses contenus) sauf si un contrat de cession des droit a été rédigé et signé entre deux parties.

La contrefaçon est punie par la loi de deux manières :

  • Au civil avec une allocation de dommages et intérêts ;
  • Au pénal avec une peine pouvant aller jusqu’à 3 ans de prison et 300000€ d’amende.

Depuis le décret n°2009-1205 du 9 octobre 2009, neuf tribunaux de grandes instances sont habilités à juger les actes de contrefaçon sur Internet.

N.B. : le « copyright » que nous apposons tous dans nos sites web n’est pas une notion de droit français, mais seulement américaine (Titre 17 du United States Code), elle n’a donc qu’une valeur informative. En France, les contenus sont couverts par le droit d’auteur dès qu’ils sont créés, mais il est conseillé de réaliser un dépôt ou de faire constater l’existence par un notaire par exemple pour confirmer la date de création des œuvres.

Vérifier les contenus contrefaits avec de bons outils

boite-outils-seoLa contrefaçon est désormais très courante et ne peut pas être prise à la légère tant les contenus ont pris de l’importance ces dernières années. Parmi les exemples récents, nous pouvons citer l’hébergeur Netissime pris en flagrant délit de plagiat à propos de contenus rédigés par l’agence AxeNet, il peut donc arriver que ce soit de grandes structures qui abusent le plus de ce type de pratique. Rappelons-nous également des quelques livres qui ont défrayés la chronique pour des passages entiers recopiés précisément sur d’autres écrits.

Nous ne pouvons pas galvauder ces problèmes, et pour ce faire, le web dispose désormais d’une bonne palette d’outils avec chacun leurs spécificités. En voici une liste non exhaustive mais qui vous permettra de mieux appréhender les vols de contenus :

  • Copyscape : le plus connu de tous. Gratuit en partie mais la version payante va beaucoup plus loin dans l’analyse des contenus contrefaits.
  • Plagium : comme Copyscape. Gratuit en partie mais des fonctions avancées payantes.
  • Plagiarism Checker : outil de très bonne facture entièrement gratuit. À tester !
  • Plagiarism cheker de Dustball : comme Copyscape. Gratuit mais des fonctions payantes.
  • KillDC : outil de protection contre les contenus dupliqués.
  • 3YA : un simple champ de texte pour vérifier les copies de phrases. Gratuit.

Il existe également une panoplie de logiciels à télécharger ou des solutions en ligne payantes telles que Compilatio pour les étudiants et enseignants, Urkund, Ephorus, PlagScan Pro, Plagiarism Detector, Noplagiat.com ou encore WcopyFind pour les professionnels.

Ces outils ne permettent pas toujours de détecter le plagiat profond dans les versions gratuites ou de démo, mais ils répondent généralement aux attentes et permettent de vérifier rapidement si d’autres sites puisent dans vos contenus.

Comment réagir face à la contrefaçon de contenus ?

juge-seoQui ne s’est jamais demandé comment réagir lorsqu’on découvre des contrefaçons de codes sources ou de contenus ? Aucune méthode n’est idéale mais il convient dans un premier temps d’alerter les coupables pour leur faire part de votre désappointement.

Deux cas de figures peuvent se présenter :

  • les coupables reconnaissent les faits et décident de tout mettre en œuvre pour réparer leur erreur
  • ils font mine d’être les premiers auteurs ou créateurs, d’être dans leur droit et refusent de retirer les contenus contrefaits.

Le premier cas est un jeu d’enfant et se présente régulièrement, les coupables de vol de contenus sont généralement humains et savent reconnaître leurs torts. Toutefois, lorsque les fraudeurs osent s’opposer à vous, il ne faut surtout pas se laisser faire. Voici quelques instructions utiles :

  • envoyez un courrier avec accusé de réception aux contrefacteurs en faisant état des contenus dupliqués (images, vidéos, textes…)
  • faire un constat d’huissier en prouvant que votre œuvre est plus ancienne que celle des contrefacteurs
  • mener une action en justice (au civil ou au pénal).

Bien entendu, l’idéal est de se prémunir contre ces éventuelles contrefaçons en appliquant des méthodes simples mais efficaces :

  • protéger les données à risque par un accès sécurisé, avec des fichiers .htaccess ou encore utiliser des bases de données avec mot de passe ;
  • informer les utilisateurs des risques encourus dans les mentions légales, en précisant la date de création initiale des contenus (pour les blogs, la date de publication par exemple) ;
  • envoyer à sa propre adresse une copie des contenus sous forme de pli avec accusé de réception (sur CD-Rom pour les œuvres numériques si nécessaire) sans jamais ouvrir la lettre (le cachet faisant foi) ;

  • faire un dépôt sous enveloppe Soleau à l’INPI ;
  • s’enregistrer auprès d’organismes spécialisés (comme la Société des Gens de Lettres, la CNIL, etc.) ;
  • faire un dépôt des contenus à protéger chez un notaire.

Risques et solutions contre les contenus dupliqués

Gérer les aspects légaux n’est pas toujours le plus compliqué, paradoxalement. Nous devons penser que nos contenus dupliqués ou nos pages doublons peuvent rapidement générer des pertes de positionnement et donc de trafic, il convient de réagir vite pour ne pas être pénalisé par les moteurs de recherche, Google en tête de liste.

Pour ce faire, plusieurs méthodes sont possibles. Si ce sont des contenus contrefaits, nous procédons comme nous l’avons vu précédemment jusqu’à ce que les fraudeurs retirent les textes et illustrations volées. Dans ce cas, le risque de pénalité est plus faible et temporaire (si les moteurs ont détecté la « triche »…).

En revanche, le problème est différent pour des pages doublons car l’erreur humaine peut être faite aisément, notamment dans les sites ecommerce. En effet, chaque page générée par les CMS ou boutiques en ligne détient une URL fixe, souvent appelée « permalien ». Ces adresses correspondent donc toutes à des pages précises, mais il s’avère que plusieurs cas anodins entraînent parfois des contenus dupliqués :

  • Une page créée à partir d’une fonction de type “copie en tant que…” récupère généralement l’URL de la page source, et ce détail n’est pas observé lorsque nous remplissons les contenus. Il est conseillé de toujours vérifier le permalien pour éviter ce type de problème. Prenons l’exemple de Prestashop, il suffit de dérouler les options de référencement et de cliquer sur « générer » pour obtenir une URL propre à la nouvelle page.
  • Une page créée rapidement et dans laquelle nous avons fait une faute dans l’URL. Parfois, nous nous en rendons compte lors de modifications et nous décidons de corriger la faute. Le souci, c’est que si cette page avait déjà été indexée, elle se retrouve dorénavant avec une page doublon ayant le même contenu mais avec un permalien différent. L’erreur bête, mais qui peut arriver…
  • L’utilisation d’un système de tags indexés peut générer des contenus dupliqués. Lorsque les robots indexent les pages web, ils enregistrent les pages réelles ainsi que les pages reliées à des tags précis, des doublons se créent donc automatiquement.
  • Générer des pages ayant les mêmes “title” et meta “description” peut également entraîner des sanctions, il convient de vérifier les entêtes et de modifier les contenus de ces balises.
  • Les articles ou des produits faisant partie de deux catégories différentes avec des URL reprenant le nom des catégories (exemple, un produit dans une section « nouveautés » et « soldes », etc.). Par conséquent, deux URL diffèrent pour un même contenu final, il peut être intéressant de modifier la réécriture d’URL pour éviter ce problème.
  • Proposer des Flux RSS avec les contenus complets qui seront agrégés sur d’autres sites. Dans ce cas, la fraude est indirecte et peut entraîner de graves sanctions.

D’autres cas peuvent se rencontrer mais nous constatons qu’il est très facile de basculer dans la duplication de contenus sans l’avoir fait de manière calculée. Hormis les vols de contenus, nous sommes souvent la cause de nos propres problèmes, et il serait dommage d’être pénalisé par les moteurs de recherche pour ce type d’erreurs. Voici donc quelques solutions qui peuvent contourner ces problèmes :

  • utiliser les balises <link rel=” canonical “ href=”http://www.unsite.fr/page-source” /> dans les pages d’origine pour indiquer aux moteurs qu’il s’agit bien de la page à indexer et à retenir (cette balise doit être placée dans le <head>…</head>) ;
  • ne proposer que des extraits de textes dans le flux RSS ;
  • modifier les contenus si les pages doublons ne peuvent pas être retouchées totalement (quand nous n’avons pas la mainmise sur le code source ou le contrôle complet du backoffice par exemple) avec des efforts de réécriture ;
  • désindexer les pages doublons via un robots.txt ou avec des meta de valeur « noindex » ;
  • utiliser des redirections permanentes (redirections 301) si les pages posent trop de problèmes ;
  • préciser des paramètres d’URL dans les outils Webmaster Tools et indiquer le pays d’origine pour éviter les problèmes des sites multilingues.

Creative commons et le « web libre », un danger pour les auteurs et créateurs ?

creative-commons-imageCet article ne serait pas complet si nous ne parlions pas des notions de « web libre ». De nos jours, nombreuses sont les plateformes qui usent de l’open source et de la licence Creative Commons, mais nous ne savons pas toujours dans quels pièges nous tombons.

En effet, notre droit d’auteur est parfois galvaudé par la licence Creative Commons alors que cette dernière n’est censée être qu’un complément à ce droit fondamental. Prenons l’exemple de Wikipédia, l’encyclopédie universelle que nous avons tous utilisée dans notre vie au moins une fois.

Lorsque vous contribuez à l’encyclopédie, vous fournissez des contenus sous la licence Creative Commons à une date donnée. Dès lors que votre texte a été modifié ou partagé, vous devenez coauteur et vous n’avez donc plus aucun pouvoir réel sur les informations partagées. Jusque-là, tout va bien, mais le problème peut se retourner contre les auteurs eux-mêmes… En effet, en admettant que vous ayez recopiés des contenus mot pour mot dans un article de Wikipédia à partir d’une de vos créations, vous avez accepté que la licence Creative Commons s’applique et donc que vos contenus soient offerts à tous. Si vous n’avez pas fait état de votre œuvre et que vous souhaitez un jour la publier, Wikipédia pourra se retourner contre vous car la date de création sera plus ancienne sur l’encyclopédie que sur votre publication…

En effet, la licence Creative Commons ne permet pas toujours la rétroactivité, il est donc difficile de prouver que vous étiez l’auteur des contenus sur Wikipédia et que vous avez librement utilisé votre droit d’auteur pour votre publication. Vous devenez alors contrefacteur de vos propres contenus, c’est la règle de l’arroseur-arrosé ici… Soyez donc vigilants quand vous partagez des photos, des vidéos ainsi que des contenus sur les plateformes qui utilisent cette licence pratique mais abusive.

N.B. : pour l’anecdote, il m’a été impossible de retirer certains de mes contenus sur Wikipédia alors qu’ils sont mot pour mot repris de mes mémoires de recherche archéologiques. La Wikimédia Foundation considère que ces contenus lui appartiennent à partir du moment où ils ont été rédigés sur l’encyclopédie. Cela force la réflexion avant de se lancer dans les contributions de masse…

Mathieu Chartier
www.internet-formation.fr
blog.internet-formation.fr

Images libres de droit, source pixabay.com

GD Star Rating
loading...
Plagiat et Duplicate Content, 4.7 out of 5 based on 14 ratings

43 réflexions au sujet de « Plagiat et Duplicate Content »

  1. Merci à Mathieu pour cet article très poussé et surtout très instructif. Pour l’instant je n’ai jamais eu à faire à du plagiat ou du vol de contenu, j’espère que cela durera. Mais bon on est jamais à l’abri, j’avais lu cette histoire de Netissime, donc si de grandes boites comme eux en sont capable, plein de petites le sont aussi et c’est assez inquiétant…

  2. Merci Mathieu et Alexandra pour cet article intéressant et plein de ressources à utiliser. Effectivement en la matière, mieux vaut prévenir que guérir et je pense qu’entre deux sites proposant des contenus “intéressants” à copier, celui présentant le moins de risques de poursuites sera choisi.

    Principe de précaution donc, à appliquer sans tarder ;-)

  3. Bon tout d’abord, excellent article, super bien documenté et vraiment très pertinent. Merci Mathieu (ça donne envie d’acheter ton livre). L’article complète à merveille celui de Marc (@le_referenceur) il y a peu.

    Qui plus, est (et c’est véridique) cet article ne pouvait vraiment pas mieux tomber. En effet, j’ai découvert ce matin qu’une boîte à l’île Maurice avait pompé le contenu d’un de nos articles de blog (celui-ci en l’occurrence : http://www.digitaleo.fr/blog/marketing-multicanal-de-nouvelles-fonctionnalites-pour-encore-plus-de-simplicite. Résultat : cette page a complètement disparu au profit de la page du petit malin dans l’Océan Indien.

    Donc ce que j’ai fait ce matin : check du WhoIs, cool j’ai les infos. Envoie d’un mail d’avertissement sévère en demandant le retrait de l’article sous 5 jours et rappel des peines encourues. On verra bien ce que ça donne … Et si ça ne marche pas, eh bien je vais me fâcher !!!
    Cédric@Calendrier 2013 Excel Articles récents..Modèle de facture Excel à télécharger gratuitementMy Profile

  4. concernant le contenu dupliqué dans les consignes pour webmaster google indique que “Le contenu en double n’entraîne pas de conséquences négatives particulières pour votre site sauf si l’objectif semble être de tromper et de manipuler les résultats des moteurs de recherche ” , pourtant dans beaucoup de forums ont peut voir beaucoup de personnes dire n’importe quoi sur ce sujet , et je suis également très étonné de voir que le duplicate content prend autant de place dans des livres sur le référencement sortis en 2013 .
    site bourse Articles récents..le scalpingMy Profile

  5. Merci pour l’article, il me rappel le plagiat auquel j’ai fait face il y a quelques semaines.

    Aujourd’hui j’ai du appeler ovh pour le site d’un restau qui été plagié (me demandez pas pourquoi ^^) abuse[at]ovh.net j’attends maintenant la réponse.
    Rodrigue Articles récents..Méthode Vs Formations : mise au pointMy Profile

  6. Merci pour cet article très complet sur le sujet et utile, ayant été face à ce type de problème, mais n’ayant heureusement pas un impact énorme puisque ce n’est qu’un simple petit blog. J’ai en parallèle prévenu l’auteur du blog responsable de la copie et informé Google de la page en duplicate content avec le formulaire de “Suppression d’un contenu portant atteinte aux droits d’auteur” disponible sur Google Webmaster Tools. Et l’auteur a retiré l’article avant.
    Khou Articles récents..Optimisation de la balise titleMy Profile

  7. Merci, excellent article, très très complet !
    @Cédric, désolé de lire ta mésaventure, le plus ironique est qu’avec une IP Mauricienne c’est ton contenu qui ressort et pas le sien, c’est un comble….

  8. J’ai le cas avec pagespan qui vole à peu près toutes les home-page qu’il peut trouver se protégeant derrière une loi américaine de droit de la publication d’informations publiques…

  9. Merci à tous pour vos commentaires. Sachez que cet article complète ou reprend des idées que d’autres blogueurs ont déjà évoqué, c’est certain, dont Marc “LeReferenceur”. J’ai essayé d’apporter mes propres connaissances mais je ne réinvente pas la roue… ^^

    @Cédric Je suis désolé pour ce qui t’arrive, j’espère justement que tu vas pouvoir t’en sortir après ça ! En tout cas, tu as la bonne démarche et comme je le dis, il n’est pas rare que les webmasters admettent leur erreur (pris la main dans le sac, c’est quand même mieux pour eux… Rien que le fait d’être attrapé montre qu’on ne lâchera pas, donc ça peut inciter à arrêter de frauder). Merci aussi pour ton petit commentaire sur mon livre, je vais me faire un brin vendeur en te disant de foncer l’acheter ! :D

    N.B. : pour l’anecdote, je n’avais jamais eu de contenus dupliqués avant de rédiger cet article… En faisant des tests pendant la rédaction, je me suis rendu compte qu’une entreprise du Maroc reprenait mot pour mot des contenus de mon site d’entreprise (internet-formation.fr), mais impossible de les joindre à ce jour…

    @”site bourse”, je suis plutôt surpris que tu ne sois pas au courant des retombées possible après un fort duplicate content, ce qui explique les pages que les auteurs lui accordent. Je donne juste un lien d’exemple dans lequel Matt Cutts expliquent justement un moyen d’éviter les contenus dupliqués : http://www.journalduwebmarketing.com/index.php/comment-eviter-le-duplicate-content-selon-matt-cutts/

    Courage à tous, veillons à ne pas nous faire voler et surtout, n’hésitez pas à croiser les outils car tous ne donnent pas les mêmes résultats, ça peut vraiment vous aider de mélanger les sources !
    Mathieu Chartier Articles récents..Negative SEO, le retour de bâton du référencementMy Profile

  10. Hello à tous et merci pour vos commentaires.

    Mathieu, sache que j’adore ton article. Je le trouve vraiment complet.
    Avant tout, nous sommes bien d’accord qu’il a malgré tout une différence entre le contenu dupliqué et le plagiat ? Le plagiat consiste à « s’inspirer fortement » d’un existant alors que le contenu dupliqué est vraiment identique. Ou alors c’est moi qui ai tout faux ?

    Pour le contenu dupliqué, je comprends bien, un copier-coller d’une source diverse et voilà !

    Mais, concernant le plagiat, j’ai une petite question, mais je ne sais pas si tu vas savoir me répondre :
    À partir de quel moment parle-t-on de plagiat ?
    – J’ai lu un sujet d’un livre et je me mets à écrire un article, prenant les idées principales, mais les adaptant à mon style : est du plagiat ?
    - Je viens de lire un article sur le web, les idées me plaisent, je suis tout à fait d’accord avec les idées, je veux écrire la même chose en gardant la structure et le sommaire, mais avec mes mots, est du plagiat ?
    - Je paraphrase les mêmes idées d’un autre auteur, est du plagiat ?.

    Enfin, je ne sais pas où se trouve la limite, car comme tu dis, nous n’inventerons pas la roue. Certes, on peut avoir des idées, des approches différentes, mais on dit quand même la même chose.

  11. Merci pour cet article extrêmement complet. Pour ma part j’utilise Copyscape qui me convient très bien. Je ne connaissais pas certains des autres outils, je vais jeter un œil voir s’ils peuvent apporter quelque chose de plus.

  12. Article très intéressant!

    Y a-t-il des pressions ou actions possibles envers les sites dont l’hébergement et l’adresse du propriétaire est situé dans un pays étranger (et pas très regardant sur la législation concernant la propriété intellectuelle)?

  13. @LeReferenceur, ton article était déjà très bien, je voulais juste insisté sur 2-3 autres points, dont la licence Creative Commons qui n’est pas si rose qu’elle n’y paraît…

    @Alexandra, il n’y a pas de réelle différence entre plagiat et contenu dupliqué. Le plagiat est synonyme de contrefaçon, il s’agit donc d’une notion légale, alors que les contenus dupliqués sont une idée de Google. On va dire que le plagiat est forcément du vol de contenu, donc légalement répréhensible, alors que les contenus dupliqués sont sanctionnés par Google mais peuvent intervenir après des erreurs personnelles, ce n’est donc pas nécessairement causé par de la contrefaçon justement.

    Pour ce qui est de la paraphrase, il semblerait que la jurisprudence n’interdise pas la modification des contenus, mais si ma mémoire est bonne, il faut que les différences soient visibles (on change pas seulement un “le” par un “un” par exemple… ^^).

    @Lionel, étonnamment, Copyscape m’a donné moins de résultats que Plagiarism Checker (http://www.plagiarismchecker.com/url/) que je trouve plus efficace, je te le conseille.

    @Adam, j’aime beaucoup la remarque sur la “lucidité retrouvée”. :D Mathieu Chartier Articles récents..Negative SEO, le retour de bâton du référencementMy Profile

  14. Wikipedia est un plagieur hors-pair. Et pourtant toujours en première position sur n’importe quel mot clés dans Google….

  15. Mazette, voilà enfin un vrai article de fond qui n’apparaît pas pompé une seconde sur la bible d’Andrieu mais qui lui rend hommage tout de même. A savoir que cette analyse ultra-claire associe une approche à la fois, SEO, informatique, littéraire et surtout juridique du concept de plagiat sur le net, et en ce sens elle prouve que l’art du référencement s’est immiscé dans tous les compartiments du marketing d’entreprise.

    Mais revenons concrètement sur le plancher des vaches et des gorets: les solutions de défense pas forcément coûteuses contre le duplicate agressif sont bien le constat d’huissier suivi de la mise en demeure. Et pour bétonner le tout (on croirait une recette de cuisine industrielle), mieux vaut déposer et enregistrer toutes ses oeuvres régulièrement à la Société des Gens de Lettres, tout en rappelant les risques encourus dans les mentions légales de son site.

    Mais pour conclure, chapeau Mathieu pour l’aspect “Jeu de Rôles de grands Mythos-mégalos” pour le conseil labellisé façon “LaPoste-Fbi” auquel je n’avais vraiment pas pensé:
    “envoyer à sa propre adresse une copie des contenus sous forme de pli avec accusé de réception (sur CD-Rom pour les œuvres numériques si nécessaire) sans jamais ouvrir la lettre (le cachet faisant foi)”.

    Et enfin et encore, mention spéciale à Alexandra qui a fait accoucher un grand gentil savant du SEO de son infinie science mise intelligemment à la portée de tous.

  16. Merci pour l’article et les notions de propriétés et droit d’auteurs, ça fait toujours du bien d’avoir ce genre de petit rappel ;)

    Du coup, petite question, que faire en cas de duplication totale de site ? y a t-il des recours judiciaires ou autres ?

    Au plaisir de vous lire !

  17. @Monica, je suis littéralement tombée sur le charme de ton style d’écriture. J’ai regardé le staff de ton agence, il n’y a pas vraiment de Monica :) Alors, qui se cache derrière ce pseudo? En tout cas, j’attends un email de ta part pour poursuivre notre discussion. Je t’avais proposé un guest. Je veux échanger avec toi à ce sujet. Peux-tu m’écrie s’il te plait?

  18. La protection de son travail devient importante du moment ou il existe des voleurs mais elle devient capitale quand ces tricheurs sont susceptibles de nuire a notre activité. Il est intéressant certes toutes ces informations fournies dans l’article… Cependant toutes ces actions engagés dans la lutte contre le plagiat ne vont entraîner que des actions similaires mais dans l’autre sens c’est a dire pour le plagiaire “déjouer les plans instaurés pour stopper mon activité de vol”; j’en prendrait pour seule exemple que les accès sécurisés peuvent être piratés. Est ce que cela veut dire que que cette lutte est vaine? certainement pas! Je pense que GG doit réagir a ce problème (ça ne lui fait pas perdre de l’argent lui)

  19. @Monica, je suis un peu bouche bée après ton message… Chapeau pour la qualité de l’écriture et merci pour les doux compliments, je ne pense pas qu’on m’ait autant fait de louanges depuis bien longtemps (en gros, peut-être lorsque j’étais bébé et qu’on me disait à tort que j’étais le plus beau pour épater la galerie ! :D).

    Merci aussi pour tes précisions, notamment sur la société des Gens de Lettres ou autres organismes du même genre. Je reste persuadé qu’il devrait exister un organisme pour protéger les oeuvres numériques (contenus, images, etc.) pour compléter l’INPI et le reste, un système peut se créer pour protéger les oeuvres et prouver leur antériorité.

    N.B. : pour le coup de la lettre avec accusé de réception, j’ai appris cela après avoir sorti le premier CD de rock avec mon groupe (jadis…), un notaire nous avait dit que c’était le meilleur moyen de protéger les partitions, le livret du CD, les textes, etc. Au final, nous avons toujours notre grande enveloppe cachetée ! :D Mathieu Chartier Articles récents..Negative SEO, le retour de bâton du référencementMy Profile

  20. @Yohann, le cas de la duplication totale d’un site web est un exemple typique de contrefaçon, et cette dernière peut entraîner des sanctions pénales fortes. Au delà du problème de contenu dupliqué si cher à Google, c’est avant tout un vol de données à plusieurs niveaux (code source, création graphique, illustrations, textes, etc.), les risques encourus sont donc importants. Si ce genre de cas arrive, il faut tout de suite faire un constat d’huissier pour prouver l’antériorité du site plagié puis porter plainte contre le contrevenant. Rien n’empêche de lui écrire avant, mais quelqu’un qui va même jusqu’à voler la totalité d’un site ne me semble pas enclin à la négociation…

    P.S. : autre méthode, vous lui envoyez une facture pour qu’il paye pour le site et ses contenus, ça peut parfois fonctionner par l’intimidation…

    @Berou, je pense que le mieux reste de s’envoyer de temps en temps une lettre avec accusé de réception pour prévenir des risques de vols… En revanche, Google doit réagir différemment aux contenus dupliqués, mais je ne peux pas imaginer que ce problème passe inaperçu en haute sphère…

  21. J’ai pas peur du vol de contenu, car quand ont à des sites avec de très bon pagerank le zigoto qui vas coller ça sur son site auras du mal à rivalisé, se qui me gène le plus se sont les sites qui reprennent toutes les pages index de mes sites et qui prennent même les liens sortant au passage pour les mettre sur la page crée.
    J’aime pas trop que des liens que je met sur mes sites soit dupliquer ailleurs, non pas que je refuse des liens mais si le site venais à être mal vue de Google ça peut je pense devenir une source de problème.

    Je pense que le Creative Commons est une notion de partage et une manière de libérée une oeuvre, qu’elle soit musique écrit ou bien graphique elle devient ainsi immortel.

  22. Très bon article et très complet sur le sujet, merci notamment pour la liste d’outils.
    Personnellement je n’ai jamais eu de problème de plagiat pour mes sites web (du moins à ma connaissance), mais ces notions de propriété sont très bonnes à savoir et peuvent être utile.

    Article partagé :)

  23. Bonjour,

    Merci pour cet article très instructif sur le “duplicate content”.

    Il y a pas très long temps je me suis rendu compte que sur mes sites WordPress il y a des commentaires que s’affichent en double, il s’agit des commentaires sur des articles qui s’affichent aussi sur la page “blog” ou on peut voir les extraits des articles publiés. Pour le moment je n’ai pas trouvé de solution.

  24. Bonjour,

    Pour avoir été confronté à un vol de contenu, je peux vous dire que c’est extrêmement difficile d’apporter la preuve du délit.
    Dans notre cas, vol d’images de fiches produits (produit distribué par un fournisseur commun), de nombreuses opérations ont été nécessaires pour qu’enfin le fraudeur reconnaisse ses tord.
    Au passage, si Google ne gardait pas un historique “extrêmement” précis de ses données indexées, cela aurait été impossible à prouver.

  25. Malheureusement c’est un fait qu’il y a ceux qui travaillent dur pour offrir du bon contenu et ceux qui attendent pour se servir! Merci en tout cas pour ces précieux conseils qui vont permettre à de nombreux auteurs de protéger leurs œuvres. Pour ma part, je ne savais pas que l’on avait autant de recours pour faire valoir nos droits!
    Kelsi Articles récents..Un site performant pour renforcer votre communicationMy Profile

  26. J’avoue ne jamais avoir été confronté au vol de contenu jusqu’à présent mais plusieurs de mes clients en ont très peur et j’ai un peu du mal à les rassurer. Je vais essayer d’approfondir le sujet mais ça s’annonce pas évident parce que moi même je suis pas spécialement en confiance
    Qfla@Junior Entreprise Articles récents..Marketing et StratégieMy Profile

  27. Déjà que créer du contenu demande du temps et beaucoup d’inspiration, se le faire voler et se retrouver à être taxé par Google ne fait certainement pas plaisir! Merci en tout cas pour tous ces recours même s’ils demandent un peu de temps pour faire valoir nos droits!
    Daniella Articles récents..Bonjour tout le monde !My Profile

  28. Bonjour, je fais du dropshipping, je mets un temps fou à changer descriptifs, métas de tous mes articles, mon nom de domaine a plus de 10ans, pagerank de 4, ok je viens de commencer à mettre en ligne des articles de mon fournisseur mais quand même quelle déception de constater que google place en 1ères pages et 1ères positions des sites d’autres dropshippers dont les descriptifs sont tous identiques à la virgule près, ils ne doivent même pas changer les métas titre et description, enfin bref tout ça pour dire qu’il serait temps que google fasse le ménage, parce que voir mon site derrière ces vendeurs peu rigoureux ça me désole vraiment vu le travail minutieux que je prends pour chaque article, à croire que c’est mon site qui est pénalisé car il n’a pas le même descriptif que mon fournisseur!

  29. Le contenu est de ce qu’il y a de plus important. Il faut avoir l’idée, l’inspiration, la syntaxe,… tout ça pour dire que du temps est requis. Il en va donc de soi que le plagiat et duplicate content n’est pas beau à voir, surtout pour l’auteur !

  30. @aiglon Malheureusement Google a plutôt tendance à déclasser qu’à classer de nos jours, les sanctions sont nombreuses mais certains passent entre les mailles du filet, d’autres prennent de plein fouet les effets collatéraux, c’est vraiment difficile de tenir son rang malgré de bons contenus et une attention particulière visant à éviter le duplicate content…

  31. merci mathieu pour ta réponse, enfin moi ça me dégoûte de voir ça, je croyais que le nouvel algorithme de google et son fameux panda allait faire le ménage, tu parles, c’est complètement naze leur algorithme.

  32. Excellent article et fort bien documenté. Je te rejoints notamment sur le fait que souvent les auteurs sont les premiers responsables de la production de contenus dupliqués. (Les flux RSS, le partage sur les réseaux sociaux ou sur des sites tel que Scoop.it). Le plus difficile a gérer étant l’utilisation de wordpress qui duplique le résumé de l’article sur les pages de catégories et de tags.

    Concernant le plagiat, je suis surpris de ne rien lire dans ton article au sujet de la DMCA et le fait que Google désindexe des pages par simple mesure de précaution.
    Christophe @ Agence Web Luxe Articles récents..La ligne éditoriale d’un site ou d’un blogMy Profile

  33. Bonjour Alexandra et merci pour cette article vraiment complet sur le duplicate content, je connaissez déjà certains des outils en ligne que tu cites comme plagium, copyscape etc, pour ma part j’utilise également le moteur de WordPress pour mon annuaire et du fait d’être un annuaire je me dois de lutter contre le duplicate content, j’ai donc installé le plugin “Plagiarism” de SEORoma (je te laisse le lien http://www.freeplugin.org/plagiarism-wordpress-plugin.html ça peu servir sait-on jamais), mais rien ne vaut une vérification manuelle nous en conviendrons ;-)

  34. Le problème du copiage semble insoluble. Voici l’exemple d’un site dont j’ai retrouvé l’important texte de la home sur plusieurs sites voleurs. Un texte copié et reproduit plusieurs fois mot à mot car très travaillé, complet et donc de très bonne qualité. Je considérais jusqu’alors et selon ce que disent les théoriciens que Google prenait en compte l’antériorité et donc identifiait la source qu’il ne devait pas pénaliser… Mais est survenue la MAJ du pingouin sur les EMD qui a impacté le site et il a fallu changer le NDD et repartir de zéro… Et le site est certainement passé pour GG de source à plagieur !… Que faire contre ce fléau impuni ? Un nouveau texte, mais dire différemment la même chose ne peut-être qu’une restructuration contextuelle… Que sa valeur exposera de nouveau à la tentation des voleurs…
    Je suis preneur de tout commentaires…

  35. Merci pour cet article sur le duplicate content.
    Je vérifie très régulièrement que je n’ai pas de contenu dupliqué, car ceux ci ne sont absolument pas bien vu par sa majesté google 1er …
    Le 15 aout 2014 j’ai contrôlé avec positeo.com que je n’avais pas de contenu dupliqué et la j’ai eu une très désagréable surprise, de constater que certain concurrent se sont permis de copier des phrases entières de mon site web, ce site risque donc d’être sanctionné ou déclassé à cause de gens sans aucun scrupules, des médiocres suffisants sans aucune inspiration ni créativité pourquoi se faire ch.. alors que les autres ont déjà créé quelque chose il y a juste à se servir ….grrr furax

  36. Il faut aussi prendre en compte qu’un texte original d’un site A peut être publié sur un site B sans être considéré comme du duplicate par les lecteurs et moteurs de recherche. Voici l’exemple de la page :
    http://www.reseau-des-marabouts.com/les-confreries-maraboutiques.html
    qui indique la source pour les lecteurs :
    copyright : sénégalaisement.com
    http://www.senegalaisement.com
    et dont le code-source indique la source pour les robots des moteurs par l’insertion dans le HEAD du tag “meta name=”original-source” :

    Ce site qui reprend le texte intégral d’un autre site demeure donc propre pour les lecteurs, pour les moteurs et pour le site canonique qui est cité et bénéficie d’un backlink de qualité sur une page bien rankée.

  37. Article très complet sur le duplicate content, de nombreux outils très bien sont mis en avant.
    Il est très important de créer un contenu original de qualité pour pouvoir se positionner.
    Pour les boutiques reliées aux market place, il faut faire très attention à ne pas générer de duplicate content et ainsi se pénaliser.

    Il serait très interessant d’avoir un article sur les “Market Place”

  38. Le duplicate content est une vraie plaie… Je dois passer facilement une journée par mois pour traquer les contenus dupliqués de mon site. J’utilise depuis peu l’outil Kill Duplicate de Paul Sanchez, que je recommande fortement !
    Et pour les plagiaires qui font les morts ou qui me prennent de haut ou pour un idiot, je me permet de les lister sur mon site :-) : http://www.creanico.fr/prestations/freelances-plagiaires-et-plagiats/

  39. Merci pour cet article, me concernant j’ai quelques annuaires de référencement est je suis très strictes avec les régles à matière de contenu dupliqué, actuellement j’accepte un site avec un taux de duplication inférieur ou égale à 35 %. Mais rappelons aussi que le plagiat est sectionné par Google car de tout façon vous pouvez savoir l’ancienneté au plutôt l’âge du nom de domaine.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

CommentLuv badge

Les liens des commentaires peuvent être libérés des nofollow.