LATEST NEWS
CONTACTS
Blog Référencement Google

Conférence d'Olivier Andrieu au SEO CAMP 2022

Depuis Panda, le contenu dupliqué sur Google fait peur à la France. Et les intervenants de la Search Quality Team de Google, présents au SEO Camp 2012, ironisent volontiers sur les référenceurs français.

Gérer Des Campagnes De Référencement Seo

Non seulement « Les Français sont obsédés par le duplicate content » mais « ils travaillent trop sur le netlinking ». Comment contredire Google?

Néanmoins, le fait que Google Panda* ait été déployé aux Etats-Unis 6 mois avant la France n'est sans doute pas innocent dans "l'effet de peur" en France évoqué par Olivier Andrieu.

Cette petite phrase de nos amis de chez Google était surtout l'occasion de rappeler les Google Guidelines, notre Bible à tous bien sûr (ou pas) :-).

Comment Etre Référencé En Premier Sur Google

Bref, revenons à nos moutons (ou nous moutons?). Tout d'abord Olivier Andrieu. Avez-vous vraiment besoin de le présenter? Si oui, je vous conseille de lire sa présentation : Olivier Andrieu. Cette conférence a donc débuté à 11 heures, avec @yohannseo assis à ma gauche, nous deux en mode live tweet. Mais traitons plutôt du sujet qui nous intéresse ici.

*Fumerie : voir @david_degrelle

Qu'est-ce que le contenu dupliqué (DC) ?
Les différentes formes de duplication de contenu Duplicate ContentIntrasite
Contenu dupliqué intersites
Contenu dupliqué de type DUST
Contenu dupliqué par similitude de TITLE et META DESCRIPTION
Contenu dupliqué sur les sites multilingues

Qu'est-ce que le contenu dupliqué (DC) ?

Pour rappel, le DC (pour les amis) correspond à une duplication de contenu sur les sites, qu'il s'agisse d'un texte complet ou partiel. S'il inquiète tant c'est que les moteurs de recherche ont la volonté de proposer des résultats les plus pertinents possible aux internautes, et ce en privilégiant les pages au contenu unique.

Cela pose également problème dans la mesure où une page dupliquée peut être plus fréquentée, et donc positionnée, que ce soit sur le site en question ou en externe.

Référencement Seo Meta Descrotion

Les différentes formes de contenu dupliqué

Duplication de contenu intrasite

Le contenu dupliqué intra-site concerne les contenus éditoriaux sur un même site. Les cas les plus courants sont les articles de presse qui peuvent par exemple appartenir à la rubrique « news » et « top news ». On a alors deux chemins de navigation avec deux URL différentes pour un même contenu.

Cela peut aussi arriver sur un site e-commerce, où il est parfois nécessaire de créer plusieurs points d'entrée pour un produit (déstockage, soldes, collection été, etc.).

Campagne De Seo Référencement Négatif

Il faut savoir que Google sait très bien faire la différence entre les éléments de navigation et le texte lui-même, c'est pourquoi on parle de "contenu éditorial" dupliqué, et non de "pages". Remarque : les PDF sont également soumis à DC.

Même si cela demande un certain travail, des efforts de réécriture doivent être faits. Il est également tout à fait possible d'ajouter du contenu dans l'une des deux URL. La solution de spinning "de qualité" existe aussi, bien que la position de Google à ce sujet soit connue. Utilisation de l'attribut rel=canonical. Cela permet à Google d'être informé de la source originale du contenu. Désindexation de la page via la méta "noindex". C'est certes une solution un peu barbare mais qui n'en est pas moins une.

Contenu dupliqué intersites

Il s'agit de contenus éditoriaux sur deux sites distincts. Le cas le plus courant est le vol de contenu. Veillez donc à populariser vos pages, car un contenu dupliqué ailleurs mais plus populaire (avec plus de liens externes) aura de très bonnes chances de se positionner devant la vôtre, même s'il a été publié auparavant.

Utilisation de l'attribut rel=canonical. Évidemment, comme le souligne le public, sa mise en place est moins aisée lorsqu'il s'agit d'un autre site. Ne pas proposer l'intégralité du contenu des articles dans le flux RSS, par exemple, réduit le risque qu'ils soient repris sur d'autres sites.

Contenu dupliqué de type DUST

DUST signifie "Contenu en double, même texte". Ceci est causé par la multiplication des URL, par exemple par l'ajout éventuel d'un "index.php" à la fin d'une URL ou la création de liens externes via des pages taguées pour les campagnes (utm_source=google, utm_medium=cpc, utm_term= course + chaussures, etc.).

Exemple De Référencement Seo

Le risque généré ici réside dans la dilution de popularité due à la perte de backlinks car même si au final le code source de ces pages est le même, Google n'est pas encore assez intelligent pour prendre en compte cet élément.

Référencement Seo Ingersheim

Voici une requête pour donner une idée du nombre de pages concernées par ce problème : https://www.google.fr/search?sourceid=chrome&ie=UTF-8&q=inurl%3Autm_source

Seo Referencement Gratuit

Configurez les paramètres d'URL dans Google Webmaster Tools. L'utilisation de redirections 301. L'utilisation de l'attribut rel=canonical.

Référencement Seo Sea Cours Pdf

Contenu dupliqué par similitude de TITLE et META DESCRIPTION

En effet, c'est aussi une forme de contenu dupliqué. Le tag d'une page étant le premier critère de pertinence, Google aura du mal à favoriser les pages de votre site dans son indexation si elles sont concernées par ce problème.

Solution :

Blog Référencement Naturel Seo

Optimisez ses en-têtes dans une logique de pertinence sémantique en pensant à sa valorisation dans les SERPs. Google Webmaster Tools permet de vérifier la similarité des balises méta d'un site.

Seo Black Hat

Contenu dupliqué sur les sites multilingues

Comment faire lorsqu'un site contient une version par pays et que plusieurs de ces pays parlent la même langue? L'exemple d'Olivier Andrieu est celui d'une extension de nom de domaine belge, suisse et français.

Solutions de contournement :

Indiquez le pays cible dans Google Webmaster Tools ( Configuration du site > Paramètres).

Outils pour vérifier le contenu dupliqué

Plusieurs méthodes et outils existent pour estimer le contenu dupliqué. Il faut tout de même garder à l'esprit que ces méthodes mathématiques reposent sur des hypothèses, même s'il est très probable que Google utilise des calculs qui s'en inspirent.

Référencement Google Seo Sea

Voici quelques-uns de ces outils :

Audit De Référencement Audit De Contenu Seo

Index Jaccard Algorithme Simhash Calcul de similarité par comparaison de mots Calcul de similarité par comparaison de chaînes Comparaison de code HTML et de texte

Inbound Marketing Seo

Conclusion et remerciements

Il existe d'autres cas de contenu dupliqué que ceux mentionnés ici. Vous trouverez également des liens complémentaires dans la présentation d'Olivier Andrieu (ci-dessous).

De plus, il est inutile de tomber dans la paranoïa du duplicate content. Continuez à offrir un contenu utile et pertinent et tout ira bien (ou commencera). Un site n'est pas pénalisé pour un contenu dupliqué. Les pages concernées sont simplement déclassées par l'algorithme dans les pages de résultats.