Lorsque vous exécutez un site axé sur les données ou que vous avez d'autres raisons de dupliquer un document, il est important d'indiquer aux moteurs de recherche quelle copie est la copie principale ou, dans le jargon, la copie «canonique». Lorsqu'un moteur de recherche indexe vos pages, il peut savoir quand le contenu a été dupliqué. Sans informations supplémentaires, le moteur de recherche décidera quelle page répond le mieux aux besoins de ses clients. Cela peut convenir, mais de nombreux moteurs de recherche fournissent des pages anciennes et obsolètes, car ils ont choisi le mauvais document comme étant canonique.
Comment spécifier la page canonique
Il est très facile d'indiquer aux moteurs de recherche l'URL canonique avec les métadonnées dans vos documents. Placez le code HTML suivant vers le haut de votre
TÊTE élément sur chaque page qui est ne pas canonique:
Si vous avez accès aux en-têtes HTTP (tels que .htaccess ou PHP), vous pouvez également définir l’URL canonique sur les fichiers ne contenant pas de code HTML.
TÊTE, comme un PDF. Pour ce faire, définissez les en-têtes des pages non canoniques comme ceci:
Lien: < URL de la page canonique >; rel = "canonique"
Comment fonctionne le tag Canonical et quand il ne fonctionne pas
Les métadonnées canoniques sont utilisées comme un indice pour que les moteurs de recherche déterminent quelle page est le maître. Les moteurs de recherche l'utilisent pour mettre à jour leur index afin de référencer la copie principale en tant que copie principale. Lorsqu'ils fournissent des résultats de recherche, ils affichent la page qu'ils jugent canonique.
Mais la page canonique que vous spécifiez peut ne pas être la page fournie par les moteurs de recherche. Cela peut se produire pour plusieurs raisons:
- Si l'URL que vous spécifiez est 404 introuvable, les moteurs de recherche tenteront de trouver la deuxième URL la plus pertinente à diffuser.
- Si le moteur de recherche pense que votre site a été piraté pour ajouter une fausse URL canonique, il ne l’utilisera pas (bien sûr, vous aurez de plus gros problèmes dans ce cas)
- Si vous placez le lien dans la balise ou s'il y a une raison de croire que le
TÊTE La balise n’a pas été fermée. En effet, de nombreux sites Web permettent aux utilisateurs de modifier le contenu de la page
CORPS élément), et comme une référence canonique trouvée il serait indigne de confiance.
Qu'est-ce que l'étiquette rel = canonique n'est pas
Beaucoup de gens croient que si vous ajoutez le
rel = canonique lien vers une page, cette page sera redirigée vers la version canonique, par exemple avec une redirection HTTP 301. Ce n'est pas vrai. le
rel = canonique link fournit des informations aux moteurs de recherche, mais n'affecte en rien l'affichage de la page et ne fait aucune redirection au niveau du serveur.
Le lien canonique n’est finalement qu’un indice. Les moteurs de recherche n'ont pas à l'honorer. La plupart des moteurs de recherche s'efforcent de respecter les souhaits des propriétaires de page, mais en fin de compte, les résultats de la recherche sont comme ils le font, et s'ils ne veulent pas servir votre page canonique, ils ne le feront pas.
Quand utiliser le lien canonique
Comme je l'ai dit plus haut, vous devez utiliser le lien sur chaque page dupliquée qui n'est pas canonique. Si vous avez des pages qui sont similaires, mais pas identiques, il est parfois plus logique de changer l’une d’elles en une version plus différente, plutôt que de la rendre canonique. Il est correct de marquer deux pages qui ne sont pas absolument identiques comme canoniques. Ils devraient être similaires, mais vous devriez jamais il suffit de pointer toutes les pages sur votre page d'accueil. Canonical signifie que la page est la copie originale de ce document, et non une sorte de lien principal sur votre site.
Je pense qu’il est important de répéter ce dernier point - vous ne devriez jamais pointer toutes vos pages sur votre page d'accueil en tant que page canonique peu importe à quel point vous êtes tenté de le faire. Faire cela, même par accident, peut causer toutes les pages qui ne sont pas canoniques (c’est-à-dire toutes les pages qui ne sont pas votre page d’accueil et qui ont
rel = canonique lien dessus) à supprimer des index des moteurs de recherche. Ce n'est pas Google (ou Bing ou Yahoo! ou tout autre moteur de recherche) qui est malveillant. Ils font ce que vous leur avez demandé de faire - en considérant chaque page comme une copie de votre page d’accueil et en renvoyant tous les résultats à cette page. Puis, comme les clients sont frustrés de se retrouver sur votre page d'accueil au lieu d'un document plus pertinent, cette page sera moins populaire et les résultats de recherche disparaîtront. Même si vous corrigez le problème, vous pouvez supprimer les résultats de votre recherche plusieurs mois plus tard et rien ne garantit que le classement de votre site sera rétabli.
Vous ne devez pas créer une page canonique exclue de la recherche pour une raison quelconque (comme avec le
noindex balise méta ou exclu par le fichier robots.txt). Pour qu'un moteur de recherche puisse référencer une page comme canonique, il doit pouvoir le faire en premier lieu.
Bons endroits pour utiliser le
rel = canonique le lien comprend:
- Sites avec des URL dynamiques - Vous pouvez l’utiliser pour définir le format d’URL que vous préférez.
- Sites de commerce électronique, en particulier sur les listes de produits - Lorsque vos clients modifient les critères de tri, cette nouvelle URL n’a pas besoin d’être indexée.
- Contenu syndiqué - les éditeurs utilisant le contenu que vous avez écrit doivent inclure le
rel = canonique lien sur leurs pages pointant vers votre document original
Quand ne pas utiliser le lien canonique
Votre premier choix devrait être une redirection 301. Cela indique non seulement au moteur de recherche que l'URL de la page a été modifiée, mais permet également aux utilisateurs d'accéder à la version la plus récente de la page (et j'ose dire, canonicol?).
Ne soyez pas paresseux.Si vous modifiez votre structure d'URL, utilisez une forme de manipulation d'en-tête HTTP (telle que .htaccess ou PHP ou un autre script) pour ajouter automatiquement les redirections 301. Bien que vous puissiez utiliser le
rel = canonique lien, qui ne prend pas les anciennes pages vers le bas. Et pour que tout le monde puisse y accéder à tout moment. En fait, si un client a une page avec un signet et que vous modifiez l’URL mais que vous ne mettez à jour que les moteurs de recherche en utilisant un
rel = canonique lien, ce client sera jamais voir la nouvelle page.
le
rel = canonique Le lien est un outil utile pour les sites contenant beaucoup de doublons. En comprenant comment cela fonctionne, vous pouvez l'utiliser efficacement. Mais finalement, c’est un outil qui a été publié par les moteurs de recherche pour aider leur garder leurs index de recherche à jour. Si vous ne maintenez pas vos serveurs propres et à jour, vos clients seront touchés et votre site pourrait être endommagé. Utilisez-le de manière responsable.