La canonisation est le processus qui consiste à s'assurer que toutes les versions d'une URL renvoient le même contenu. C'est important pour le référencement car cela permet d'éviter les problèmes de contenu dupliqué. Cet article de blog vous montrera comment utiliser screaming frog pour vérifier les URL canonisées. Grenouille hurlante est un excellent outil pour diagnostiquer les problèmes de canonicalisation sur votre site Web. C'est parti !
Table des matières
Que sont les balises canoniques ?
Une balise canonique est un élément HTML qui aide les webmasters à éviter les problèmes de contenu dupliqué sur leurs sites. Le site est utilisée pour spécifier la version "canonique" ou "préférée" d'une page. et est placé dans la section du code.
Quand moteurs de recherche crawl un site, ils trouvent souvent plusieurs versions de la même page (par exemple, si le même contenu est accessible via plusieurs URL). Cela peut poser des problèmes aux webmasters et aux utilisateurs, car il est difficile d'identifier la source originale du contenu.
Par exemple, Tous ces éléments sont vus par le moteur de recherche comme différentes URLs
https://seonorth .ca
https://seonorth .ca
https://www.seonorth .ca
La balise canonique indique aux moteurs de recherche quelle version de la page ils doivent indexer, ce qui facilite la recherche et l'évaluation de la qualité du contenu.
Par exemple, En utilisant ce code, vous pouvez spécifier quelle URL est la version préférée.
<link rel="canonical" href="https://seonorth.ca/" />
En outre, l'utilisation de balises canoniques peut contribuer à améliorer le classement d'un site dans les moteurs de recherche, car elle permet d'éviter les pénalités pour contenu dupliqué. Par conséquent, les balises canoniques sont un outil essentiel pour tout webmaster qui souhaite s'assurer que son site est correctement indexé par les moteurs de recherche.
Pour commencer, téléchargez le SEO Spider, gratuit en mode léger, pour explorer jusqu'à 500 URL. https://www.screamingfrog.co.uk/seo-spider/
Store & Crawl Paramètres canoniques
Cette option est activée par défaut, elle sera donc mise en place à moins que vous n'ayez modifié la configuration.
Pour gérer ces paramètres, allez à Configuration (dans le Nav supérieur), Araignée, Liens de page section, et Canonical (illustré dans l'image).
Parcourir le site web
Vous devez maintenant parcourir le site Web pour recueillir les données canoniques de votre site.
Pour commencer le crawl, entrez votre URL dans le champ ''.Entrez l'URL de l'araignéeet appuyez surDébut.’
Lorsque l'exploration est terminée, vous pouvez voir toutes les pages explorées dans la boîte de résultats.
Sélectionnez l'onglet Canonique
Chaque ligne de la fenêtre principale affiche les URL découvertes lors d'un crawl et les éléments de lien rel="canonical" et HTTP Canonicals correspondants dans des colonnes séparées.
L'onglet canonique comporte six filtres qui peuvent vous aider à comprendre et à détecter les problèmes canoniques typiques.
Vous pouvez affiner votre recherche en sélectionnant les éléments suivants dans le volet d'aperçu de droite :
- Contient Canonical - La page comporte une balise d'URL canonique. Il peut s'agir d'une URL canonique auto-référencée, dans laquelle l'URL de la page est identique à l'URL canonique, ou d'une URL "canonique", l'URL canonique étant distincte de l'URL de la page.
- Auto-référencement - L'URL de la page a une valeur canonique, qui est la même que l'URL de la page. de l'explorateur l'emplacement actuel (c'est pourquoi il s'agit d'une autoréférence). Seules les versions canoniques des URL doivent être liées, et chaque URL doit avoir une version canonique autoréférencée afin d'éviter tout problème potentiel de contenu dupliqué.
- Canonisé - La page a une URL canonique différente de celle à laquelle elle était initialement liée. L'adresse est "canonisée" vers un autre emplacement. Cela implique que les moteurs de recherche ont pour instruction de ne pas indexer la page et que les propriétés d'indexation et de liaison doivent être consolidées vers l'URL canonique cible. Ces adresses doivent être examinées avec attention.
- Manquant - Il n'y a pas d'élément de lien ou d'en-tête HTTP qui spécifie une URL canonique. Si une page n'inclut pas d'URL canonique, Google choisiront ce qu'ils croient être la meilleure version ou URL. Cela peut conduire à des classements imprévisibles ; par conséquent, toutes les URL devraient toujours inclure une version canonique.
- Multiple - Il peut y avoir plusieurs URL canoniques pour une page. Cela peut poser des problèmes car une seule URL canonique doit être attribuée par une seule implémentation (élément de lien ou en-tête HTTP) pour une page.
- Non indexable canonique - L'URL canonique est un non-indexable page. Cela inclut les éléments canoniques qui ont été désactivés par robots.txt, l'absence de réponse, les redirections (3XX), erreur du client (4XX)Les versions canoniques des URL doivent toujours être indexables, avec des pages de réponse de type "200". Les versions canoniques des URL doivent toujours être indexables, avec des pages de réponse de type "200".
Vérification des balises canoniques
Peu de choses sont aussi cruciales que les balises canoniques lors de l'optimisation des pages pour la visibilité dans les moteurs de recherche. Les moteurs de recherche peuvent indexer plusieurs versions d'une même page sans balises canoniques, ce qui peut nuisent à votre classement et conduisent à la duplication pénalités de contenu. C'est pourquoi il est si important de vérifier régulièrement vos balises canoniques ; cela permet de s'assurer que les moteurs de recherche indexent la version correcte de chaque page de votre site. Heureusement, l'audit des balises canoniques est relativement simple. En vérifiant régulièrement vos balises canoniques, vous vous assurez que vos pages sont optimisées pour une visibilité maximale dans les moteurs de recherche. résultats du moteur de recherche.
Visualisation des URLs canoniques non indexables
L'onglet "Infos sur l'URL" en bas de la page montre pourquoi une URL canonique est non indexable. Cette URL canonique est non-indexable en raison de sa redirection, comme le montre l'exemple ci-dessous.
Rapports canoniques
Pour créer des rapports canoniques en vrac, ces rapports comprennent des données d'exportation sur :
- Chaînes canoniques - La chaîne canonique est une série de redirections qui mènent d'une URL à une autre. Lorsqu'un moteur de recherche parcourt un site web, il suit la chaîne canonique pour atteindre l'URL finale.
- Canoniques non indexables - Les fichiers canoniques non indexables sont des pages de votre site Web que vous ne souhaitez pas que Google indexe. Il y a plusieurs raisons pour lesquelles vous pouvez faire cela : vous ne voulez pas qu'elles apparaissent dans les résultats de Google. résultats de rechercheou la page est une copie d'une autre page de votre site, et vous souhaitez que seule la page originale soit indexée. Les liens canoniques non indexables garantissent que Google n'indexe que les pages que vous voulez qu'il indexe, ce qui peut contribuer à améliorer votre classement dans les moteurs de recherche. Les liens canoniques, comme les redirections, peuvent être enchaînés et inclure des boucles.
Ces exportations sont souvent beaucoup plus faciles à digérer et à travailler pour les corriger lorsqu'elles sont exportées (ou envoyées à un développeur pour les corriger).
Conclusion
La canonisation est essentielle au référencement et doit être mise en œuvre sur votre site Web. site web pour éviter le contenu dupliqué problèmes. Heureusement, Grenouille hurlante vous a aidé à diagnostiquer les problèmes de canonicalisation et à les résoudre rapidement. Cet outil améliorera le référencement de votre site web et son classement dans les moteurs de recherche. N'hésitez pas à me faire savoir si j'ai oublié quelque chose dans le formulaire de commentaires ci-dessous.
FAQ
Qu'est-ce qu'une URL canonisée ?
Publié le : 2022-07-14
Mise à jour le : 2024-04-05