如何使用Screaming Frog审计规范化的URLs

规范化是确保一个URL的所有版本返回相同内容的过程。这对SEO很重要,因为它有助于防止重复内容问题。这篇博文将告诉你如何使用尖叫蛙来审计规范化的URL。 尖叫的青蛙 是诊断你的网站规范化问题的一个优秀工具。让我们开始吧!

尖叫的青蛙
艾萨克-亚当斯-汉斯 - 如何使用Screaming Frog审计规范化的URLs

什么是Canonical标签?

冠词标签是一个HTML元素,帮助网站管理员防止他们网站上的重复内容问题。该 标签用于指定一个页面的 "规范 "或 "首选 "版本。 并放置在代码的部分。

搜索引擎抓取 在一个网站上,他们经常会发现同一个页面的多个版本(例如,如果同一个内容可以通过多个URL访问)。这可能会给网站管理员和用户带来问题,使其难以识别内容的原始来源。

如: 这些都是由 搜索引擎 作为不同的URL

https://seonorth .ca
https://seonorth .ca
https://www.seonorth .ca

冠词标签告诉搜索引擎他们应该索引哪个版本的页面,使其更容易找到和评估内容的质量。

如: 使用这个代码,你可以指定哪个URL是首选版本。

<link rel="canonical" href="https://seonorth.ca/"/>

此外,使用规范标签可以帮助提高网站的搜索引擎排名,因为它有助于避免重复内容的惩罚。因此,对于任何希望确保其网站被搜索引擎正确索引的网站管理员来说,规范标签是一个重要工具。

如何审计你的Canonical标签

要开始,请下载SEO蜘蛛,在轻度模式下免费,最多可抓取500个URL。 https://www.screamingfrog.co.uk/seo-spider/

存储和爬行 准则设置

这个选项是默认启用的,所以除非你改变了配置,否则它将被设置。

要管理这些设置,请进入 配置 (在顶部Nav)。 蜘蛛, 网页链接 节,以及 ǞǞǞ 设置(如图所示)。

准则设置

抓取网站

现在你需要抓取网站,从你的网站上收集规范的数据。

要开始抓取,请在""中输入你的URL。请输入蜘蛛网的URL' 框,然后点击'开始.’

抓取网站

抓取完成后,您可以在结果框中看到所有抓取的页面。

选择 "经典 "标签

主窗口窗格中的每一行都显示在抓取过程中发现的URL及其相应的rel="canonical "链接元素和HTTP Canonicals,它们分别列在不同的栏目中。

观点

冠词标签有六个过滤器,可以帮助你理解和检测典型的冠词问题。

你可以通过在右侧的概述窗格中选择以下内容来缩小搜索范围。

  • 含有Canonical - 该页面上有一个规范的URL标签。这可能是一个自我引用的规范性URL,其中页面URL与规范性URL相同,或者它可能是 "规范化 "的,规范性URL与页面URL不同。
  • 自我调整 - 页面的 URL 有一个规范 URL,它与 爬虫的 当前位置(因此,它是自引用的)。只有规范版本的 URL 才应链接,而且每个 URL 都应具有自引用规范,以避免任何潜在的重复内容问题。
  • 编码化 - 该页面有一个与最初链接的不同的规范性URL。该地址被 "canonicalized "到另一个位置。这意味着搜索引擎被指示不要对该页面进行索引,索引和链接属性应合并到目标规范的URL。这些地址应该被仔细查看。
  • 失踪 - 没有链接元素或HTTP头来指定一个规范的URL。如果一个页面不包括一个规范的URL。 谷歌 将选择他们认为是最好的版本或URL。这可能导致排名的不可预测性;因此,所有的URL应该始终包括一个规范的版本。
  • 多个 - 一个页面可能有许多规范。这可能会导致问题,因为一个页面的单一实现(链接元素或HTTP头)应该只分配一个规范的URL。
  • 非可索引的卡农 - 规范的URL是一个 不可索引 页面。这将包括被 robots.txt、无响应、重定向 (3XX) 禁用的 canonicals、 客户端错误 (4XX)服务器错误 (5XX) 或 "无索引"。URL的规范版本应始终是可索引的,并有 "200 "响应页面。

审核Canonical标签

在优化网页以提高搜索引擎的可见度时,很少有东西能像规范标签那样关键。搜索引擎可能会在没有规范标签的情况下索引同一页面的多个版本,这可以 损害你的排名并导致重复的 内容惩罚。这就是为什么定期审计你的规范标签是如此重要;它确保搜索引擎在你的网站上索引每个页面的正确版本。幸运的是,审计规范标签是相对简单的。定期审计你的规范标签可以帮助确保你的页面被优化,以便在搜索引擎中获得最大的可见度。 搜索引擎结果.

查看不可索引的规范性URL

底部的 "URL信息 "标签显示了为什么一个规范的URL是不可索引的。这个典型的URL是不可索引的,因为它的重定向,如下面的例子所示。

父辈的典范
使你能够看到Canonical页面

报道

正规报告

要创建批量规范的报告,这些报告包括有关的导出数据。

  • 编码链 - 规范链是一系列的重定向,从一个URL引向另一个。当搜索引擎抓取一个网站时,它遵循规范链,以达到最终的URL。
  • 非可索引的典籍 - 不可索引的代码是你的网站上你不希望谷歌索引的页面。你可能想这样做有几个原因:你不希望它显示在 搜索结果,或者该页面是你网站上另一个页面的重复,而你只希望原始页面被索引。不可索引的规范确保谷歌只索引你希望他们索引的页面,这可以帮助提高你的搜索引擎排名。典范,像重定向一样,可以是连锁的,包括循环的。

这些导出的数据往往更容易消化,并在导出时通过工作来修复(或发送给开发人员来修复)。

总结

佳能化对SEO至关重要,应该在你的 网站,以避免重复的内容 问题。幸运的是。 尖叫的青蛙 已经帮助你诊断了canonicalization问题并迅速修复。这个工具将提高你的网站的SEO和在搜索引擎中的排名。如果我在下面的反馈表中忘记了什么,请告诉我。

常见问题

  • 什么是Canonicalized URL?

发表于:2022-07-14
更新日期: 2024-04-05

艾萨克-亚当斯-手的头像

艾萨克-亚当斯-汉斯

Isaac Adams-Hands是SEO North公司的SEO总监,该公司提供搜索引擎优化服务。作为一名搜索引擎优化专家,Isaac在网页搜索引擎优化、非网页搜索引擎优化和技术性搜索引擎优化方面拥有相当丰富的专业知识,这使他在竞争中占据了优势。
zh_CNChinese