Como auditar URLs canonicalizadas usando o Screaming Frog

A canonicalização é o processo de garantir que todas as versões de uma URL retornem o mesmo conteúdo. Isto é importante para SEO porque ajuda a evitar problemas de duplicação de conteúdo. Este post no blog mostrará como usar o sapo gritante para auditar URLs canonicalizadas. Sapo gritante é uma excelente ferramenta para o diagnóstico de problemas de canonicalização em seu site. Vamos começar!

sapo gritante
Isaac Adams-HandsComo auditar URLs canonicalizadas usando o Screaming Frog

O que são etiquetas canônicas?

Uma tag canônica é um elemento HTML que ajuda os webmasters a evitar problemas de conteúdo duplicado em seus sites. O é um elemento HTML que ajuda os webmasters a evitar a duplicação de conteúdo em seus sites. é usada para especificar a versão "canônica" ou "preferida" de uma página e é colocado dentro da seção do código.

Quando motores de busca rastejam um site, eles freqüentemente encontram várias versões da mesma página (por exemplo, se o mesmo conteúdo for acessível através de várias URLs). Isto pode criar problemas para webmasters e usuários, tornando desafiador identificar a fonte original do conteúdo.

por exemplo Tudo isso é visto pelo motor de busca como URLs diferentes

http://seonorth .ca
https://seonorth .ca
https://www.seonorth .ca

A etiqueta canônica diz aos motores de busca qual versão da página eles devem indexar, tornando mais fácil encontrar e avaliar a qualidade do conteúdo.

por exemplo Usando este código, você pode especificar qual URL é a versão preferida.

<link rel="canonical" href="https://seonorth.ca/" />

Além disso, o uso de tags canônicas pode ajudar a melhorar a classificação de um site nos mecanismos de busca, pois ajuda a evitar a duplicação de penalidades pelo conteúdo. Como resultado, as tags canônicas são uma ferramenta essencial para qualquer webmaster que procure garantir que seu site esteja sendo devidamente indexado pelos mecanismos de busca.

Como auditar suas etiquetas canônicas

Para começar, baixe o SEO Spider, gratuito no modo light, para rastrear até 500 URLs. https://www.screamingfrog.co.uk/seo-spider/

Loja & Crawl Configurações canônicas

Esta opção é ativada por padrão, portanto será configurada, a menos que você tenha alterado a configuração.

Para gerenciar essas configurações, vá para Configuração (na parte superior da Marinha), Aranha, Links de página seção, e Canonical (mostrado na imagem).

Configurações canônicas

Rastejar o site

Agora você precisa rastejar o site para reunir os dados canônicos de seu site.

Para começar a rastejar, digite sua URL na janela 'Digite a URL para a aranhacaixa e golpeInício.’

rastejar o site

Quando o rastejamento tiver sido concluído, você poderá ver todas as páginas rastejadas na caixa de resultados.

Selecione a guia Canonicals

Cada linha na janela principal exibe URLs descobertas durante um rastreamento e seus correspondentes elementos de ligação rel="canônico" e HTTP Canonicals em colunas separadas.

Vista Canônica

A aba canônica tem seis filtros que podem ajudá-lo a compreender e detectar problemas canônicos típicos.

Você pode restringir sua busca selecionando o seguinte no painel de visão geral à direita:

  • Contém Canonical - A página tem uma etiqueta de URL canônica na página. Esta pode ser uma URL canônica de auto-referência onde a URL da página é idêntica à URL canônica, ou pode ser 'canonicalizada', sendo a URL canônica distinta da URL da página.
  • Auto-Referenciamento – The URL of the page has a canonical, which is the same URL as the crawler’s current location (hence, it’s self-referencing). Only canonical versions of URLs should be linked, and every URL should have a self-referencing canonical to avoid any potential duplicate content problems.
  • Canonicalizado - A página tem uma URL canônica diferente da que estava inicialmente vinculada. O endereço é "canonicalizado" para outro local. Isto implica que os mecanismos de busca são instruídos a não indexar a página e que as propriedades de indexação e link devem ser consolidadas com a URL canônica de destino. Estes endereços devem ser cuidadosamente examinados.
  • Falta - Não há nenhum elemento de link ou cabeçalho HTTP que especifique uma URL canônica. Se uma página não incluir uma URL canônica, Google escolherão o que acreditam ser a melhor versão ou URL. Isso pode levar à imprevisibilidade da classificação; portanto, todos os URLs devem sempre incluir uma versão canônica.
  • Múltiplos - Pode haver inúmeros canônicos para uma página. Isto pode causar problemas porque apenas uma URL canônica deve ser atribuída por uma única implementação (elemento de link ou cabeçalho HTTP) para uma página.
  • Canonical não-indexável - A URL canônica é um não-indexável página. Isso incluirá canônicos que foram desativados por robots.txt, sem resposta, redirecionamento (3XX), erro do cliente (4XX)erro do servidor (5XX) ou são "noindex". As versões canônicas de URLs devem ser sempre indexáveis, com páginas de resposta '200'.

Auditoria de etiquetas canônicas

Poucas coisas são tão cruciais quanto as tags canônicas ao otimizar as páginas para a visibilidade dos mecanismos de busca. Os mecanismos de busca podem indexar várias versões da mesma página sem tags canônicas, que podem prejudicar sua classificação e levar a uma duplicação penalidades de conteúdo. É por isso que a auditoria regular de suas tags canônicas é tão importante; ela garante que os mecanismos de busca estejam indexando a versão correta de cada página em seu site. Felizmente, a auditoria das tags canônicas é relativamente simples. A auditoria regular de suas tags canônicas pode ajudar a garantir que suas páginas sejam otimizadas para a máxima visibilidade em resultados do mecanismo de busca.

Visualização de URLs canônicas não-indexáveis

A guia 'URL Info' na parte inferior mostra porque um canônico não é indexável. Esta URL canônica não é indexável devido a seu redirecionamento, como visto no exemplo abaixo.

Pai canônico
Permite que você veja a página canônica

Relatórios Canônicos

Relatórios canônicos

Para criar relatórios canônicos em massa, estes relatórios incluem dados de exportação sobre:

  • Cadeias Canônicas - A cadeia canônica é uma série de redirecionamentos que levam de um URL a outro. Quando um mecanismo de pesquisa rastreia um site, ele segue a cadeia canônica para chegar ao URL final.
  • Canonicals não-indexáveis - Os canônicos não indexáveis são páginas em seu site que você não quer que o Google indexe. Há algumas razões pelas quais você pode querer fazer isso: você não quer que ele apareça em resultados da buscaou a página é uma duplicata de outra página em seu site, e você só quer que a página original seja indexada. Os canônicos não indexáveis garantem que o Google indexe apenas as páginas que você deseja que sejam indexadas, o que pode ajudar a melhorar a classificação de seu mecanismo de busca. Os canônicos, como os redirecionadores, podem ser encadeados e incluir loops.

Essas exportações são muitas vezes muito mais fáceis de digerir e trabalhar para consertar quando exportadas (ou enviadas a um desenvolvedor para consertar).

Conclusão

A canonicalização é essencial para a SEO e deve ser implementada em seu website para evitar a duplicação de conteúdo questões. Felizmente, Sapo gritante ajudou você a diagnosticar problemas de canonização e corrigi-los rapidamente. Essa ferramenta melhorará o SEO e a classificação do seu site nos mecanismos de busca. Informe-me se esqueci de algo no formulário de feedback abaixo.

Perguntas frequentes

  • O que é uma URL canonicalizada?

Publicado em: 2022-07-14
Updated on: 2024-04-05

Avatar para Isaac Adams-Hands

Isaac Adams-Hands

Isaac Adams-Hands é o Diretor de SEO da SEO North, uma empresa que presta serviços de Search Engine Optimization. Como profissional de SEO, Isaac tem uma experiência considerável em SEO On-page, SEO Off-page e SEO Técnico, o que lhe dá uma vantagem contra a concorrência.
pt_BRPortuguese