Como corrigir "Rastreado - Atualmente não indexado" no Google Search Console

Publicados: 2021-12-28

A documentação do Google define o status Rastreado – atualmente não indexado como:

A página foi rastreada pelo Google, mas não indexada. Pode ou não ser indexado no futuro; não há necessidade de reenviar este URL para rastreamento.
fonte: Google

A leitura desta explicação pode ser frustrante, especialmente se o status afetar uma página importante para sua empresa. A definição do Google não esclarece o que aconteceu e o que você pode fazer em seguida. Tudo o que diz é que o Googlebot rastreou sua página, mas, por algum motivo, decidiu não indexá-la.

De acordo com nossa pesquisa, o status Rastreado – atualmente não indexado é o problema mais comum relatado no relatório Cobertura do índice. Isso significa que você provavelmente já experimentou ou provavelmente experimentará no futuro.

É crucial corrigir o problema o mais rápido possível. Afinal, se sua página não estiver indexada, ela não aparecerá nos resultados de pesquisa e não receberá tráfego orgânico do Google.  

Este artigo apresenta as possíveis causas para o status Rastreado – atualmente não indexado e formas de corrigi-los .

Conteúdo ocultar
1 Onde você pode encontrar o status Rastreado – atualmente não indexado?
2 Relatando bug: sua página pode estar indexada
3 Causas e soluções para o status Rastreado – atualmente não indexado
3.1 Atraso de indexação
3.1.1 Solução
3.2 A página não atende aos padrões de qualidade
3.2.1 Solução
3.2.2 Conteúdo gerado pelo usuário
3.3 A página foi desindexada
3.3.1 Solução
3.4 Problema de arquitetura do site
3.4.1 Solução
3.5 Conteúdo duplicado
3.5.1 Solução
4 Rastreado – atualmente não indexado vs. Descoberto – atualmente não indexado
5 Conclusão

Onde você pode encontrar o status Rastreado – atualmente não indexado?

Você pode encontrar o status no relatório Cobertura do índice no Google Search Console.

Rastreado – atualmente não indexado pertence à categoria “Excluído”, o que indica que o Google não considera um erro que a página não esteja indexada.  

Essas páginas geralmente não são indexadas e achamos que isso é apropriado. Essas páginas são duplicadas de páginas indexadas ou bloqueadas de indexação por algum mecanismo em seu site, ou não indexadas por um motivo que acreditamos não ser um erro.
fonte: Google
Captura de tela do relatório de cobertura do índice

Depois de clicar no status Rastreado – atualmente não indexado, você verá uma lista de URLs afetados. Você deve examiná-lo e priorizar a correção do problema para as páginas mais valiosas para você.

O relatório também está disponível para exportação. No entanto, você pode exportar apenas até 1.000 URLs. Se mais páginas forem afetadas, você poderá aumentar o número de URLs exportados filtrando páginas específicas para sitemaps. Por exemplo, se você tiver dois sitemaps, cada um com 1.000 URLs, poderá exportá-los separadamente.

Relatando bug: sua página pode estar indexada

Após perceber o status Rastreado – atualmente não indexado, a primeira coisa que você deve fazer é investigar se sua página realmente não está indexada.

Não é incomum ver uma página marcada como Rastreada – atualmente não indexada no relatório Cobertura do índice, enquanto a ferramenta de inspeção de URL indica que a página está realmente indexada.

A ferramenta de inspeção de URL permite verificar detalhes sobre um URL específico, incluindo:

  • Problemas de indexação,
  • Erros de dados estruturados,
  • Usabilidade móvel,
  • Visualize recursos carregados (por exemplo, JavaScript).

Você também pode solicitar a indexação de uma URL ou ver uma versão renderizada de uma página.

John Muller, do Google, abordou o problema com as diferenças entre o relatório Index Coverage e a ferramenta de inspeção de URL durante o SEO Office Hours do Google:

Recentemente, vi alguns tópicos como este no Twitter em que as pessoas viram URLs sinalizados como não indexados no Search Console. E então, quando você os verifica individualmente, eles são realmente indexados. Ainda não sei exatamente o que está acontecendo lá. […] Minha suspeita é que é mais uma questão de tempo – nós os mostramos no relatório do Search Console, e então eles são indexados ao longo do tempo. Então, em algum momento, eles desistiriam do relatório novamente. E por qualquer motivo, desistir está demorando um pouco mais do que deveria.
fonte: John Mueller

Como John disse, pode ser simplesmente um problema de atraso e sincronização de dados entre essas duas ferramentas, e o status pode ser atualizado no relatório Cobertura do Índice ao longo do tempo.

No entanto, nem sempre é apenas um atraso. Às vezes é um bug de relatório.

Em setembro, notamos que alguns de nossos artigos indexados estavam relatando Rastreado – atualmente não indexado.

Isso definitivamente não foi um problema de atraso, pois artigos antigos também foram afetados.  

Pouco depois, outros SEOs, incluindo Lily Ray, começaram a perceber exatamente esse problema.

O que fazer nessa situação? Em qual relatório confiar?

Geralmente, a ferramenta de inspeção de URL mostra dados mais atualizados do que o relatório de cobertura do índice. É por isso que você deve sempre confiar mais na ferramenta de inspeção de URL quando for forçado a escolher entre esses relatórios.

Causas e soluções para o status Rastreado – atualmente não indexado

Agora, vamos ao fundo do problema – o que faz com que o status apareça e o que você pode fazer para corrigi-lo.

O Google não fornece uma resposta clara por que sua página foi rastreada, mas não indexada, mas há alguns motivos possíveis para o status aparecer, incluindo:

  • Atraso de indexação,
  • A página não atende aos padrões de qualidade,
  • A página foi desindexada,
  • Problema de arquitetura do site,
  • Problemas de conteúdo duplicado.

Atraso de indexação

Não é incomum que o Google visite uma página, mas leva um tempo para indexá-la. A Internet é infinitamente grande e o Google precisa priorizar quais páginas são indexadas primeiro.

No meu Ultimate Guide to Indexing SEO, mostrei quanto tempo leva para as páginas de sites populares serem indexadas. Aqui estão alguns dos resultados da minha investigação:

  • O Google indexa apenas 56% dos URLs indexáveis ​​após 1 dia da publicação.
  • Após 2 semanas, apenas 87% dos URLs são indexados.

fonte: Tomek Rudzki

Se você acabou de publicar sua página, pode ser perfeitamente normal que ela ainda não esteja indexada e você precise esperar um pouco mais para que o Google indexe seu conteúdo.

Solução

Você não pode influenciar o rastreamento e a indexação de sua página a curto prazo, mas há algumas coisas que você pode fazer para ajudar seu site a longo prazo:

  • Crie uma estratégia de indexação para ajudar o Google a priorizar as páginas certas em seu site. Para isso, você precisa decidir quais páginas devem ser indexadas e o melhor método para comunicá-las ao Google.
  • Certifique-se de que há links internos para as páginas de seu interesse. Isso ajudará o Google a encontrar as páginas e saber mais sobre seu contexto.
  • Crie um sitemap bem otimizado. É um arquivo de texto simples que lista seus URLs valiosos. O Google o usará como um roteiro para encontrar as páginas mais rapidamente.

A página não atende aos padrões de qualidade

O Google não pode indexar todas as páginas da Internet. Seu espaço de armazenamento é limitado e é por isso que precisa filtrar o conteúdo de baixa qualidade.

O objetivo do Google é fornecer páginas da mais alta qualidade que melhor respondam à intenção dos usuários. Isso significa que, se uma página for de qualidade inferior, o Google provavelmente a ignorará para deixar o espaço de armazenamento disponível para conteúdo de qualidade superior. E podemos esperar que os padrões de qualidade fiquem ainda mais rigorosos no futuro.

Solução

Como proprietário de um site, você deve garantir que sua página forneça conteúdo de alta qualidade. Verifique se é provável que satisfaça a intenção de seus usuários e adicione conteúdo de boa qualidade, se necessário. O Google oferece uma lista de perguntas para ajudar você a determinar o valor do seu conteúdo. Aqui estão alguns deles:

  • O conteúdo fornece informações, relatórios, pesquisas ou análises originais?
  • O conteúdo fornece uma análise perspicaz ou informações interessantes que estão além do óbvio?
  • Este é o tipo de página que você gostaria de marcar, compartilhar com um amigo ou recomendar?
  • Se o conteúdo se baseia em outras fontes, ele evita simplesmente copiar ou reescrever essas fontes e, em vez disso, fornece valor e originalidade adicionais substanciais?

fonte: Google

Além disso, você pode usar dicas sobre conteúdo de qualidade das Diretrizes dos avaliadores de qualidade do Google. Embora o documento seja destinado principalmente aos avaliadores de qualidade de pesquisa para avaliar a qualidade de um site, os webmasters podem usá-lo para obter algumas informações sobre como melhorar seus próprios sites. Se você quiser saber mais, confira nosso guia sobre Diretrizes para avaliadores de qualidade.

Conteúdo gerado por usuários

O conteúdo gerado pelo usuário pode ser um problema do ponto de vista da qualidade.

Por exemplo, vamos supor que você tenha um fórum e alguém faça uma pergunta. Embora possa haver muitas respostas valiosas no futuro, no momento do rastreamento, não havia nenhuma, então o Google pode classificar a página como conteúdo de baixa qualidade.

O que fazer para se proteger dessa situação?

O Quora apresentou uma excelente estratégia para o problema. Cada pergunta não respondida tem o prefixo “/unanswered/” na URL.

Aqui está um exemplo: https://www.quora.com/unanswered/Are-you-really-happy-with-your-results  

O arquivo robots.txt bloqueia todas as páginas com /unanswered/ em seus URLs. Isso significa que o Googlebot não pode rastreá-los.

Assim que houver uma resposta à pergunta, o URL será alterado e ficará disponível para rastreamento. Dessa forma, o Quora bloqueia o acesso ao conteúdo de baixa qualidade gerado pelos usuários.

A página foi desindexada

Um URL pode sofrer com o status Rastreado – atualmente não indexado porque foi indexado no passado, mas o Google decidiu desindexá-lo ao longo do tempo.

Se você se pergunta por que algumas coisas podem desaparecer do índice, é provável que elas sejam substituídas por conteúdo de qualidade superior.

Além disso, você deve prestar atenção às atualizações de algoritmos. É possível que um novo algoritmo tenha sido implementado e sua página tenha sido afetada por ele.

Infelizmente, a desindexação também pode ser causada por um bug do lado do Google. Por exemplo, o Search Engine Land uma vez foi desindexado porque o Google assumiu erroneamente que o site foi invadido.

Solução

A solução para páginas desindexadas está intimamente relacionada à sua qualidade. Você deve sempre garantir que sua página ofereça conteúdo da melhor qualidade e esteja atualizada. Não assuma que uma vez que uma página é indexada, você não precisa fazer nada com ela novamente. Continue monitorando e implemente mudanças e melhorias, se necessário.

[…]as páginas que caem após uma atualização principal não têm nada de errado para corrigir. Dito isso, entendemos que aqueles que se saem menos bem após uma alteração de atualização principal ainda podem sentir que precisam fazer algo. Sugerimos que você se concentre em garantir que está oferecendo o melhor conteúdo possível. É isso que nossos algoritmos procuram recompensar.
fonte: Google

Depois de corrigir os problemas, você pode enviar esses URLs ao Google Search Console para ajudar o Google a perceber as alterações mais rapidamente.

Problema de arquitetura do site

Quando John Mueller foi questionado sobre as possíveis razões pelas quais uma página foi marcada com o status Rastreado – atualmente não indexado, ele mencionou outra causa possível – estrutura de site ruim.

Vamos imaginar uma situação em que você tem uma página de boa qualidade, mas a única maneira que o Google encontrou é porque você a colocou no seu mapa do site.

O Google pode olhar para a página e rastreá-la, mas como não há links internos, ele assumiria que a página tem menos valor do que outras páginas. Não há informações semânticas ou estruturais para ajudá-lo a avaliar a página. Essa pode ser uma das razões pelas quais o Google decidiu se concentrar em outras páginas e deixar esta fora do índice depois de rastreá-la.

Solução

Uma boa arquitetura de site é fundamental para ajudá-lo a maximizar as chances de ser indexado. Ele permite que os bots dos mecanismos de pesquisa descubram seu conteúdo e entendam melhor a relação entre as páginas.

É por isso que é crucial fornecer uma boa arquitetura de site e garantir que haja links internos para a página que você deseja indexar.

Se você quiser saber mais sobre a estrutura do site, confira nosso artigo sobre Como construir um site que classifica e converte.  

Conteúdo duplicado

Adam Gent, um freelancer de SEO, compartilhou um caso interessante com a comunidade de SEO. Sua página estava relatando Rastreado – atualmente não indexado porque o Google pensou que era uma página duplicada.

O Google quer apresentar conteúdo exclusivo e valioso aos usuários. É por isso que, quando percebe durante o rastreamento que algumas páginas são idênticas ou quase idênticas, pode indexar apenas uma delas.

Normalmente, o outro é rotulado como “Duplicado” no relatório de Cobertura do Índice. No entanto, nem sempre é o caso e, às vezes, o Google atribui o status Rastreado – atualmente não indexado.

Não está totalmente claro por que o Google pode escolher Rastreado – atualmente não indexado em um status dedicado para conteúdo duplicado. Uma das explicações possíveis é que o status mudará depois que o Google decidir se há um mais adequado para a página.

Outra opção pode ser um relatório de bug . O Google pode simplesmente cometer um erro ao atribuir os status. Infelizmente, a situação é mais desafiadora porque Rastreado – atualmente não indexado não fornece tantas informações quanto um status dedicado para conteúdo duplicado.

Como verificar se uma página duplicada está sendo exibida nos resultados da pesquisa?

  1. Vá para a página que não está indexada e copie um fragmento de texto aleatório.
  2. Cole o texto na Pesquisa Google entre aspas.
  3. Analise os resultados. Se aparecer um URL diferente com o texto copiado, isso pode significar que sua página não está indexada porque o Google escolheu um URL diferente para indexar.

Solução

Em primeiro lugar, você deve garantir a criação de páginas originais. Se necessário – adicione conteúdo exclusivo.

Infelizmente, conteúdo duplicado pode ser inevitável (por exemplo, você tem uma versão para celular e desktop). Você não tem muito controle sobre o que aparece nos resultados de pesquisa, mas pode dar algumas dicas ao Google sobre a versão original.

Se você notar muito conteúdo duplicado indexado, avalie os seguintes elementos:

  • Tags canônicas – essas tags HTML informam aos mecanismos de pesquisa quais versões são as originais.
  • Links internos – certifique-se de que os links internos estejam apontando para o seu conteúdo original. O Google pode usá-lo como um indicador de qual página é mais importante.
  • XML Sitemaps – certifique-se de que apenas a versão canônica esteja no seu sitemap.

Lembre-se de que essas são apenas dicas e o Google não é obrigado a segui-las. No caso descrito por Adam Gent, o Google escolheu a versão do feed RSS para indexar, embora muitos sinais de canonização apontassem para um URL original diferente. Adam resolveu o problema configurando um 404 para garantir que apenas a versão original permanecesse. Ele também sugeriu que configurar um cabeçalho HTTP X-robots em todos os URLs de feed impediria que eles fossem indexados.

Rastreado – atualmente não indexado vs. Descoberto – atualmente não indexado

O status Rastreado – atualmente não indexado é comumente confundido com outro problema de indexação no relatório Cobertura do índice: Descoberto – atualmente não indexado.

Ambos os status indicam que a página não está indexada. No entanto, no caso de Rastreado – atualmente não indexado, o Google já visitou a página. Enquanto isso, em Descoberto – atualmente não indexado, o URL é conhecido pelo Google, mas, por algum motivo, ainda não foi rastreado.

Rastreado – atualmente não indexado Descoberto – atualmente não indexado
Página descoberta pelo Google sim sim
Página visitada pelo Google sim Não
Página indexada Não Não

Alguns dos motivos para esses status podem ser semelhantes, incluindo páginas de baixa qualidade e problemas de links internos. No entanto, quando você vê um status Descoberto – atualmente não indexado, você precisa investigar adicionalmente por que o Google não pôde ou não quis acessar a página. Por exemplo, pode indicar problemas com a qualidade geral de todo o site, problemas de orçamento de rastreamento ou sobrecarga do servidor.

Empacotando

Rastreado – atualmente não indexado está associado principalmente à qualidade da página, mas, na realidade, pode indicar muitos outros problemas, como arquitetura do site ou conteúdo duplicado.

Aqui estão as principais conclusões do artigo que podem ajudá-lo a lidar com o status Rastreado – atualmente não indexado:

  • Adicione conteúdo exclusivo e valioso às suas páginas. Depois de fazer isso, envie esses URLs para o Google Search Console. Dessa forma, o Google pode perceber as alterações mais rapidamente.
  • Revise a arquitetura do seu site e verifique se há links internos para suas páginas valiosas.
  • Decida quais páginas devem e não devem ser indexadas para ajudar o Google a priorizar os URLs mais valiosos.