Rendering SEO Manifesto: Por que precisamos ir além do JavaScript SEO

Publicados: 2020-12-12

Quer ter certeza de que seu conteúdo seja acessado adequadamente pelos mecanismos de pesquisa e tenha uma classificação elevada?

Em sua sessão SEJ eSummit, Bartosz Góralewicz apresentou como o Google está renderizando sites em grande escala e compartilhando insights com base nas patentes e documentação do Google.

Aqui está uma recapitulação de sua apresentação.

Código JavaScript

O problema com JavaScript

Góralewicz e sua equipe descobriram que 40% do conteúdo baseado em JavaScript não é indexado após 14 dias.

Propaganda
Continue lendo abaixo

Fica pior.

Dez por cento dos URLs em um domínio médio não são indexados pelo Google e estamos falando de URLs indexáveis ​​exclusivos.

É algo a se observar, especialmente porque essas tendências estão mudando com o tempo e podem piorar.

Em 2015, o Google afirmou que eles são bons em renderização, dizendo:

“[A] s contanto que você não esteja impedindo o Googlebot de rastrear seus arquivos JavaScript ou CSS, geralmente somos capazes de renderizar e entender suas páginas da web como navegadores modernos.”

Desde 2017, Góralewicz e sua equipe criaram muitos outros experimentos, incluindo experimentos de camuflagem com JavaScript e outros, que revelaram problemas de rastreamento e indexação encontrados por sites baseados em JavaScript.

Naquele mesmo ano, o Google começou a falar abertamente sobre JavaScript SEO.

Hoje, embora tenhamos Martin Splitt do Google, que tem sido extremamente útil para a comunidade de SEO, ainda há perguntas sem resposta.

Propaganda
Continue lendo abaixo

Em novembro de 2019, no Chrome Developer Summit, Splitt anunciou que a média para renderização no Google melhorou de até uma semana no ano anterior para apenas cinco segundos em 2019.

No entanto, Góralewicz e a pesquisa adicional da equipe da Onely descobriram que “o atraso médio de renderização pode ser virtualmente inexistente para novos sites, o atraso na indexação de conteúdo JavaScript ainda está muito presente”.

Muitos sites com tecnologia JavaScript não são indexados e não são classificados mesmo após duas semanas.

Eles também descobriram que:

  • Existem marcas enormes mal no índice do Google.
  • Indexar HTML não é tão fácil quanto se supõe.
  • As tendências de indexação variam durante as atualizações do Google.
  • Você pode ser expulso do índice do Google.

Um dos desafios do diagnóstico de quedas de indexação agora é que o comando do site não é confiável e pode retornar muitos falsos negativos.

Comando do site

Entrando no índice do Google: um grande desafio de SEO

Colocar seu conteúdo no índice do Google é a base absoluta de sua presença online - e continua sendo um grande desafio de SEO hoje.

E esse problema vai ficar ainda maior com os recursos limitados do Google, porque eles não podem renderizar e indexar toda a web mundial, especialmente com o custo que agora vem com muitos sites modernos.

Basta olhar para algumas das maiores marcas com problemas de indexação significativos.

Porcentagem de URLs não indexados

Se o Google não indexar suas páginas da web, todas as outras atividades de SEO não terão importância.

Propaganda
Continue lendo abaixo

Ainda bem que SEOs e Googlers estão iniciando a conversa sobre problemas de indexação e temos melhores fontes de dados para validar isso.

E a maioria dos problemas de indexação pode ser resolvida por meio de SEO técnico.

Veja como.

Renderização otimizada por lote: como funciona

O Google está olhando para o seu site de uma perspectiva de arquitetura de busca e renderização otimizada em lote (BOR).

Olhando para essas visualizações lado a lado, o que o Google está vendo é diferente do que os usuários veem em um navegador.

renderização otimizada em lote

Então, como funciona o BOR?

Propaganda
Continue lendo abaixo

Etapa 1: BOR ignora todos os recursos que não são essenciais para gerar uma visualização de sua página

A primeira etapa para renderização otimizada em lote e arquitetura de busca é remover todos os recursos de que o Google não precisa para gerar a visualização ou o layout de seu site.

Isso inclui:

  • Scripts de rastreamento (Google Analytics, Hotjar, etc.)
  • Publicidades
  • Imagens

Apenas remover esses recursos extras pode economizar até mais de 50% do tempo de carregamento, script e renderização. Isso economiza muitos recursos do lado do Google.

Etapa 2: definir o valor de um relógio virtual

Na segunda etapa que o Google vai, eles vão definir o valor do relógio virtual (sobre o qual falaremos um pouco mais a seguir).

Etapa 3: o layout do site é gerado

Quando o tempo naquele relógio virtual “acaba”, o layout do site é gerado.

Propaganda
Continue lendo abaixo

Existem dois conceitos principais a serem lembrados:

  • O relógio virtual.
  • O layout.

O que é um relógio virtual?

O Relógio Virtual mede o custo de renderização de um site.

É uma espécie de orçamento de renderização do lado do Google, e os sites recebem uma parte do "orçamento".

Quando a renderização para para buscar recursos (oe, scripts, arquivos CSS, dimensões de imagem, etc.), esse relógio virtual não está avançando. Ele só avança quando realmente renderizamos.

Isso significa que se você tiver muitos CSS, JavaScript ou outros recursos em seu site, precisará de mais “tempo virtual” no relógio virtual.

Mas não há garantia de quanto tempo do relógio virtual você será capaz de obter.

Embora não saibamos qual é o limite (e talvez nunca saibamos), podemos descobrir o quanto nosso site consome muitos recursos.

Propaganda
Continue lendo abaixo

Usando o Chrome DevTools, você pode desacelerar sua CPU e ver como isso afeta o script e a renderização.

Vamos tomar o site da H&M como exemplo.

Ele aumentou o tempo em até 25 vezes.

Podemos ver como a H&M pode ter dificuldades com renderização e indexação.

Chrom DevTools - CPU lenta

Como medir a 'carga do relógio virtual' do seu site

Góralewicz recomenda duas opções para medir sua “carga de relógio virtual”.

Propaganda
Continue lendo abaixo
  • Use Onely's Too Long; Ferramenta não renderizada (TL; DR) que calcula o custo de renderização de uma página da web de 0 a 100.
  • Simule o BOR em seu Chrome DevTools. (Aqui está um guia detalhado.)

O Layout da Sua Página

Quando o tempo dos relógios virtuais se esgota, o layout é gerado independentemente se está no meio da renderização ou não.

Isso leva a muitos desafios potenciais.

Mais importante, é aqui que termina o SEO do JavaScript e começa a renderização do SEO.

A renderização tem muito foco em como o layout funciona com toda essa ideia.

A localização do conteúdo é importante

Já sabemos que o texto que aparece acima da dobra é mais importante do que o texto abaixo da linha.

Acontece que isso também afeta a forma como o Google rastreará esse conteúdo.

A patente de 2011 do Google, Scheduling resource crawls, nos diz como o mecanismo de pesquisa examina diferentes seções dos sites, bem como os links dentro dessas seções, com uma prioridade diferente.

Isso mostra que Javascript SEO é apenas a ponta do iceberg. O foco é apenas se o Google pode ver nosso conteúdo.

Propaganda
Continue lendo abaixo

Renderizar está muito além disso.

Rendering SEO Manifesto: Por que precisamos ir além do JavaScript SEO

É um tópico muito mais amplo porque, além de o Google apenas ver o conteúdo, agora estamos interessados ​​em:

O layout da página.

  • A importância do conteúdo, com base no tamanho do texto, posicionamento, etc.
  • Extração de link interno e externo.
  • Taxas de alteração de entrada.
  • Outros fatores que têm a ver com a forma como um site é renderizado e como fica depois disso, incluindo imagens .

Renderização em lote x imagens

O serviço de renderização do Google está usando imagens fictícias. Aqui está um exemplo de como isso funciona.

exemplo de renderização em lote de imagem

E quanto aos links?

O valor dos links depende de sua localização e atributos.

Já sabemos disso há algum tempo, mas fica mais interessante quando olhamos para mais padrões do Google.

posição do link

A posição do link na página é importante.

Propaganda
Continue lendo abaixo

Isso afeta a forma como o Google rastreia esse link e que tipo de “classificação” o Google atribui a esse link.

Além disso, links colocados em seções importantes de sua página podem receber um valor mais alto em comparação com links em seções menos importantes.

De acordo com os documentos de classificação com base no comportamento do usuário e / ou patente de dados de recursos (o modelo do Reasonable Surfer), existem muitos outros recursos associados aos links, incluindo:

  • Texto envolvente: palavras antes e / ou depois do link;
  • Tipo de link (por exemplo, imagem / texto)
  • Quão comercial o texto âncora associado a um link pode ser
  • Número de links no documento de origem
  • Tamanho da fonte

Além disso, o Google não analisa as páginas em um nível de bloco. Um link, mesmo se colocado em uma seção popular de uma página, pode ser considerado sem importância - por exemplo, quando é um link de “Termos de Serviço”, um anúncio em banner ou um link não relacionado ao documento.

É importante notar que o Google, para aplicar totalmente o modelo de surfista razoável, é necessário que a página esteja totalmente renderizada.

Mais notícias principais - CNN

De acordo com os documentos de classificação com base no comportamento do usuário e / ou patente de dados de recursos (o modelo do Reasonable Surfer), existem muitos outros recursos associados aos links, incluindo:

Propaganda
Continue lendo abaixo
  • Texto envolvente: palavras antes e / ou depois do link.
  • Tipo de link (por exemplo, imagem / texto).
  • Quão comercial pode ser o texto âncora associado a um link.
  • Número de links no documento de origem.
  • Tamanho da fonte.

Além disso, o Google não analisa as páginas em um nível de bloco.

Um link, mesmo se colocado em uma seção popular de uma página, pode ser considerado sem importância - por exemplo, quando é um link de “Termos de Serviço”, um anúncio em banner ou um link não relacionado ao documento.

É importante notar que o Google, para aplicar totalmente o modelo de surfista razoável, é necessário que a página esteja totalmente renderizada.

Então, quais seções devem e não são indexadas?

O que Góralewicz e sua equipe descobriram em nove meses de pesquisa é que o Google usa heurísticas muito semelhantes para escolher quais partes de um site devem ser renderizadas e quais podem ser ignoradas.

Para diagnosticar a indexação parcial, a equipe do Onely olhou em sites populares para ver quais partes de um determinado layout estão indexadas e quais não.

Propaganda
Continue lendo abaixo

O que eles descobriram é que o Google parece ignorar algumas partes dos sites com mais ansiedade do que outras.

Por exemplo, o Google parece ter dificuldade em renderizar as seções “itens relacionados” e “você também pode estar interessado em”.

O Google provavelmente indexará seu conteúdo principal.

Mas ... há uma boa chance de que se seu site for pesado no lado de script e renderização, eles irão pular uma parte da sua página que não é tão crucial quanto o conteúdo principal depois que o Google tentar entender esse layout.

O Google mencionou que eles interromperão o script quando estiverem pesados, mas não sabíamos o que isso significava até agora.

Indexação parcial: principais conclusões

Você pode pensar que a indexação parcial não é um problema significativo.

  • Quando eles indexam seu conteúdo principal primeiro, podemos supor que essa é uma decisão inteligente do Google.
  • Isso significa que eles geralmente irão ignorar partes do seu layout.
  • O que pode levar a problemas de indexação e rastreamento em todo o site.
  • E voltamos ao problema de que, após 14 dias, cerca de 40% do conteúdo JavaScript não está indexado.

Mas isso leva a um problema ainda mais significativo - após 14 dias, 10% dos URLs não são indexados.

Propaganda
Continue lendo abaixo

Isso vai muito além do JavaScript SEO porque a renderização acontece com e sem JavaScript.

JavaScript não é o principal motivo para renderização.

Sabendo o que sabemos agora, ainda devemos chamá-lo de SEO JavaScript?

Aprendizado

Para encerrar sua apresentação, Góralewicz compartilhou as seguintes lições:

  • A renderização de SEO e a indexação serão uma das tendências mais importantes de SEO. Em breve.
  • Se você não estiver indexado, todas as outras atividades de SEO que estiver fazendo não importarão.
  • A indexação é algo que você pode ver e medir. Isso gera receita. Diretamente.
  • Pela primeira vez na história do SEO, temos um bom entendimento de como a renderização e a indexação funcionam, então vamos fazer bom uso disso.

Veja esta apresentação

Você já pode assistir à apresentação completa de Góralewicz no SEJ eSummit do dia 2 de junho.

Mais recursos:

Propaganda
Continue lendo abaixo
  • Noções básicas de JavaScript para profissionais de SEO
  • A introdução do SEO à renderização
  • Como (e por que) os mecanismos de pesquisa renderizam páginas

Créditos de imagem

Imagem em destaque: Paulo Bobita
Todas as capturas de tela feitas pelo autor, julho de 2020