Representación del manifiesto de SEO: por qué necesitamos ir más allá del SEO de JavaScript
Publicado: 2020-12-12¿Quiere asegurarse de que los motores de búsqueda accedan correctamente a su contenido y de que tenga un alto rango?
En su sesión SEJ eSummit, Bartosz Góralewicz presentó cómo Google está representando sitios web a gran escala y compartió información basada en las patentes y la documentación de Google.
He aquí un resumen de su presentación.
El problema con JavaScript
Góralewicz y su equipo descubrieron que el 40% del contenido que se basa en JavaScript no se indexa después de 14 días.
Se pone peor.
El diez por ciento de las URL dentro de un dominio promedio no están indexadas por Google y estamos hablando de URL indexables únicas.
Esto es algo a tener en cuenta, especialmente porque estas tendencias están cambiando con el tiempo y pueden empeorar.
En 2015, Google afirmó que son buenos renderizando diciendo:
"[A] siempre que no bloquee el robot de Google para que no rastree sus archivos JavaScript o CSS, por lo general, podemos representar y comprender sus páginas web como los navegadores modernos".
Desde 2017, Góralewicz y su equipo han creado muchos otros experimentos, incluidos experimentos de encubrimiento con JavaScript y otros, que revelaron problemas de rastreo e indexación encontrados por sitios web basados en JavaScript.
¿Qué marco de JavaScript es rastreable e indexable? @bart_goralewicz # SMS2017 pic.twitter.com/3beH9dCj14
- Aleyda Solis (@aleyda) 2 de mayo de 2017
Ese mismo año, Google comenzó a hablar abiertamente sobre JavaScript SEO.
Hoy en día, aunque tenemos a Martin Splitt de Google, que ha sido increíblemente útil para la comunidad de SEO, todavía quedan preguntas sin respuesta.
En noviembre de 2019, en la Cumbre de desarrolladores de Chrome, Splitt anunció que la mediana de renderizado en Google ha mejorado de hasta una semana un año antes a solo cinco segundos en 2019.
Sin embargo, la investigación adicional de Góralewicz y el equipo de Onely encontró que "el retraso medio en la representación puede ser prácticamente inexistente para los nuevos sitios web, el retraso en la indexación del contenido de JavaScript todavía está ahí".
Muchos sitios web basados en JavaScript no se indexan y no se clasifican incluso después de dos semanas.
También descubrieron que:
- Hay grandes marcas apenas en el índice de Google.
- Indexar HTML no es tan fácil como se supone.
- Las tendencias de indexación fluctúan durante las actualizaciones de Google.
- Puede ser expulsado del índice de Google.
Uno de los desafíos con el diagnóstico de caídas de indexación en este momento es que el comando del sitio no es confiable y puede devolver muchos falsos negativos.
Entrar en el índice de Google: un gran desafío de SEO
Incluir su contenido en el índice de Google es una base absoluta de su presencia en línea, y sigue siendo un gran desafío de SEO en la actualidad.
Y este problema se agrandará aún más con los recursos limitados de Google porque no pueden procesar e indexar toda la web mundial, especialmente con el costo que ahora conllevan muchos sitios web modernos.
Solo mire algunas de las marcas más importantes con importantes problemas de indexación.
Si Google no indexa sus páginas web, todas las demás actividades de SEO no importarán en absoluto.
Lo bueno es que tanto los SEO como los Googlers están iniciando la conversación sobre problemas de indexación y tenemos mejores fuentes de datos para validarlos.
Y la mayoría de los problemas de indexación se pueden resolver mediante SEO técnico.
Así es cómo.
Renderizado optimizado por lotes: cómo funciona
Google está mirando su sitio web desde una perspectiva de arquitectura de captura y renderización optimizada por lotes (BOR).
Al observar estas vistas en paralelo, lo que ve Google es diferente de lo que ven los usuarios en un navegador.
Entonces, ¿cómo funciona BOR?
Paso 1: BOR omite todos los recursos que no son esenciales para generar una vista previa de su página
El primer paso para la renderización optimizada por lotes y la arquitectura de recuperación es eliminar todos los recursos que Google no necesita para generar la vista previa o el diseño de su sitio web.
Esto incluye:
- Scripts de seguimiento (Google Analytics, Hotjar, etc.)
- Anuncios
- Imagenes
Simplemente eliminar estos recursos adicionales puede ahorrar hasta más del 50% del tiempo de carga, creación de scripts y renderizado. Esto ahorra muchos recursos por parte de Google.
Paso 2: establecer el valor de un reloj virtual
El segundo paso al que va Google es establecer el valor del reloj virtual (del que hablaremos un poco más a continuación).
Paso 3: se genera el diseño del sitio web
Una vez que el tiempo en ese reloj virtual "se agota", se genera el diseño del sitio web.
Hay dos conceptos clave para recordar:
- El reloj virtual.
- El diseño.
¿Qué es un reloj virtual?
Virtual Clock mide el costo de la representación de un sitio web.
Es una especie de presupuesto de renderizado del lado de Google y a los sitios web se les asigna un poco del "presupuesto".
Cuando el renderizado se detiene para buscar recursos (oe, scripts, archivos CSS, dimensiones de la imagen, etc.), ese reloj virtual no avanza. Solo avanza cuando realmente renderizamos.
Esto significa que si tiene una gran cantidad de CSS, JavaScript u otros recursos dentro de su sitio web, necesita más "tiempo virtual" en el reloj virtual.
Pero no hay garantía de cuánto tiempo de ese reloj virtual podrá obtener.
Si bien no sabemos cuál es el límite (y es posible que nunca lo sepamos), podemos averiguar qué tan hambriento de recursos está nuestro sitio web.
Con Chrome DevTools, puede ralentizar su CPU y ver cómo afecta la secuencia de comandos y la representación.
Tomemos el sitio web de H&M como ejemplo.
Aumentó el tiempo hasta 25 veces.
Podemos ver cómo H&M puede tener problemas con el renderizado y la indexación.
Cómo medir la 'carga del reloj virtual' de su sitio web
Góralewicz recomienda dos opciones para medir su "carga de reloj virtual".
- Use Onely's Too Long; Didn't Render (TL; DR) herramienta que calcula el costo de renderizar una página web de 0 a 100.
- Simule BOR en sus Chrome DevTools. (Aquí hay un recorrido detallado).
El diseño de su página
Cuando se agota el tiempo de los relojes virtuales, el diseño se genera independientemente de si está a la mitad de la renderización o no.
Esto conduce a muchos desafíos potenciales.
Lo más importante es que aquí es donde termina el SEO de JavaScript y comienza la renderización del SEO.

El renderizado se centra mucho en cómo se desarrolla el diseño con toda esta idea.
La ubicación del contenido es importante
Ya sabemos que el texto que aparece en la mitad superior de la página es más importante que el texto que aparece debajo de la línea.
Resulta que también afecta la forma en que Google rastreará ese contenido.
La patente de Google de 2011, Scheduling resource crawls, nos dice cómo el motor de búsqueda mira las diferentes secciones de los sitios web, así como los enlaces dentro de esas secciones, con una prioridad diferente.
Esto demuestra que Javascript SEO es solo la punta del iceberg. Solo se centra en si Google puede ver nuestro contenido.
El renderizado va más allá de eso.
Es un tema mucho más amplio porque, aparte de que Google solo ve el contenido, ahora estamos interesados en:
El diseño de la página.
- La importancia del contenido, según el tamaño del texto, la ubicación, etc.
- Extracción de enlaces internos y externos.
- Tasas de cambio de entrada.
- Otros factores que tienen que ver con cómo se representa un sitio web y cómo se ve después de eso, incluidas las imágenes .
Renderizado por lotes frente a imágenes
El servicio de renderizado de Google utiliza imágenes simuladas. Aquí hay un ejemplo de cómo se desarrolla eso.
¿Y los enlaces?
El valor de los enlaces depende de su ubicación y atributos.
Sabemos esto desde hace bastante tiempo, pero esto se vuelve más interesante cuando buscamos más patrones de Google.
La posición del enlace dentro de la página es importante.
Afecta la forma en que Google rastreará ese enlace y qué tipo de "calificación" asignará Google a ese enlace.
Además, a los enlaces ubicados en secciones importantes de su página se les puede asignar un valor más alto en comparación con los enlaces en secciones menos importantes.
Según los documentos de clasificación basados en el comportamiento del usuario y / o la patente de datos de funciones (el modelo Reasonable Surfer), hay muchas otras funciones asociadas con los enlaces, que incluyen:
- Texto circundante: palabras antes y / o después del enlace;
- Tipo de enlace (por ejemplo, imagen / texto)
- Qué tan comercial podría ser el texto de anclaje asociado con un enlace
- Número de enlaces en el documento fuente
- Tamaño de fuente
Además, Google no analiza las páginas a nivel de bloque. Un enlace, incluso si se coloca en una sección popular de una página, puede considerarse sin importancia, por ejemplo, cuando se trata de un enlace de "Condiciones de servicio", un anuncio publicitario o un enlace que no está relacionado con el documento.
Es importante tener en cuenta que Google, para aplicar completamente el modelo de surfista razonable, es necesario que la página esté completamente renderizada.
Según los documentos de clasificación basados en el comportamiento del usuario y / o la patente de datos de funciones (el modelo Reasonable Surfer), hay muchas otras funciones asociadas con los enlaces, que incluyen:
- Texto circundante: palabras antes y / o después del enlace.
- Tipo de enlace (por ejemplo, imagen / texto).
- Qué tan comercial puede ser el texto de anclaje asociado con un enlace.
- Número de enlaces en el documento fuente.
- Tamaño de fuente.
Además, Google no analiza las páginas a nivel de bloque.
Un enlace, incluso si se coloca en una sección popular de una página, puede considerarse sin importancia, por ejemplo, cuando se trata de un enlace de "Condiciones de servicio", un anuncio publicitario o un enlace que no está relacionado con el documento.
Es importante tener en cuenta que Google, para aplicar completamente el modelo de surfista razonable, es necesario que la página esté completamente renderizada.
Entonces, ¿qué secciones se indexan y cuáles no?
Lo que Góralewicz y su equipo descubrieron a través de nueve meses de investigación es que Google usa heurísticas muy similares para elegir qué partes de un sitio web deben renderizarse y cuáles pueden omitirse.
Para diagnosticar la indexación parcial, el equipo de Onely examinó sitios web populares para ver qué partes de un diseño determinado están indexadas y cuáles no.
Lo que descubrieron es que Google parece ignorar algunas partes de los sitios web con más entusiasmo que otras.
Por ejemplo, Google parece tener problemas para mostrar las secciones de "elementos relacionados" y "también puede estar interesado en".
Lo más probable es que Google indexe su contenido principal.
Pero ... existe una buena posibilidad de que si su sitio web tiene mucho de scripting y renderizado, se salte una parte de su página que no es tan crucial como el contenido principal después de que Google intente entender ese diseño.
Google ha mencionado que interrumpirán el script cuando sean pesados, pero no sabíamos qué significaba eso hasta ahora.
Indexación parcial: hallazgos clave
Puede pensar que la indexación parcial no es un problema tan significativo.
- Cuando indexan su contenido principal primero, podemos asumir que esta es una decisión inteligente de Google.
- Esto significa que a menudo ignorarán partes de su diseño.
- Lo que puede provocar problemas de indexación y rastreo en todo el sitio.
- Y volvemos al problema de que después de 14 días, alrededor del 40% del contenido de JavaScript no está indexado.
Pero esto conduce a un problema aún más importante: después de 14 días, el 10% de las URL no están indexadas.
Esto va mucho más allá del SEO de JavaScript porque el renderizado ocurre con y sin JavaScript.
JavaScript no es la razón principal para renderizar.
Sabiendo lo que sabemos ahora, ¿deberíamos seguir llamándolo JavaScript SEO?
Para llevar
Para concluir su presentación, Góralewicz compartió las siguientes conclusiones:
- El renderizado de SEO y la indexación serán una de las tendencias de SEO más populares. Pronto.
- Si no está indexado, todas las demás actividades de SEO que realice no importarán.
- La indexación es algo que puede ver y medir. Genera ingresos. Directamente.
- Por primera vez en la historia del SEO, tenemos un buen conocimiento de cómo funcionan el renderizado y la indexación, así que aprovechémoslo.
Mira esta presentación
Ahora puede ver la presentación completa de Góralewicz de SEJ eSummit el 2 de junio.
Más recursos:
- Conceptos básicos de JavaScript para profesionales de SEO
- Introducción al renderizado de SEO
- Cómo (y por qué) los motores de búsqueda procesan las páginas
Créditos de imagen
Imagen destacada: Paulo Bobita
Todas las capturas de pantalla tomadas por el autor, julio de 2020