Rendering SEO Manifesto: perché dobbiamo andare oltre la SEO JavaScript

Pubblicato: 2020-12-12

Vuoi assicurarti che i tuoi contenuti vengano acceduti correttamente dai motori di ricerca e si posizionino in alto?

Nella sua sessione SEJ eSummit, Bartosz Góralewicz ha presentato come Google esegue il rendering dei siti Web su larga scala e ha condiviso informazioni basate sui brevetti e sulla documentazione di Google.

Ecco un riepilogo della sua presentazione.

Codice JavaScript

Il problema con JavaScript

Góralewicz e il suo team hanno scoperto che il 40% dei contenuti basati su JavaScript non viene indicizzato dopo 14 giorni.

Annuncio pubblicitario
Continua a leggere di seguito

La situazione peggiora.

Il dieci percento degli URL all'interno di un dominio medio non sono indicizzati da Google e stiamo parlando di URL indicizzabili univoci.

Questo è qualcosa da guardare, soprattutto perché queste tendenze cambiano nel tempo e possono peggiorare.

Nel 2015, Google ha affermato di essere bravo con il rendering dicendo:

"[A] fintanto che non impedisci a Googlebot di eseguire la scansione dei tuoi file JavaScript o CSS, in genere siamo in grado di visualizzare e comprendere le tue pagine web come i browser moderni."

Dal 2017, Góralewicz e il suo team hanno creato molti altri esperimenti, inclusi esperimenti di cloaking con JavaScript e altri, che hanno rivelato problemi di scansione e indicizzazione riscontrati dai siti Web basati su JavaScript.

Nello stesso anno, Google ha iniziato a parlare apertamente di JavaScript SEO.

Oggi, anche se abbiamo Martin Splitt di Google, che è stato incredibilmente utile per la comunità SEO, ci sono ancora domande senza risposta.

Annuncio pubblicitario
Continua a leggere di seguito

Nel novembre 2019 al Chrome Developer Summit, Splitt ha annunciato che la mediana per il rendering su Google è migliorata da un massimo di una settimana all'anno prima a soli cinque secondi nel 2019.

Tuttavia, la ricerca aggiuntiva di Góralewicz e del team di Onely ha rilevato che "il ritardo di rendering mediano potrebbe essere praticamente inesistente per i nuovi siti Web, il ritardo nell'indicizzazione del contenuto JavaScript è ancora presente".

Molti siti Web basati su JavaScript non vengono indicizzati e non si classificano nemmeno dopo due settimane.

Hanno anche scoperto che:

  • Ci sono marchi enormi a malapena nell'indice di Google.
  • L'indicizzazione dell'HTML non è facile come si presume.
  • Le tendenze di indicizzazione fluttuano durante gli aggiornamenti di Google.
  • Puoi essere espulso dall'indice di Google.

Una delle sfide con la diagnosi dei cali di indicizzazione in questo momento è che il comando del sito non è affidabile e può restituire molti falsi negativi.

Comando sito

Entrare nell'indice di Google: una grande sfida SEO

Portare i tuoi contenuti nell'indice di Google è un fondamento assoluto della tua presenza online e oggi rimane una grande sfida SEO.

E questo problema diventerà ancora più grande con le risorse limitate di Google perché non possono eseguire il rendering e l'indicizzazione dell'intero Web in tutto il mondo, soprattutto con il costo che ora viene fornito con molti siti Web moderni.

Basta guardare alcuni dei più grandi marchi con problemi di indicizzazione significativi.

Percentuale di URL non indicizzati

Se Google non indicizzerà le tue pagine web, tutte le altre attività SEO non avranno alcuna importanza.

Annuncio pubblicitario
Continua a leggere di seguito

Meno male che sia i SEO che i googler stanno iniziando la conversazione sui problemi di indicizzazione e abbiamo migliori fonti di dati per convalidarli.

E la maggior parte dei problemi di indicizzazione può effettivamente essere risolta attraverso la SEO tecnica.

Ecco come.

Rendering ottimizzato in batch: come funziona

Google guarda il tuo sito web da una prospettiva ottimizzata per il rendering e l'architettura di recupero in batch (BOR).

Guardando queste visualizzazioni affiancate, ciò che Google sta vedendo è diverso da ciò che gli utenti vedono in un browser.

rendering ottimizzato per batch

Allora come funziona BOR?

Annuncio pubblicitario
Continua a leggere di seguito

Passaggio 1: BOR salta tutte le risorse che non sono essenziali per generare un'anteprima della tua pagina

Il primo passaggio per il rendering ottimizzato in batch e l'architettura di recupero è rimuovere tutte le risorse di cui Google non ha bisogno per generare l'anteprima o il layout del tuo sito web.

Ciò comprende:

  • Script di monitoraggio (Google Analytics, Hotjar, ecc.)
  • Annunci
  • immagini

La semplice rimozione di queste risorse extra può far risparmiare fino a oltre il 50% del tempo di caricamento, script e rendering. Ciò consente di risparmiare un bel po 'di risorse da parte di Google.

Passaggio 2: impostare il valore di un orologio virtuale

Il secondo passo in cui Google sta per impostare il valore dell'orologio virtuale (di cui parleremo un po 'di più di seguito).

Passaggio 3: viene generato il layout del sito Web

Una volta che il tempo su quell'orologio virtuale "si esaurisce", viene generato il layout del sito web.

Annuncio pubblicitario
Continua a leggere di seguito

Ci sono due concetti chiave da ricordare:

  • L'orologio virtuale.
  • Lo schema.

Cos'è un orologio virtuale?

L'orologio virtuale misura il costo del rendering di un sito web.

È una sorta di budget per il rendering da parte di Google e ai siti web viene assegnata una piccola parte del "budget".

Quando il rendering si interrompe per recuperare le risorse (oe, script, file CSS, dimensioni dell'immagine, ecc.), L'orologio virtuale non avanza. Avanza solo quando effettivamente eseguiamo il rendering.

Ciò significa che se hai molti CSS, JavaScript o altre risorse nel tuo sito web, hai bisogno di più "tempo virtuale" sull'orologio virtuale.

Ma non c'è alcuna garanzia di quanto tempo dell'orologio virtuale sarai in grado di ottenere.

Anche se non sappiamo quale sia il limite (e potremmo non saperlo mai), possiamo capire quanto sia affamato di risorse il nostro sito web.

Annuncio pubblicitario
Continua a leggere di seguito

Utilizzando Chrome DevTools, puoi rallentare la CPU e vedere come influisce sullo script e sul rendering.

Prendiamo come esempio il sito web di H&M.

Ha aumentato il tempo fino a 25 volte.

Possiamo vedere come H&M possa avere difficoltà con il rendering e l'indicizzazione.

Chrom DevTools - CPU lenta

Come misurare il "carico dell'orologio virtuale" del tuo sito web

Góralewicz consiglia due opzioni per misurare il tuo "carico di clock virtuale".

Annuncio pubblicitario
Continua a leggere di seguito
  • Usa Onely's Too Long; Strumento non reso (TL; DR) che calcola il costo del rendering di una pagina web da 0 a 100.
  • Simula BOR nel tuo Chrome DevTools. (Ecco una guida dettagliata.)

Il layout della tua pagina

Quando il tempo dell'orologio virtuale si esaurisce, il layout viene generato indipendentemente dal fatto che sia a metà del rendering o meno.

Questo porta a molte potenziali sfide.

Ancora più importante, è qui che finisce JavaScript SEO e inizia il rendering SEO.

Il rendering si concentra molto su come il layout interagisce con l'intera idea.

La posizione dei contenuti è importante

Sappiamo già che il testo che appare above the fold è più importante del testo sotto la linea.

Si scopre che influisce anche sul modo in cui Google eseguirà la scansione di quel contenuto.

Il brevetto di Google del 2011, Scheduling resource crawls, ci dice come il motore di ricerca guarda alle diverse sezioni dei siti web, così come i link all'interno di quelle sezioni, con una priorità diversa.

Questo dimostra che Javascript SEO è solo la punta dell'iceberg. Si concentra solo sul fatto che Google possa vedere i nostri contenuti.

Annuncio pubblicitario
Continua a leggere di seguito

Il rendering va ben oltre.

Rendering SEO Manifesto: perché dobbiamo andare oltre la SEO JavaScript

È un argomento molto più ampio perché oltre a Google che vede solo il contenuto, ora siamo interessati a:

Il layout della pagina.

  • L'importanza del contenuto, in base alla dimensione del testo, al posizionamento, ecc.
  • Estrazione di link interni ed esterni.
  • Tassi di cambio ingresso.
  • Altri fattori che hanno a che fare con il modo in cui viene visualizzato un sito Web e come appare dopo, comprese le immagini .

Rendering in batch e immagini

Il servizio di rendering di Google utilizza immagini fittizie. Ecco un esempio di come funziona.

esempio di rendering batch di immagini

E i link?

Il valore dei collegamenti dipende dalla loro posizione e dagli attributi.

Lo sappiamo da un po 'di tempo, ma questo diventa più interessante quando esaminiamo più modelli di Google.

posizione del collegamento

La posizione del collegamento all'interno della pagina è importante.

Annuncio pubblicitario
Continua a leggere di seguito

Influisce sul modo in cui Google eseguirà la scansione di quel collegamento e sul tipo di "valutazione" che Google assegnerà a quel collegamento.

Inoltre, ai link inseriti nelle sezioni importanti della tua pagina potrebbe essere assegnato un valore più alto rispetto ai link nelle sezioni meno importanti.

Secondo i documenti di Ranking basati sul comportamento dell'utente e / o sul brevetto sui dati delle funzionalità (il modello Reasonable Surfer), ci sono molte altre funzionalità associate ai collegamenti, tra cui:

  • Testo circostante: parole prima e / o dopo il collegamento;
  • Tipo di collegamento (ad es. Immagine / testo)
  • Quanto potrebbe essere commerciale il testo di ancoraggio associato a un collegamento
  • Numero di collegamenti nel documento di origine
  • Dimensione del font

Inoltre, Google non analizza le pagine a livello di blocco. Un collegamento, anche se inserito in una sezione popolare di una pagina, può essere considerato non importante, ad esempio quando si tratta di un collegamento "Termini di servizio", di un banner pubblicitario o di un collegamento non correlato al documento.

È importante notare che Google, per applicare completamente il modello ragionevole del surfista, è necessario che la pagina sia completamente renderizzata.

Altre storie principali - CNN

Secondo i documenti di Ranking basati sul comportamento dell'utente e / o sul brevetto sui dati delle funzionalità (il modello Reasonable Surfer), ci sono molte altre funzionalità associate ai collegamenti, tra cui:

Annuncio pubblicitario
Continua a leggere di seguito
  • Testo circostante: parole prima e / o dopo il collegamento.
  • Tipo di collegamento (ad es. Immagine / testo).
  • Quanto potrebbe essere commerciale il testo di ancoraggio associato a un collegamento.
  • Numero di collegamenti nel documento di origine.
  • Dimensione del font.

Inoltre, Google non analizza le pagine a livello di blocco.

Un collegamento, anche se inserito in una sezione popolare di una pagina, può essere considerato non importante, ad esempio quando si tratta di un collegamento "Termini di servizio", di un banner pubblicitario o di un collegamento non correlato al documento.

È importante notare che Google, per applicare completamente il modello ragionevole del surfista, è necessario che la pagina sia completamente renderizzata.

Quindi quali sezioni vengono indicizzate e non vengono indicizzate?

Quello che Góralewicz e il suo team hanno scoperto durante nove mesi di ricerca è che Google utilizza euristiche molto simili per scegliere quali parti di un sito web devono essere renderizzate e quali di queste possono essere ignorate.

Per diagnosticare l'indicizzazione parziale, il team di Onely ha esaminato siti Web popolari per vedere quali parti di un determinato layout sono indicizzate e quali no.

Annuncio pubblicitario
Continua a leggere di seguito

Quello che hanno scoperto è che Google sembra ignorare alcune parti dei siti Web più avidamente di altre.

Ad esempio, Google sembra avere difficoltà a visualizzare le sezioni "elementi correlati" e "potresti essere interessato anche a".

Molto probabilmente Google indicizzerà i tuoi contenuti principali.

Ma ... ci sono buone probabilità che se il tuo sito web è pesante dal punto di vista dello scripting e del rendering, salterà una parte della tua pagina che non è così cruciale come il contenuto principale dopo che Google avrà cercato di capire quel layout.

Google ha affermato che interromperanno lo script quando sono pesanti, ma non sapevamo cosa significasse fino ad ora.

Indicizzazione parziale: risultati chiave

Potresti pensare che l'indicizzazione parziale non sia un problema così significativo.

  • Quando indicizzano per primi i tuoi contenuti principali, possiamo presumere che questa sia una decisione intelligente di Google.
  • Ciò significa che spesso ignoreranno parti del layout.
  • Ciò potrebbe causare problemi di indicizzazione e scansione a livello di sito.
  • E torniamo al problema che dopo 14 giorni, circa il 40% dei contenuti JavaScript non viene indicizzato.

Ma questo porta a un problema ancora più significativo: dopo 14 giorni, il 10% degli URL non viene indicizzato.

Annuncio pubblicitario
Continua a leggere di seguito

Questo va ben oltre JavaScript SEO perché il rendering avviene con e senza JavaScript.

JavaScript non è il motivo principale per il rendering.

Sapendo quello che sappiamo ora, dovremmo ancora chiamarlo JavaScript SEO?

Asporto

Per concludere la sua presentazione, Góralewicz ha condiviso i seguenti suggerimenti:

  • Il rendering SEO e l'indicizzazione saranno una delle tendenze SEO più interessanti. Presto.
  • Se non sei indicizzato, tutte le altre attività SEO che stai svolgendo non avranno importanza.
  • L'indicizzazione è qualcosa che puoi vedere e misurare. Genera entrate. Direttamente.
  • Per la prima volta nella storia della SEO abbiamo una buona comprensione di come funzionano il rendering e l'indicizzazione, quindi facciamolo buon uso.

Guarda questa presentazione

Ora puoi guardare la presentazione completa di Góralewicz dal SEJ eSummit il 2 giugno.

Altre risorse:

Annuncio pubblicitario
Continua a leggere di seguito
  • Nozioni di base su JavaScript per professionisti SEO
  • L'introduzione del SEO al rendering
  • Come (e perché) i motori di ricerca renderizzano le pagine

Crediti immagine

Immagine in primo piano: Paulo Bobita
Tutti gli screenshot presi dall'autore, luglio 2020