Rendering SEO Manifesto: perché dobbiamo andare oltre la SEO JavaScript
Pubblicato: 2020-12-12Vuoi assicurarti che i tuoi contenuti vengano acceduti correttamente dai motori di ricerca e si posizionino in alto?
Nella sua sessione SEJ eSummit, Bartosz Góralewicz ha presentato come Google esegue il rendering dei siti Web su larga scala e ha condiviso informazioni basate sui brevetti e sulla documentazione di Google.
Ecco un riepilogo della sua presentazione.
Il problema con JavaScript
Góralewicz e il suo team hanno scoperto che il 40% dei contenuti basati su JavaScript non viene indicizzato dopo 14 giorni.
La situazione peggiora.
Il dieci percento degli URL all'interno di un dominio medio non sono indicizzati da Google e stiamo parlando di URL indicizzabili univoci.
Questo è qualcosa da guardare, soprattutto perché queste tendenze cambiano nel tempo e possono peggiorare.
Nel 2015, Google ha affermato di essere bravo con il rendering dicendo:
"[A] fintanto che non impedisci a Googlebot di eseguire la scansione dei tuoi file JavaScript o CSS, in genere siamo in grado di visualizzare e comprendere le tue pagine web come i browser moderni."
Dal 2017, Góralewicz e il suo team hanno creato molti altri esperimenti, inclusi esperimenti di cloaking con JavaScript e altri, che hanno rivelato problemi di scansione e indicizzazione riscontrati dai siti Web basati su JavaScript.
Quale framework JavaScript è sottoponibile a scansione e indicizzabile? @bart_goralewicz # SMS2017 pic.twitter.com/3beH9dCj14
- Aleyda Solis (@aleyda) 2 maggio 2017
Nello stesso anno, Google ha iniziato a parlare apertamente di JavaScript SEO.
Oggi, anche se abbiamo Martin Splitt di Google, che è stato incredibilmente utile per la comunità SEO, ci sono ancora domande senza risposta.
Nel novembre 2019 al Chrome Developer Summit, Splitt ha annunciato che la mediana per il rendering su Google è migliorata da un massimo di una settimana all'anno prima a soli cinque secondi nel 2019.
Tuttavia, la ricerca aggiuntiva di Góralewicz e del team di Onely ha rilevato che "il ritardo di rendering mediano potrebbe essere praticamente inesistente per i nuovi siti Web, il ritardo nell'indicizzazione del contenuto JavaScript è ancora presente".
Molti siti Web basati su JavaScript non vengono indicizzati e non si classificano nemmeno dopo due settimane.
Hanno anche scoperto che:
- Ci sono marchi enormi a malapena nell'indice di Google.
- L'indicizzazione dell'HTML non è facile come si presume.
- Le tendenze di indicizzazione fluttuano durante gli aggiornamenti di Google.
- Puoi essere espulso dall'indice di Google.
Una delle sfide con la diagnosi dei cali di indicizzazione in questo momento è che il comando del sito non è affidabile e può restituire molti falsi negativi.
Entrare nell'indice di Google: una grande sfida SEO
Portare i tuoi contenuti nell'indice di Google è un fondamento assoluto della tua presenza online e oggi rimane una grande sfida SEO.
E questo problema diventerà ancora più grande con le risorse limitate di Google perché non possono eseguire il rendering e l'indicizzazione dell'intero Web in tutto il mondo, soprattutto con il costo che ora viene fornito con molti siti Web moderni.
Basta guardare alcuni dei più grandi marchi con problemi di indicizzazione significativi.
Se Google non indicizzerà le tue pagine web, tutte le altre attività SEO non avranno alcuna importanza.
Meno male che sia i SEO che i googler stanno iniziando la conversazione sui problemi di indicizzazione e abbiamo migliori fonti di dati per convalidarli.
E la maggior parte dei problemi di indicizzazione può effettivamente essere risolta attraverso la SEO tecnica.
Ecco come.
Rendering ottimizzato in batch: come funziona
Google guarda il tuo sito web da una prospettiva ottimizzata per il rendering e l'architettura di recupero in batch (BOR).
Guardando queste visualizzazioni affiancate, ciò che Google sta vedendo è diverso da ciò che gli utenti vedono in un browser.
Allora come funziona BOR?
Passaggio 1: BOR salta tutte le risorse che non sono essenziali per generare un'anteprima della tua pagina
Il primo passaggio per il rendering ottimizzato in batch e l'architettura di recupero è rimuovere tutte le risorse di cui Google non ha bisogno per generare l'anteprima o il layout del tuo sito web.
Ciò comprende:
- Script di monitoraggio (Google Analytics, Hotjar, ecc.)
- Annunci
- immagini
La semplice rimozione di queste risorse extra può far risparmiare fino a oltre il 50% del tempo di caricamento, script e rendering. Ciò consente di risparmiare un bel po 'di risorse da parte di Google.
Passaggio 2: impostare il valore di un orologio virtuale
Il secondo passo in cui Google sta per impostare il valore dell'orologio virtuale (di cui parleremo un po 'di più di seguito).
Passaggio 3: viene generato il layout del sito Web
Una volta che il tempo su quell'orologio virtuale "si esaurisce", viene generato il layout del sito web.
Ci sono due concetti chiave da ricordare:
- L'orologio virtuale.
- Lo schema.
Cos'è un orologio virtuale?
L'orologio virtuale misura il costo del rendering di un sito web.
È una sorta di budget per il rendering da parte di Google e ai siti web viene assegnata una piccola parte del "budget".
Quando il rendering si interrompe per recuperare le risorse (oe, script, file CSS, dimensioni dell'immagine, ecc.), L'orologio virtuale non avanza. Avanza solo quando effettivamente eseguiamo il rendering.
Ciò significa che se hai molti CSS, JavaScript o altre risorse nel tuo sito web, hai bisogno di più "tempo virtuale" sull'orologio virtuale.
Ma non c'è alcuna garanzia di quanto tempo dell'orologio virtuale sarai in grado di ottenere.
Anche se non sappiamo quale sia il limite (e potremmo non saperlo mai), possiamo capire quanto sia affamato di risorse il nostro sito web.
Utilizzando Chrome DevTools, puoi rallentare la CPU e vedere come influisce sullo script e sul rendering.
Prendiamo come esempio il sito web di H&M.
Ha aumentato il tempo fino a 25 volte.
Possiamo vedere come H&M possa avere difficoltà con il rendering e l'indicizzazione.
Come misurare il "carico dell'orologio virtuale" del tuo sito web
Góralewicz consiglia due opzioni per misurare il tuo "carico di clock virtuale".
- Usa Onely's Too Long; Strumento non reso (TL; DR) che calcola il costo del rendering di una pagina web da 0 a 100.
- Simula BOR nel tuo Chrome DevTools. (Ecco una guida dettagliata.)
Il layout della tua pagina
Quando il tempo dell'orologio virtuale si esaurisce, il layout viene generato indipendentemente dal fatto che sia a metà del rendering o meno.

Questo porta a molte potenziali sfide.
Ancora più importante, è qui che finisce JavaScript SEO e inizia il rendering SEO.
Il rendering si concentra molto su come il layout interagisce con l'intera idea.
La posizione dei contenuti è importante
Sappiamo già che il testo che appare above the fold è più importante del testo sotto la linea.
Si scopre che influisce anche sul modo in cui Google eseguirà la scansione di quel contenuto.
Il brevetto di Google del 2011, Scheduling resource crawls, ci dice come il motore di ricerca guarda alle diverse sezioni dei siti web, così come i link all'interno di quelle sezioni, con una priorità diversa.
Questo dimostra che Javascript SEO è solo la punta dell'iceberg. Si concentra solo sul fatto che Google possa vedere i nostri contenuti.
Il rendering va ben oltre.
È un argomento molto più ampio perché oltre a Google che vede solo il contenuto, ora siamo interessati a:
Il layout della pagina.
- L'importanza del contenuto, in base alla dimensione del testo, al posizionamento, ecc.
- Estrazione di link interni ed esterni.
- Tassi di cambio ingresso.
- Altri fattori che hanno a che fare con il modo in cui viene visualizzato un sito Web e come appare dopo, comprese le immagini .
Rendering in batch e immagini
Il servizio di rendering di Google utilizza immagini fittizie. Ecco un esempio di come funziona.
E i link?
Il valore dei collegamenti dipende dalla loro posizione e dagli attributi.
Lo sappiamo da un po 'di tempo, ma questo diventa più interessante quando esaminiamo più modelli di Google.
La posizione del collegamento all'interno della pagina è importante.
Influisce sul modo in cui Google eseguirà la scansione di quel collegamento e sul tipo di "valutazione" che Google assegnerà a quel collegamento.
Inoltre, ai link inseriti nelle sezioni importanti della tua pagina potrebbe essere assegnato un valore più alto rispetto ai link nelle sezioni meno importanti.
Secondo i documenti di Ranking basati sul comportamento dell'utente e / o sul brevetto sui dati delle funzionalità (il modello Reasonable Surfer), ci sono molte altre funzionalità associate ai collegamenti, tra cui:
- Testo circostante: parole prima e / o dopo il collegamento;
- Tipo di collegamento (ad es. Immagine / testo)
- Quanto potrebbe essere commerciale il testo di ancoraggio associato a un collegamento
- Numero di collegamenti nel documento di origine
- Dimensione del font
Inoltre, Google non analizza le pagine a livello di blocco. Un collegamento, anche se inserito in una sezione popolare di una pagina, può essere considerato non importante, ad esempio quando si tratta di un collegamento "Termini di servizio", di un banner pubblicitario o di un collegamento non correlato al documento.
È importante notare che Google, per applicare completamente il modello ragionevole del surfista, è necessario che la pagina sia completamente renderizzata.
Secondo i documenti di Ranking basati sul comportamento dell'utente e / o sul brevetto sui dati delle funzionalità (il modello Reasonable Surfer), ci sono molte altre funzionalità associate ai collegamenti, tra cui:
- Testo circostante: parole prima e / o dopo il collegamento.
- Tipo di collegamento (ad es. Immagine / testo).
- Quanto potrebbe essere commerciale il testo di ancoraggio associato a un collegamento.
- Numero di collegamenti nel documento di origine.
- Dimensione del font.
Inoltre, Google non analizza le pagine a livello di blocco.
Un collegamento, anche se inserito in una sezione popolare di una pagina, può essere considerato non importante, ad esempio quando si tratta di un collegamento "Termini di servizio", di un banner pubblicitario o di un collegamento non correlato al documento.
È importante notare che Google, per applicare completamente il modello ragionevole del surfista, è necessario che la pagina sia completamente renderizzata.
Quindi quali sezioni vengono indicizzate e non vengono indicizzate?
Quello che Góralewicz e il suo team hanno scoperto durante nove mesi di ricerca è che Google utilizza euristiche molto simili per scegliere quali parti di un sito web devono essere renderizzate e quali di queste possono essere ignorate.
Per diagnosticare l'indicizzazione parziale, il team di Onely ha esaminato siti Web popolari per vedere quali parti di un determinato layout sono indicizzate e quali no.
Quello che hanno scoperto è che Google sembra ignorare alcune parti dei siti Web più avidamente di altre.
Ad esempio, Google sembra avere difficoltà a visualizzare le sezioni "elementi correlati" e "potresti essere interessato anche a".
Molto probabilmente Google indicizzerà i tuoi contenuti principali.
Ma ... ci sono buone probabilità che se il tuo sito web è pesante dal punto di vista dello scripting e del rendering, salterà una parte della tua pagina che non è così cruciale come il contenuto principale dopo che Google avrà cercato di capire quel layout.
Google ha affermato che interromperanno lo script quando sono pesanti, ma non sapevamo cosa significasse fino ad ora.
Indicizzazione parziale: risultati chiave
Potresti pensare che l'indicizzazione parziale non sia un problema così significativo.
- Quando indicizzano per primi i tuoi contenuti principali, possiamo presumere che questa sia una decisione intelligente di Google.
- Ciò significa che spesso ignoreranno parti del layout.
- Ciò potrebbe causare problemi di indicizzazione e scansione a livello di sito.
- E torniamo al problema che dopo 14 giorni, circa il 40% dei contenuti JavaScript non viene indicizzato.
Ma questo porta a un problema ancora più significativo: dopo 14 giorni, il 10% degli URL non viene indicizzato.
Questo va ben oltre JavaScript SEO perché il rendering avviene con e senza JavaScript.
JavaScript non è il motivo principale per il rendering.
Sapendo quello che sappiamo ora, dovremmo ancora chiamarlo JavaScript SEO?
Asporto
Per concludere la sua presentazione, Góralewicz ha condiviso i seguenti suggerimenti:
- Il rendering SEO e l'indicizzazione saranno una delle tendenze SEO più interessanti. Presto.
- Se non sei indicizzato, tutte le altre attività SEO che stai svolgendo non avranno importanza.
- L'indicizzazione è qualcosa che puoi vedere e misurare. Genera entrate. Direttamente.
- Per la prima volta nella storia della SEO abbiamo una buona comprensione di come funzionano il rendering e l'indicizzazione, quindi facciamolo buon uso.
Guarda questa presentazione
Ora puoi guardare la presentazione completa di Góralewicz dal SEJ eSummit il 2 giugno.
Altre risorse:
- Nozioni di base su JavaScript per professionisti SEO
- L'introduzione del SEO al rendering
- Come (e perché) i motori di ricerca renderizzano le pagine
Crediti immagine
Immagine in primo piano: Paulo Bobita
Tutti gli screenshot presi dall'autore, luglio 2020