SEOマニフェストのレンダリング:JavaScriptSEOを超える必要がある理由

公開: 2020-12-12

あなたのコンテンツが検索エンジンによって適切にアクセスされ、上位にランク付けされることを確認したいですか?

BartoszGóralewiczは、SEJ eSummitセッションで、Googleがどのようにウェブサイトを大規模にレンダリングしているかを紹介し、Googleの特許とドキュメントに基づいて洞察を共有しました。

これが彼のプレゼンテーションの要約です。

JavaScriptコード

JavaScriptの問題

Góralewiczと彼のチームは、JavaScriptに依存するコンテンツの40%が14日後にインデックスに登録されないことを発見しました。

広告
以下を読み続ける

悪化する。

平均的なドメイン内のURLの10%はGoogleによってインデックスに登録されておらず、一意のインデックス可能なURLについて話しています。

特にこれらの傾向は時間とともに変化し、悪化する可能性があるため、これは注目すべき点です。

2015年、Googleは、次のようにレンダリングするのが得意であると主張しました。

「[A] GooglebotがJavaScriptまたはCSSファイルをクロールするのをブロックしていない限り、通常、最新のブラウザのようにWebページをレンダリングして理解することができます。」

2017年以来、Góralewiczと彼のチームは、JavaScriptを使用したクローキング実験など、JavaScriptベースのWebサイトで発生するクロールとインデックス作成の問題を明らかにする他の多くの実験を作成しました。

その同じ年、GoogleはJavaScriptSEOについて公然と話し始めました。

今日、SEOコミュニティに非常に役立つGoogleのMartin Splittがいますが、まだ答えられていない質問があります。

広告
以下を読み続ける

2019年11月のChromeデベロッパーサミットで、Splittは、Googleでのレンダリングの中央値が1年前の最大1週間から2019年にはわずか5秒に改善したことを発表しました。

ただし、GóralewiczとOnelyチームの追加調査によると、「新しいWebサイトでは、レンダリング遅延の中央値は事実上存在しない可能性があり、JavaScriptコンテンツのインデックス作成の遅延は依然として非常に大きい」とのことです。

JavaScriptを利用したWebサイトの多くは、2週間経ってもインデックスに登録されず、ランク付けされません。

彼らはまたそれを発見しました:

  • グーグルのインデックスにはかろうじて巨大なブランドがあります。
  • HTMLのインデックス作成は、想定されているほど簡単ではありません。
  • インデックス作成の傾向は、Googleの更新中に変動します。
  • あなたはグーグルのインデックスから追い出されることができます。

現在、インデックスのドロップを診断する際の課題の1つは、siteコマンドの信頼性が低く、多くのフォールスネガティブを返す可能性があることです。

サイトコマンド

Googleのインデックスに入る:大きなSEOの課題

コンテンツをGoogleのインデックスに登録することは、オンラインプレゼンスの絶対的な基盤であり、今日でもSEOの大きな課題となっています。

そして、この問題は、Googleの限られたリソースでさらに大きくなります。これは、世界中のWeb全体をレンダリングおよびインデックス作成できないためです。特に、現在多くの最新のWebサイトに伴うコストが原因です。

インデックス作成に重大な問題がある最大のブランドのいくつかを見てください。

インデックスに登録されていないURLの割合

Googleがあなたのウェブページをインデックスに登録しない場合、他のすべてのSEOアクティビティはまったく問題になりません。

広告
以下を読み続ける

SEOとGoogle社員の両方がインデックス作成の問題について話し合いを始めており、それを検証するためのより優れたデータソースがあります。

そして、ほとんどのインデックス作成の問題は、実際には技術的なSEOによって解決できます。

方法は次のとおりです。

バッチ最適化レンダリング:仕組み

Googleは、バッチ最適化されたレンダリングおよびフェッチアーキテクチャ(BOR)の観点からWebサイトを検討しています。

これらのビューを並べて見ると、Googleが表示しているものは、ユーザーがブラウザーで表示しているものとは異なります。

バッチ最適化レンダリング

では、BORはどのように機能しますか?

広告
以下を読み続ける

ステップ1:BORは、ページのプレビューを生成するために不可欠ではないすべてのリソースをスキップします

バッチ最適化レンダリングおよびフェッチアーキテクチャの最初のステップは、ウェブサイトのプレビューまたはレイアウトを生成するためにGoogleが必要としないすべてのリソースを削除することです。

これも:

  • 追跡スクリプト(Google Analytics、Hotjarなど)
  • 広告
  • 画像

これらの余分なリソースを削除するだけで、読み込み、スクリプト作成、レンダリングの時間を最大50%以上節約できます。 これにより、Google側でかなりのリソースを節約できます。

ステップ2:仮想時計の値を設定する

Googleが行う2番目のステップでは、仮想時計の値を設定します(これについては後でもう少し説明します)。

ステップ3:ウェブサイトのレイアウトが生成されます

その仮想時計の時間が「なくなる」と、Webサイトのレイアウトが生成されます。

広告
以下を読み続ける

覚えておくべき2つの重要な概念があります。

  • 仮想時計。
  • レイアウト。

仮想時計とは?

仮想時計は、Webサイトのレンダリングのコストを測定します。

これはGoogle側からのレンダリング予算のようなものであり、ウェブサイトには少しの「予算」が割り当てられています。

リソース(oe、スクリプト、CSSファイル、画像のサイズなど)をフェッチするためにレンダリングが一時停止すると、その仮想時計は進みません。 実際にレンダリングしたときにのみ進行します。

これは、Webサイト内にCSS、JavaScript、またはその他のリソースがたくさんある場合、仮想時計でより多くの「仮想時間」が必要になることを意味します。

ただし、その仮想クロック時間のどれだけを取得できるかは保証されません。

制限が何であるかはわかりませんが(そして、私たちは決して知らないかもしれません)、私たちのWebサイトがどれほどリソースを消費しているかを理解することができます。

広告
以下を読み続ける

Chrome DevToolsを使用すると、CPUの速度を低下させ、それがスクリプトとレンダリングにどのように影響するかを確認できます。

例としてH&Mのウェブサイトを見てみましょう。

時間を最大25倍に増やしました。

H&Mがレンダリングとインデックス作成にどのように苦労しているのかがわかります。

ChromDevTools-遅いCPU

あなたのウェブサイトの「仮想時計の負荷」を測定する方法

Góralewiczは、「仮想クロック負荷」を測定するために2つのオプションを推奨しています。

広告
以下を読み続ける
  • Onely's TooLongを使用してください。 Webページを0から100までレンダリングするコストを計算するレンダリングしなかった(TL; DR)ツール。
  • ChromeDevToolsでBORをシミュレートします。 (ここに詳細なウォークスルーがあります。)

あなたのページのレイアウト

仮想クロックの時間がなくなると、レンダリングの途中であるかどうかに関係なく、レイアウトが生成されます。

これは多くの潜在的な課題につながります。

最も重要なのは、ここでJavaScript SEOが終了し、SEOのレンダリングが開始されることです。

レンダリングは、このアイデア全体でレイアウトがどのように機能するかに重点を置いています。

コンテンツの場所の問題

スクロールせずに見える範囲に表示されるテキストは、線より下のテキストよりも重要であることはすでにわかっています。

また、Googleがそのコンテンツをクロールする方法にも影響を与えることがわかりました。

Googleの2011年の特許であるSchedulingresourceクロールは、検索エンジンがWebサイトのさまざまなセクションと、それらのセクション内のリンクをさまざまな優先度でどのように表示するかを示しています。

これは、JavascriptSEOが氷山の一角にすぎないことを示しています。 Googleが私たちのコンテンツを見ることができるかどうかにのみ焦点を当てています。

広告
以下を読み続ける

レンダリングはそれをはるかに超えています。

SEOマニフェストのレンダリング:JavaScriptSEOを超える必要がある理由

グーグルがコンテンツを見ているだけでなく、私たちは今興味を持っているので、それははるかに広いトピックです:

ページのレイアウト。

  • テキストのサイズ、配置などに基づくコンテンツの重要性。
  • 内部および外部リンクの抽出。
  • エントリー変更率。
  • 画像など、Webサイトのレンダリング方法とその後の外観に関係するその他の要因。

バッチレンダリングと画像

Googleのレンダリングサービスは模擬画像を使用しています。 これがどのように実行されるかの例です。

画像バッチレンダリングの例

リンクはどうですか?

リンクの値は、リンクの場所と属性によって異なります。

これはかなり前から知っていましたが、Googleのパターンをさらに調べると、さらに興味深いものになります。

リンク位置

ページ内のリンクの位置が重要です。

広告
以下を読み続ける

これは、Googleがそのリンクをクロールする方法と、Googleがそのリンクに割り当てる「評価」の種類に影響します。

さらに、ページの重要なセクションに配置されたリンクには、重要性の低いセクションのリンクと比較して高い値が割り当てられる場合があります。

ユーザーの行動や機能データの特許(Reasonable Surferモデル)に基づくランキングドキュメントによると、リンクに関連する他の多くの機能があります。

  • 周囲のテキスト:リンクの前および/または後の単語。
  • リンクの種類(画像/テキストなど)
  • リンクに関連付けられたアンカーテキストがどれほど商業的であるか
  • ソースドキュメント内のリンクの数
  • フォントサイズ

さらに、Googleはブロックレベルでページを分析しません。 リンクは、ページの人気のあるセクションに配置されている場合でも、重要ではないと見なすことができます。たとえば、「利用規約」リンク、バナー広告、またはドキュメントに関係のないリンクの場合です。

グーグルが合理的なサーファーモデルを完全に適用するには、ページが完全にレンダリングされている必要があることに注意することが重要です。

その他のトップストーリー-CNN

ユーザーの行動や機能データの特許(Reasonable Surferモデル)に基づくランキングドキュメントによると、リンクに関連する他の多くの機能があります。

広告
以下を読み続ける
  • 周囲のテキスト:リンクの前後の単語。
  • リンクの種類(画像/テキストなど)。
  • リンクに関連付けられたアンカーテキストがどれほど商業的であるか。
  • ソースドキュメント内のリンクの数。
  • フォントサイズ。

さらに、Googleはブロックレベルでページを分析しません。

リンクは、ページの人気のあるセクションに配置されている場合でも、重要ではないと見なすことができます。たとえば、「利用規約」リンク、バナー広告、またはドキュメントに関係のないリンクの場合です。

グーグルが合理的なサーファーモデルを完全に適用するには、ページが完全にレンダリングされている必要があることに注意することが重要です。

では、どのセクションがインデックスに登録され、インデックスに登録されないのでしょうか。

Góralewiczと彼のチームが9か月の調査で見つけたのは、Googleが非常によく似たヒューリスティックを使用して、ウェブサイトのどの部分をレンダリングし、どの部分をスキップできるかを選択することです。

部分インデックスを診断するために、Onelyチームは、人気のあるWebサイトを調べて、特定のレイアウトのどの部分がインデックス付けされ、どの部分がインデックス付けされていないかを確認しました。

広告
以下を読み続ける

彼らが発見したのは、グーグルがウェブサイトのいくつかの部分を他の部分よりも熱心に無視しているようだということです。

たとえば、Googleは「関連アイテム」と「あなたも興味があるかもしれない」セクションのレンダリングに苦労しているようです。

Googleはおそらくあなたのメインコンテンツをインデックスに登録します。

しかし…あなたのウェブサイトがスクリプトとレンダリングの面で重い場合、グーグルがそのレイアウトを理解しようとした後、彼らはあなたのページのメインコンテンツほど重要ではない部分をスキップする可能性が高いです。

Googleは、重い場合はスクリプトを中断すると述べていますが、それが何を意味するのかは今までわかりませんでした。

部分索引付け:主要な調査結果

部分インデックスはそれほど重要な問題ではないと思われるかもしれません。

  • 彼らが最初にあなたのメインコンテンツをインデックスに登録するとき、これはグーグルからの賢明な決定であると推測することができます。
  • これは、彼らがあなたのレイアウトの一部を無視することが多いことを意味します。
  • これにより、サイト全体のインデックス作成とクロールの問題が発生する可能性があります。
  • そして、14日後、JavaScriptコンテンツの約40%がインデックスに登録されないという問題に戻ります。

しかし、これはさらに重大な問題につながります。14日後、URLの10%がインデックスに登録されません。

広告
以下を読み続ける

レンダリングはJavaScriptの有無にかかわらず行われるため、これはJavaScriptSEOをはるかに超えています。

JavaScriptはレンダリングの主な理由ではありません。

私たちが今知っていることを知っているので、それをJavaScript SEOと呼ぶべきですか?

要点

プレゼンテーションの締めくくりとして、Góralewiczは次のポイントを共有しました。

  • SEOのレンダリングとインデックス作成は、最もホットなSEOトレンドの1つになるでしょう。 すぐに。
  • インデックスに登録されていない場合、実行している他のすべてのSEOアクティビティは重要ではありません。
  • インデックス作成は、表示および測定できるものです。 それは収益を促進します。 直接。
  • SEOの歴史の中で初めて、レンダリングとインデックス作成がどのように機能するかをよく理解しているので、それをうまく活用しましょう。

このプレゼンテーションを見る

6月2日のSEJeSummitからのGóralewiczの完全なプレゼンテーションを見ることができます。

その他のリソース:

広告
以下を読み続ける
  • SEOプロフェッショナル向けのJavaScriptの基本
  • SEOによるレンダリングの概要
  • 検索エンジンがページをレンダリングする方法(および理由)

画像クレジット

注目の画像:Paulo Bobita
2020年7月に作成者が撮影したすべてのスクリーンショット