#WAM:スパムボットの特定と殺害

公開: 2021-08-02

データの突然の急増? なんてエキサイティングなのでしょう えっ、ちょっと待って…

ライオンとトラとスパムボット、オーマイ! スパムロボットはデジタルマーケターの存在の悩みの種であり、きしむようなクリーンなデータ全体に誤検知と誤検知を投げかけます。

それらはウェブ分析のノミであり、どこからともなく現れ、一口食べて、カーペットの安全に姿を消します。 しかし、これらの不思議な生き物は何ですか?

スパムボットとは何ですか?

Searchexchange定義されているように、スパムボットは「迷惑メール(スパムとも呼ばれる)を送信するためのメーリングリストを構築するために、インターネットからメールアドレスを収集または収集するように設計されたプログラムです。 スパムボットは、Webサイト、ニュースグループ、分科会(SIG)の投稿、およびチャットルームでの会話から電子メールアドレスを収集できます。」

つまり、基本的には寄生虫です。

これらのスパムボットは国防総省グレードのサイトセキュリティを跳ね返して機密データを安全に保つ可能性がありますが、それでもWeb分析データを台無しにしてしまいます。 それでは、これらの厄介なボットを見つけて排除する方法を見てみましょう。

1.スパイクを特定します

アナリティクスで日付範囲を広げて、少しずれているものがあるかどうかを確認します。 トラフィックのランダムで急激な急増に気付いた場合は、異常である可能性が高いため、熱意を抑えてください。

バグがあります。 あなたは? 時間枠を拡大して、詳しく見てみましょう。

そうそう、11月27日に非常に疑わしい容疑者がいます。 その日を日付範囲で分離して、どのように見えるかを見てみましょう。

午後6時から7時までの何百ものセッション興味深い…

2.行動を認識する

スパムロボットは通常、徐々にではなく、まとめて展開されます。 これは彼らの1つの致命的な欠陥です。 11月27日午後6時から7時の間は煙を吐く銃です。 しかし、これは有罪判決を下すのに十分な証拠ではありません。 動機を確立するためには、スパムボットの動作についてもう少し理解する必要があります。

通常、スパムボットは次の特性を示します。

  • 1つの地理的な場所で発生します。
  • 同じIPアドレスから来ています。
  • 一度にたくさんのセッションを作成します。
  • 高いバウンス率。
  • 現場での時間が少ない。
  • トラフィックソースは通常、直接または参照です。

これらの特性を念頭に置いて、疑わしい時間枠での高レベルのメトリックを見てみましょう。

スパムボットは通常、一意のCookieを使用して一度に1ページのみをプローブするため、すべてのインスタンスはセッション、バウンス、およびサイトでのゼロ時間としてカウントされます。 この場合、メトリックに0:00の平均セッション期間、100%のバウンス率、100%の新規セッションが表示されない唯一の理由は、データセットに実際の訪問者が2人混在していたためと考えられます。 それにもかかわらず、これはかなり確かな証拠です。

3.場所を分離する

証拠が構築されています。 掘り続けましょう。 次に、トラフィックの場所を調べて、異常が発生していないかどうかを確認します。 [オーディエンス]→[地域]→[場所]に移動します。

米国の場所からの異常なエンゲージメント指標に注意してください。 United Statesフォルダーを掘り下げて、他に目立つものがあるかどうかを確認します。

感謝祭の週末の午後7時から8時の間に、349人のユニークな人々がクライアントの製品を渇望する可能性は低いようです。 都市を特定して、さらに深く掘り下げましょう。

アッシュバーン、あなたは卑劣な小さなバグです。

4.ソースを特定します

私たちは今、犯罪の場所を確立しました:バージニア州アッシュバーン。 次に、彼らがどのようにしてサイトにアクセスしたかを知る必要があります。 私たちの理論が当てはまる場合、すべてのトラフィックは、直接または紹介のいずれかの1つの特定のソースから来ている必要があります。 [集客]→[すべてのトラフィック]→[ソース/メディア]に移動します。

直接入ってくるアッシュバーンのトラフィックがあります。 このケースは今ではかなり水密です。 棺桶に最後の釘を打ち込むために、スパマーがボットを展開するために使用していたテクノロジープラットフォームを見てください。 [オーディエンス]→[テクノロジー]→[ネットワーク]に移動します。

スラムダンクです。 スパムボットがあります。 私たちの探偵の仕事は、11月27日午後7時から8時の間にバージニア州アッシュバーンのHubspotプラットフォームから作成された349のスパムボットセッションを発見しました。 閉まっている。

ここで、この悪いデータをレポートからどのように除外するかという問題が残ります。

スパムロボットを殺す

残念ながら、私たちの場合、被害はすでに発生しています。 GoogleAnalyticsで収集されたデータを上書きまたは削除することはできません。 私たちにできることは、レポートからデータを除外するように高度なセグメントを設定することです。 この場合、スパムボットを「殺す」のではなく、レポートから隠します。

上で概説した特性のどれが私たちのクリーンなトラフィックから最もユニークであるかを決定したいと思います。 トラフィックを除外するときは、巻き添え被害を最小限に抑えるために、スパムボットによって引き起こされたトラフィックのみを除外するようにします。

この場合、Hubspotサービスプロバイダーを排除したくありません。Hubspotサービスプロバイダーは、スパム以外のトラフィックを大量に発生させる可能性のある人気のあるプラットフォームだからです。 期間を6か月に広げて、バージニア州アッシュバーンからのトラフィック量を確認しましょう。 おそらく、この都市からの交通を単純に排除することができます。

スパムボットを除いて、アッシュバーンからトラフィックを受け取ることは非常にまれなようです。 排除するための共通の要因としてアッシュバーンを使用します。 画面上部の「セグメントの追加」に移動し、「新規セグメント」をクリックします。 セグメントに名前を付けてから、[条件]をクリックします。

フィルタのドロップダウンをクリックして[除外]をクリックし、[都市]を選択して、[アッシュバーン]と入力します。 保存する。

そして今、あなたの報告はスパムトラフィックを省略します。 私たちの期間を見て、異常が取り除かれたことを確認してください。

スパムロボット、なくなった。

今後この問題が再発しないようにする場合は、管理パネルでフィルタを設定して、スパムであると判断した特定のソースからのトラフィック完全に除外することができます。 特定のIPアドレスまたは参照ソースからのトラフィックをフィルタリングするオプションがあります。 フィルタを使用すると、スパムボットがデータに登録されるのを防ぐことができます。上記の手順を使用して、スパムボットがどこから来ているのかを正確に知る必要があります。

たとえば、すべてのスパムボットがドメイン「 www.spamcentral.com 」から送信されていることがわかっている場合は、[管理]パネル→[フィルター]→[新しいフィルターの作成]に移動します。 次に、「除外」と「このISPドメインからのトラフィック」を選択し、「 www.spamcentral.com 」と入力します。 これにより、GAがこのドメインからのトラフィックをログに記録するのを防ぐことができます。

Mozは、スパム寄生虫が侵入する前にデータを保護する方法を説明する素晴らしい仕事しています。

デッドボット

優れたスパムボットは、省略またはフィルタリングされたスパムボットです。 彼らはあなたのデータに大混乱をもたらし、あらゆる種類の誤った指標を送信します。 メトリックの異常(良いか悪いか)を特定し、上記の手順に従って原因を追跡し、データからそれを排除します。

クリーンなデータがありますように。来週、月曜日にWebAnalyticsの別のエディションでお会いしましょう。