#WAM:識別和殺死垃圾郵件機器人

已發表: 2021-08-02

數據意外飆升? 多麼令人興奮 等一下…

獅子、老虎和垃圾郵件機器人,天哪! 垃圾郵件機器人是數字營銷人員存在的禍根,它會在您乾淨利落的數據中散佈誤報和誤報。

它們是網絡分析的跳蚤,突然冒出來,快速咬一口,然後消失在地毯的安全中。 但是這些神秘的生物是什麼?

什麼是垃圾郵件機器人?

根據Searchexchange 的定義,垃圾郵件機器人是“一種旨在從 Internet 收集或獲取電子郵件地址以構建郵件列表以發送未經請求的電子郵件(也稱為垃圾郵件)的程序 垃圾郵件機器人可以從網站、新聞組、特殊興趣組 (SIG) 帖子和聊天室對話中收集電子郵件地址。”

所以基本上,它們是寄生蟲。

雖然這些垃圾郵件機器人可能會破壞您的國防部級站點安全,確保您的敏感數據安全,但它們仍然會破壞您的網絡分析數據。 那麼讓我們看看如何找到那些討厭的機器人並消除它們。

1. 識別尖峰

在分析中展開您的日期範圍,看看是否有任何內容出現偏差。 當您注意到流量出現隨機、急劇的激增時,請保持熱情,因為這可能是異常情況。

我看到一個錯誤。 你? 讓我們放大時間範圍以仔細觀察。

哦,是的,我們在 11 月 27 日有一個非常可疑的嫌疑人。 讓我們在我們的日期範圍內隔離那一天,看看它是什麼樣子。

下午 6 點到 7 點之間有數百個會話

2. 識別行為

Spambots 通常是集體部署的,而不是逐漸部署的。 這是他們的一個致命缺陷。 11 月 27 日下午 6 點到 7 點之間是吸煙槍。 然而,這不足以定罪。 我們需要更多地了解垃圾郵件機器人的行為,以便確定動機。

垃圾郵件程序通常具有以下特徵:

  • 起源於一個地理位置。
  • 來自相同的 IP 地址。
  • 一次創建大量會話。
  • 高跳出率。
  • 現場時間短。
  • 流量來源通常是直接或推薦。

考慮到這些特徵,讓我們來看看可疑時間範圍內的高級指標。

由於垃圾郵件機器人通常一次僅使用唯一的 cookie 探測一個頁面,因此每個實例都將計為一次會話、一次退回和站點上的零時間。 在這種情況下,指標沒有顯示 0:00 平均會話持續時間、100% 跳出率和 100% 新會話的唯一原因可能是因為有幾個真實的訪問者混入了數據集中。 儘管如此,這是非常可靠的證據。

3. 隔離位置

證據正在建立; 讓我們繼續挖掘。 接下來,我們將查看流量的位置,看看是否有任何異常出現。 轉至受眾 → 地理位置 → 位置。

請注意來自美國各地的不同尋常的參與度指標。 深入研究美國文件夾,看看是否還有其他突出之處。

在感恩節週末晚上 7 點到 8 點之間,349 位獨特的人似乎不太可能對我們客戶的產品產生渴望。 讓我們通過識別城市來更深入。

阿什本,你這個狡猾的小蟲子。

4. 確定來源

我們現在已經確定了犯罪地點:弗吉尼亞州阿什本。 現在我們需要知道他們是如何到達網站的。 如果我們的理論成立,那麼所有流量都應該來自一個特定的來源:直接或推薦。 轉到獲取 → 所有流量 → 來源/媒介。

有我們的阿什本流量,直接進入。 這個案例現在非常防水。 只是為了在棺材上釘上最後一顆釘子,看看我們的垃圾郵件發送者用來部署他或她的機器人的技術平台。 轉到受眾 → 技術 → 網絡。

這是一個扣籃。 我們有垃圾郵件機器人。 我們的偵探工作發現了 349 個垃圾郵件機器人會話,這些會話是在 11 月 27 日晚上 7 點到 8 點之間在弗吉尼亞州阿什本的一個 Hubspot 平台上創建的。 關閉。

現在我們面臨的問題是如何從我們的報告中忽略這些不良數據。

殺死垃圾郵件機器人

不幸的是,在我們的案例中,損害已經造成。 我們無法覆蓋或刪除在 Google Analytics 中收集的數據。 我們可以做的是設置一個高級細分以從我們的報告中省略數據。 在這種情況下,我們不會“殺死”垃圾郵件程序,而是將它們從我們的報告中隱藏起來。

我們想從我們的清潔流量中確定上面概述的哪些特徵是最獨特的。 當省略流量,我們希望確保我們省略引起的反垃圾郵件插件,以盡量減少附帶損害的流量。

在這種情況下,我不想取消 Hubspot 服務提供商,因為它是一個流行的平台,可能會推動大量非垃圾郵件流量。 讓我們將時間段擴展到六個月,看看有多少流量來自弗吉尼亞州阿什本。 也許我們可以簡單地消除這個城市的交通。

除了垃圾郵件機器人,我們從 Ashburn 獲得流量似乎非常罕見。 我將使用 Ashburn 作為我們消除的共同因素。 轉到屏幕頂部的“添加細分”,然後單擊“新建細分”。 為您的細分命名,然後單擊“條件”。

單擊過濾器下拉列表以“排除”,然後選擇“城市”並輸入“Ashburn”。 節省。

現在您的報告將忽略垃圾郵件流量。 查看我們的時間段以確認異常已被刪除。

垃圾郵件,不見了。

如果您想防止將來再次發生該問題,您可以探索在管理面板中設置過濾器,以完全排除來自您確定為垃圾郵件的任何特定來源的流量。 您可以選擇過濾來自特定 IP 地址或引薦來源的流量。 使用過濾器可以防止垃圾郵件機器人在您的數據中註冊——您只需要使用上述步驟確切地知道它們來自哪裡。

例如,如果我知道我所有的垃圾郵件機器人都來自域“ www.spamcentral.com ”,我會轉到管理面板 → 過濾器 → 創建新過濾器。 然後我會選擇“排除”和“來自這個 ISP 域的流量”並輸入“ www.spamcentral.com” 這將阻止 GA 記錄來自該域的流量。

Moz 很好地解釋瞭如何在垃圾郵件寄生蟲進入之前保護您的數據。

死機器人

一個好的垃圾郵件機器人是一個被忽略或過濾的垃圾郵件機器人。 他們對您的數據造成嚴重破壞並發送各種虛假指標。 確定指標中的任何異常(好的或壞的),並按照上述步驟追踪罪魁禍首的來源,以將其從數據中消除。

願您擁有乾淨的數據,下週我們將在周一的另一版網絡分析中與您見面。