#WAM:识别和杀死垃圾邮件机器人

已发表: 2021-08-02

数据意外飙升? 多么令人兴奋 等一下…

狮子、老虎和垃圾邮件机器人,天哪! 垃圾邮件机器人是数字营销人员存在的祸根,它会在您干净利落的数据中散布误报和误报。

它们是网络分析的跳蚤,突然冒出来,快速咬一口,然后消失在地毯的安全中。 但是这些神秘的生物是什么?

什么是垃圾邮件机器人?

根据Searchexchange 的定义,垃圾邮件机器人是“一种旨在从 Internet 收集或获取电子邮件地址以构建邮件列表以发送未经请求的电子邮件(也称为垃圾邮件)的程序 垃圾邮件机器人可以从网站、新闻组、特殊兴趣组 (SIG) 帖子和聊天室对话中收集电子邮件地址。”

所以基本上,它们是寄生虫。

虽然这些垃圾邮件机器人可能会破坏您的国防部级站点安全,确保您的敏感数据安全,但它们仍然会破坏您的网络分析数据。 那么让我们看看如何找到那些讨厌的机器人并消除它们。

1. 识别尖峰

在分析中展开您的日期范围,看看是否有任何内容出现偏差。 当您注意到流量出现随机、急剧的激增时,请保持热情,因为这可能是异常情况。

我看到一个错误。 你? 让我们放大时间范围以仔细观察。

哦,是的,我们在 11 月 27 日有一个非常可疑的嫌疑人。 让我们在我们的日期范围内隔离那一天,看看它是什么样子。

下午 6 点到 7 点之间有数百个会话

2. 识别行为

Spambots 通常是集体部署的,而不是逐渐部署的。 这是他们的一个致命缺陷。 11 月 27 日下午 6 点到 7 点之间是吸烟枪。 然而,这不足以定罪。 我们需要更多地了解垃圾邮件机器人的行为,以便确定动机。

垃圾邮件程序通常具有以下特征:

  • 起源于一个地理位置。
  • 来自相同的 IP 地址。
  • 一次创建大量会话。
  • 高跳出率。
  • 现场时间短。
  • 流量来源通常是直接或推荐。

考虑到这些特征,让我们来看看可疑时间范围内的高级指标。

由于垃圾邮件机器人通常一次仅使用唯一的 cookie 探测一个页面,因此每个实例都将计为一次会话、一次退回和站点上的零时间。 在这种情况下,指标没有显示 0:00 平均会话持续时间、100% 跳出率和 100% 新会话的唯一原因可能是因为有几个真实的访问者混入了数据集中。 尽管如此,这是非常可靠的证据。

3. 隔离位置

证据正在建立; 让我们继续挖掘。 接下来,我们将查看流量的位置,看看是否有任何异常出现。 转至受众 → 地理位置 → 位置。

请注意来自美国各地的不同寻常的参与度指标。 深入研究美国文件夹,看看是否还有其他突出之处。

在感恩节周末晚上 7 点到 8 点之间,349 位独特的人似乎不太可能对我们客户的产品产生渴望。 让我们通过识别城市来更深入。

阿什本,你这个狡猾的小虫子。

4. 确定来源

我们现在已经确定了犯罪地点:弗吉尼亚州阿什本。 现在我们需要知道他们是如何到达网站的。 如果我们的理论成立,那么所有流量都应该来自一个特定的来源:直接或推荐。 转到获取 → 所有流量 → 来源/媒介。

有我们的阿什本流量,直接进入。 这个案例现在非常防水。 只是为了在棺材上钉上最后一颗钉子,看看我们的垃圾邮件发送者用来部署他或她的机器人的技术平台。 转到受众 → 技术 → 网络。

这是一个扣篮。 我们有垃圾邮件机器人。 我们的侦探工作发现了 349 个垃圾邮件机器人会话,这些会话是在 11 月 27 日晚上 7 点到 8 点之间在弗吉尼亚州阿什本的一个 Hubspot 平台上创建的。 关闭。

现在我们面临的问题是如何从我们的报告中忽略这些不良数据。

杀死垃圾邮件机器人

不幸的是,在我们的案例中,损害已经造成。 我们无法覆盖或删除在 Google Analytics 中收集的数据。 我们可以做的是设置一个高级细分以从我们的报告中省略数据。 在这种情况下,我们不会“杀死”垃圾邮件程序,而是将它们从我们的报告中隐藏起来。

我们想从我们的清洁流量中确定上面概述的哪些特征是最独特的。 当省略流量,我们希望确保我们省略引起的反垃圾邮件插件,以尽量减少附带损害的流量。

在这种情况下,我不想取消 Hubspot 服务提供商,因为它是一个流行的平台,可能会推动大量非垃圾邮件流量。 让我们将时间段扩展到六个月,看看有多少流量来自弗吉尼亚州阿什本。 也许我们可以简单地消除这个城市的交通。

除了垃圾邮件机器人,我们从 Ashburn 获得流量似乎非常罕见。 我将使用 Ashburn 作为我们消除的共同因素。 转到屏幕顶部的“添加细分”,然后单击“新建细分”。 为您的细分命名,然后单击“条件”。

单击过滤器下拉列表以“排除”,然后选择“城市”并输入“Ashburn”。 节省。

现在您的报告将忽略垃圾邮件流量。 查看我们的时间段以确认异常已被删除。

垃圾邮件,不见了。

如果您想防止将来再次发生该问题,您可以探索在管理面板中设置过滤器,以完全排除来自您确定为垃圾邮件的任何特定来源的流量。 您可以选择过滤来自特定 IP 地址或引荐来源的流量。 使用过滤器可以防止垃圾邮件机器人在您的数据中注册——您只需要使用上述步骤确切地知道它们来自哪里。

例如,如果我知道我所有的垃圾邮件机器人都来自域“ www.spamcentral.com ”,我会转到管理面板 → 过滤器 → 创建新过滤器。 然后我会选择“排除”和“来自这个 ISP 域的流量”并输入“ www.spamcentral.com” 这将阻止 GA 记录来自该域的流量。

Moz 很好地解释了如何在垃圾邮件寄生虫进入之前保护您的数据。

死机器人

一个好的垃圾邮件机器人是一个被忽略或过滤的垃圾邮件机器人。 他们对您的数据造成严重破坏并发送各种虚假指标。 确定指标中的任何异常(好的或坏的),并按照上述步骤追踪罪魁祸首的来源,以将其从数据中消除。

愿您拥有干净的数据,我们下周将在周一的另一版网络分析中与您见面。