#WAM: выявление и уничтожение спам-ботов

Опубликовано: 2021-08-02

Неожиданный всплеск данных? Как интересно . Ой, подождите ...

Львы, тигры и спам-боты, о боже! Спам-боты - это проклятие для существования цифровых маркетологов, разбрасывая ложные срабатывания и отрицания на все ваши безупречно чистые данные.

Они - блохи веб-аналитики, которые появляются из ниоткуда, быстро кусают, а затем исчезают в безопасном ковре. Но что это за загадочные существа?

Что такое спам-бот?

По определению Searchexchange , спам-бот - это «программа, предназначенная для сбора или сбора адресов электронной почты из Интернета с целью создания списков рассылки для отправки нежелательной электронной почты, также известной как спам . Спам-бот может собирать адреса электронной почты с веб-сайтов, групп новостей, сообщений групп особых интересов (SIG) и разговоров в чатах ».

В общем, они паразиты.

И хотя эти спам-боты могут отскакивать от безопасности вашего сайта уровня Министерства обороны, сохраняя ваши конфиденциальные данные в безопасности, они все равно испортят ваши данные веб-аналитики. Итак, давайте посмотрим, как найти этих надоедливых ботов и устранить их.

1. Определите шип

Расширьте диапазон дат в аналитике и посмотрите, не что-то не так. Когда вы замечаете случайный резкий всплеск трафика, сдерживайте энтузиазм, поскольку это, скорее всего, аномалия.

Я вижу ошибку. Ты? Давайте увеличим масштаб времени, чтобы рассмотреть подробнее.

О да, 27 ноября у нас есть подозреваемый, выглядящий очень подозрительно. Давайте выделим этот день в нашем диапазоне дат и посмотрим, как он выглядит.

Сотни сеансов с 18 до 19 часов. Интересно…

2. Распознавайте поведение

Спам-боты обычно развертываются массово, а не постепенно. Это их единственный роковой недостаток. С 18 до 19 часов 27 ноября - дымящийся пистолет. Однако этого недостаточно для осуждения. Нам нужно немного больше понять поведение спам-ботов, чтобы установить мотив.

Обычно спам-боты обладают следующими характеристиками:

  • Происходят из одного географического места.
  • Приходите с того же IP-адреса.
  • Создавайте сразу много сеансов.
  • Высокий показатель отказов.
  • Мало времени на сайте.
  • Источник трафика обычно прямой или реферальный.

Помня об этих характеристиках, давайте взглянем на высокоуровневые метрики в подозрительный период времени.

Поскольку спам-боты обычно проверяют только одну страницу за раз с помощью уникального файла cookie, каждый экземпляр будет засчитан как сеанс, отказ и нулевое время пребывания на сайте. Единственная причина, по которой в этом случае метрики не отображают среднюю продолжительность сеанса 0:00, показатель отказов 100% и 100% новых сеансов, вероятно, состоит в том, что в набор данных была добавлена ​​пара реальных посетителей. Тем не менее, это довольно веские доказательства.

3. Изолировать место

Доказательства накапливаются; давайте продолжим копать. Далее мы посмотрим на расположение пробок и посмотрим, не возникнут ли какие-либо аномалии. Перейдите в Audience → Geo → Location.

Обратите внимание на необычные показатели взаимодействия, поступающие из регионов США. Загляните в папку США, чтобы увидеть, выделяется ли что-нибудь еще.

Кажется маловероятным, что 349 уникальных людей захотят купить продукт нашего клиента между 19 и 20 часами в День Благодарения. Давайте углубимся в определение города.

Эшберн, ты подлый маленький жук.

4. Определите источник

Мы установили место преступления: Эшберн, Вирджиния. Теперь нам нужно узнать, как они попали на сайт. Если наша теория верна, весь трафик должен поступать из одного конкретного источника: либо прямого, либо реферального. Перейдите в Acquisition → All Traffic → Source / Medium.

Вот наш трафик из Эшберна, идущий в Директ. Этот чехол теперь довольно водонепроницаем. Чтобы забить последний гвоздь в крышку гроба, взгляните на технологическую платформу, которую наш спамер использовал для развертывания своих ботов. Перейдите в Аудитория → Технологии → Сеть.

Это головокружительный данк. У нас есть спам-боты. Наша детективная работа обнаружила 349 сеансов спам-ботов, созданных с помощью платформы Hubspot из Эшберна, штат Вирджиния, 27 ноября между 19:00 и 20:00. Дело. Закрыто.

Теперь остается вопрос, как исключить эти неверные данные из нашей отчетности.

Убийство спам-ботов

К сожалению, в нашем случае ущерб уже нанесен. Мы не можем перезаписывать или удалять данные, которые были собраны в Google Analytics. Что мы можем сделать, так это настроить расширенный сегмент, чтобы исключить данные из нашей отчетности. В данном случае мы не будем «убивать» спам-ботов, а скорее будем скрывать их от наших отчетов.

Мы хотим решить, какая из описанных выше характеристик является наиболее уникальной в нашем чистом трафике. Исключая трафик, мы хотим убедиться, что мы исключаем только трафик, вызванный спам-ботами, чтобы минимизировать побочный ущерб.

В этом случае я не хочу отказываться от поставщика услуг Hubspot, поскольку это популярная платформа, которая, вероятно, обеспечивает большой объем неспамового трафика. Давайте увеличим период времени до шести месяцев, чтобы узнать, сколько трафика идет из Эшберна, штат Вирджиния. Возможно, нам удастся просто исключить движение из этого города.

Помимо спам-ботов, очень редко мы получаем трафик от Ashburn. Я собираюсь использовать Эшберна как наш общий фактор для устранения. Перейдите к «Добавить сегмент» в верхней части экрана и нажмите «Новый сегмент». Назовите свой сегмент, затем нажмите «Условия».

В раскрывающемся списке фильтра выберите «Исключить», затем выберите «Город» и введите «Эшберн». Сохранить.

И теперь в ваших отчетах будет опускаться спам-трафик. Взгляните на наш период времени, чтобы убедиться, что аномалия была удалена.

Спам-боты, ушли.

Если вы хотите предотвратить повторение проблемы в будущем, вы можете изучить настройку фильтров в панели администратора, чтобы полностью исключить трафик из любого конкретного источника, который вы определили как спам. У вас есть возможность фильтровать трафик с определенного IP-адреса или источника перехода. Использование фильтров предотвращает регистрацию спам-ботов в ваших данных - вам просто нужно точно знать, откуда они приходят, используя описанные выше шаги.

Например, если бы я знал, что все мои спам-боты исходят из домена « www.spamcentral.com », я бы пошел в панель администратора → Фильтры → Создать новый фильтр. Затем я бы выбрал «исключить» и «трафик с этого домена интернет-провайдера» и ввел бы « www.spamcentral.com ». Это предотвратит регистрацию в GA трафика, поступающего из этого домена.

Moz отлично объясняет, как защитить ваши данные от спам-паразитов, прежде чем они попадут в дверь.

Мертвые боты

Хороший спам-бот - это пропущенный или отфильтрованный спам-бот. Они разрушают ваши данные и отправляют всевозможные ложные индикаторы. Определите любые аномалии (хорошие или плохие) в ваших метриках и выполните описанные выше шаги, чтобы отследить источник виновника и устранить его из ваших данных.

Желаю вам чистых данных, и увидимся на следующей неделе, чтобы узнать о другом выпуске Web Analytics в понедельник.