#WAM: Identyfikowanie i zabijanie botów spamowych

Opublikowany: 2021-08-02

Zaskakujący wzrost danych? Jak ekscytujące . Zaczekaj…

Lwy, tygrysy i roboty spamujące, o mój! Spamboty są zmorą istnienia marketerów cyfrowych, rzucając fałszywe pozytywy i negatywy na Twoje nieskazitelnie czyste dane.

Są pchłami analityki internetowej, które pojawiają się znikąd, biorą szybki kęs, a następnie znikają w bezpiecznym dywanie. Ale czym są te tajemnicze stworzenia?

Co to jest spambot?

Zgodnie z definicją Searchexchange , spambot to „program przeznaczony do zbierania lub przechwytywania adresów e-mail z Internetu w celu tworzenia list mailingowych do wysyłania niechcianych wiadomości e-mail, znanych również jako spam . Spambot może zbierać adresy e-mail ze stron internetowych, grup dyskusyjnych, postów grup specjalnych (SIG) i rozmów na czacie”.

Więc w zasadzie są pasożytami.

I chociaż te spamboty mogą odbijać się od zabezpieczeń witryny na poziomie Departamentu Obrony, zapewniając bezpieczeństwo poufnych danych, nadal będą niszczyć dane analityki internetowej. Spójrzmy więc, jak znaleźć te nieznośne boty i je wyeliminować.

1. Zidentyfikuj kolec

Rozłóż zakres dat w analityce i zobacz, czy coś nie wydaje się być trochę dziwne. Kiedy zauważysz przypadkowy, ostry wzrost natężenia ruchu, powstrzymaj się od entuzjazmu, ponieważ jest to prawdopodobnie anomalia.

Widzę błąd. Czy ty? Powiększmy ramy czasowe, aby przyjrzeć się bliżej.

O tak, 27 listopada mamy podejrzanego podejrzanego. Wyodrębnijmy ten dzień z naszego zakresu dat i zobaczmy, jak on wygląda.

Setki sesji między 18:00 a 19:00 Ciekawe…

2. Rozpoznaj zachowanie

Spamboty są zwykle wdrażane masowo, a nie stopniowo. To ich jedyna fatalna wada. Między 18:00 a 19:00 27 listopada jest dymiący pistolet. To jednak za mało, by skazać. Aby ustalić motyw, musimy dowiedzieć się nieco więcej o zachowaniu robotów spamujących.

Zazwyczaj spamboty wykazują następujące cechy:

  • Pochodzą z jednej lokalizacji geograficznej.
  • Pochodzą z tego samego adresu IP.
  • Twórz wiele sesji na raz.
  • Wysoki współczynnik odrzuceń.
  • Mało czasu na miejscu.
  • Źródłem odwiedzin jest zazwyczaj Bezpośrednie lub Odesłanie.

Mając na uwadze te cechy, przyjrzyjmy się metrykom wysokiego poziomu w podejrzanym przedziale czasowym.

Ponieważ spamboty zazwyczaj sondują tylko jedną stronę na raz za pomocą unikalnego pliku cookie, każde wystąpienie będzie liczone jako sesja, odrzucenie i czas zerowy w witrynie. Jedynym powodem, dla którego dane nie pokazują średniego czasu trwania sesji 0:00, 100% współczynnika odrzuceń i 100% nowych sesji w tym przypadku, jest prawdopodobnie to, że w zbiorze danych było kilku prawdziwych użytkowników. Niemniej jednak jest to dość solidny dowód.

3. Wyizoluj lokalizację

Dowody się budują; kontynuujmy kopanie. Następnie przyjrzymy się lokalizacji ruchu i zobaczymy, czy pojawiają się jakieś anomalie. Przejdź do Odbiorcy → Geo → Lokalizacja.

Zwróć uwagę na nietypowe dane o zaangażowaniu pochodzące z lokalizacji w USA. Zajrzyj do folderu Stany Zjednoczone, aby zobaczyć, czy coś jeszcze się wyróżnia.

Wydaje się mało prawdopodobne, aby 349 wyjątkowych osób miało ochotę na produkt naszego klienta między 19 a 20 w weekend w Święto Dziękczynienia. Wejdźmy głębiej, identyfikując miasto.

Ashburn, podstępny mały robale.

4. Zidentyfikuj źródło

Ustaliliśmy teraz miejsce zbrodni: Ashburn w Wirginii. Teraz musimy wiedzieć, jak dostali się na miejsce. Jeśli nasza teoria jest prawdziwa, cały ruch powinien pochodzić z jednego konkretnego źródła: bezpośredniego lub odesłania. Przejdź do Pozyskiwanie → Cały ruch → Źródło/medium.

Mamy ruch w Ashburn, jadący bezpośrednio. Ta sprawa jest teraz całkiem szczelna. Aby przybić ostatni gwóźdź do trumny, spójrz na platformę technologiczną, której nasz spamer używał do wdrażania swoich botów. Przejdź do Odbiorcy → Technologia → Sieć.

To strzał w dziesiątkę. Mamy roboty spamujące. Nasza praca detektywistyczna wykryła 349 sesji spambotów utworzonych z platformy Hubspot w Ashburn w stanie Wirginia, 27 listopada między godziną 19:00 a 20:00. Zamknięte.

Pozostaje nam teraz pytanie, jak pominąć te złe dane w naszych raportach.

Zabijanie robotów spamujących

Niestety w naszym przypadku szkoda już się dokonała. Nie możemy nadpisać ani usunąć danych zebranych w Google Analytics. To, co możemy zrobić, to skonfigurować segment zaawansowany, aby pominąć dane z naszego raportowania. W tym przypadku nie będziemy „zabijać” robotów spamujących, ale raczej ukrywamy je przed naszymi raportami.

Chcemy zdecydować, która z przedstawionych powyżej cech jest najbardziej wyjątkowa z naszego czystego ruchu. Pomijając ruch, chcemy mieć pewność, że pomijamy tylko ruch powodowany przez spamboty, aby zminimalizować szkody uboczne.

W tym przypadku nie chcę eliminować dostawcy usług Hubspot, ponieważ jest to popularna platforma, która prawdopodobnie napędza dużo ruchu niebędącego spamem. Rozłóżmy okres do sześciu miesięcy, aby zobaczyć, jak duży ruch pochodzi z Ashburn w stanie Wirginia. Być może uda nam się po prostu wyeliminować ruch z tego miasta.

Oprócz spambotów bardzo rzadko otrzymujemy ruch z Ashburn. Użyję Ashburn jako naszego wspólnego czynnika do wyeliminowania. Przejdź do „Dodaj segment” u góry ekranu i kliknij „Nowy segment”. Nazwij swój segment, a następnie kliknij „Warunki”.

Kliknij listę rozwijaną filtrów na „Wyklucz”, a następnie wybierz „Miasto” i wpisz „Ashburn”. Ratować.

A teraz Twoje raportowanie pominie ruch spamowy. Spójrz na nasz okres, aby potwierdzić, że anomalia została usunięta.

Spamboty zniknęły.

Jeśli chcesz zapobiec ponownemu wystąpieniu problemu w przyszłości, możesz zapoznać się z konfiguracją filtrów w panelu administracyjnym, aby całkowicie wykluczyć ruch z dowolnego źródła, które uznasz za spam. Masz możliwość filtrowania ruchu z określonego adresu IP lub źródła odesłań. Korzystanie z filtrów zapobiega rejestrowaniu się spambotów w Twoich danych — wystarczy dokładnie wiedzieć, skąd pochodzą, korzystając z powyższych kroków.

Na przykład, gdybym wiedział, że wszystkie moje spamboty pochodzą z domeny „ www.spamcentral.com ”, przeszłbym do panelu administratora → Filtry → Utwórz nowy filtr. Następnie wybrałbym „wyklucz” i „ruch z tej domeny dostawcy usług internetowych” i wpisz „ www.spamcentral.com ”. Uniemożliwi to GA rejestrowanie ruchu pochodzącego z tej domeny.

Moz wykonuje świetną robotę, wyjaśniając, jak chronić swoje dane przed pasożytami spamu, zanim dostaną się do drzwi.

Martwe boty

Dobry spambot to pominięty lub przefiltrowany spambot. Sieją spustoszenie w Twoich danych i wysyłają różnego rodzaju fałszywe wskaźniki. Zidentyfikuj wszelkie anomalie (zarówno dobre, jak i złe) w swoich metrykach i wykonaj powyższe kroki, aby wyśledzić źródło winowajcy i wyeliminować go z danych.

Obyś miał czyste dane i do zobaczenia w przyszłym tygodniu w kolejnej edycji Web Analytics poniedziałek.