#WAM: Identificando e eliminando bots de spam

Publicados: 2021-08-02

Um pico surpresa nos dados? Que emocionante . Oh espere…

Leões, tigres e bots de spam, meu Deus! Os spambots são a ruína da existência dos profissionais de marketing digital, lançando falsos positivos e negativos em todos os seus dados completamente limpos.

Eles são as pulgas da análise da web, surgindo do nada, dando uma mordida rápida e, em seguida, desaparecendo na segurança do tapete. Mas o que são essas criaturas misteriosas?

O que é um spambot?

Conforme definido pela Searchexchange , um spambot é “um programa projetado para coletar, ou colher, endereços de e-mail da Internet a fim de construir listas de mala direta para o envio de e-mail não solicitado, também conhecido como spam . Um spambot pode reunir endereços de e-mail de sites, grupos de notícias, postagens de grupos de interesse especial (SIG) e conversas em salas de bate-papo. ”

Então, basicamente, eles são parasitas.

E, embora esses spambots possam estar ricocheteando na segurança do site do Departamento de Defesa, mantendo seus dados confidenciais protegidos, eles ainda vão bagunçar seus dados analíticos da web. Então, vamos ver como encontrar esses bots irritantes e eliminá-los.

1. Identifique o pico

Espalhe seu intervalo de datas nas análises e veja se alguma coisa parece um pouco errada. Quando você notar um pico aleatório e agudo no tráfego, contenha o entusiasmo, pois provavelmente é uma anomalia.

Eu vejo um bug. Você? Vamos ampliar o período de tempo para ver mais de perto.

Oh sim, temos um suspeito que parece muito suspeito em 27 de novembro. Vamos isolar esse dia em nosso intervalo de datas e ver como ele se parece.

Centenas de sessões entre 18h e 19h. Interessante ...

2. Reconhecer o comportamento

Spambots geralmente são implantados em massa, ao invés de gradualmente. Esta é sua única falha fatal. Entre as 18h e as 19h, o dia 27 de novembro é uma arma fumegante. No entanto, isso não é evidência suficiente para condenar. Precisamos entender um pouco mais sobre o comportamento dos spambots para estabelecer o motivo.

Normalmente, os spambots exibem as seguintes características:

  • Origine-se em uma localização geográfica.
  • Venha do mesmo endereço IP.
  • Crie muitas sessões de uma vez.
  • Alta taxa de rejeição.
  • Pouco tempo no local.
  • A origem do tráfego geralmente é direta ou de referência.

Com essas características em mente, vamos dar uma olhada nas métricas de alto nível durante o período de tempo suspeito.

Como os spambots normalmente investigam apenas uma página por vez com um cookie exclusivo, cada instância contará como uma sessão, uma rejeição e tempo zero no site. A única razão pela qual as métricas não mostram uma duração média da sessão de 0:00, 100% de taxa de rejeição e 100% de novas sessões nesta instância é provavelmente porque havia alguns visitantes reais misturados no conjunto de dados. No entanto, esta é uma evidência bastante sólida.

3. Isole a localização

A evidência está crescendo; vamos continuar cavando. A seguir, veremos a localização do tráfego e veremos se há alguma anomalia. Vá para Público → Geográfico → Localização.

Observe as métricas de engajamento incomuns provenientes de locais dos EUA. Explore a pasta dos Estados Unidos para ver se algo mais se destaca.

Parece improvável que 349 pessoas únicas desejassem o produto de nosso cliente entre 19h e 20h no fim de semana de Ação de Graças. Vamos nos aprofundar identificando a cidade.

Ashburn, seu pequeno inseto sorrateiro.

4. Identifique a fonte

Já estabelecemos a localização do crime: Ashburn, Virgínia. Agora precisamos saber como eles chegaram ao site. Se nossa teoria for verdadeira, todo o tráfego deve vir de uma fonte específica: direto ou de referência. Vá para Aquisição → Todo o tráfego → Origem / mídia.

Aqui está o nosso tráfego de Ashburn, vindo direto. Este caso agora é bastante estanque. Só para acertar o prego final no caixão, dê uma olhada na plataforma de tecnologia que nosso spammer estava usando para implantar seus bots. Vá para Público → Tecnologia → Rede.

É uma enterrada forte. Temos spambots. Nosso trabalho de detetive descobriu 349 sessões de spambot criadas a partir de uma plataforma Hubspot em Ashburn, Virgínia, em 27 de novembro, entre 19h e 20h. Fechado.

Agora, ficamos com a questão de como omitir esses dados ruins de nossos relatórios.

Matando Spambots

Infelizmente, em nosso caso, o estrago já está feito. Não podemos substituir ou excluir os dados coletados no Google Analytics. O que podemos fazer é configurar um segmento avançado para omitir os dados de nossos relatórios. Não estaremos “matando” os spambots neste caso, mas sim escondendo-os de nossos relatórios.

Queremos decidir qual das características descritas acima é a mais exclusiva de nosso tráfego limpo. Ao omitir o tráfego, queremos garantir que estamos omitindo apenas o tráfego causado pelos spambots para minimizar os danos colaterais.

Nesse caso, não quero eliminar o provedor de serviços Hubspot, pois é uma plataforma popular que provavelmente gera uma grande quantidade de tráfego que não é de spam. Vamos estender o período de seis meses para ver quanto tráfego vem de Ashburn, Virgínia. Talvez possamos simplesmente eliminar o tráfego desta cidade.

Além de spambots, parece muito raro recebermos tráfego de Ashburn. Vou usar Ashburn como nosso fator comum para eliminar. Vá para “Adicionar segmento” na parte superior da tela e clique em “Novo segmento”. Nomeie seu segmento e clique em “Condições”.

Clique na lista suspensa do filtro para “Excluir”, selecione “Cidade” e digite “Ashburn”. Salvar.

E agora seu relatório irá omitir o tráfego de spam. Dê uma olhada em nosso período de tempo para confirmar se a anomalia foi removida.

Spambots, sumiram.

Se quiser evitar que o problema aconteça novamente no futuro, você pode explorar a configuração de filtros no painel de administração para excluir completamente o tráfego de qualquer fonte específica que você determinou ser spam. Você tem a opção de filtrar o tráfego de um endereço IP específico ou fonte de referência. O uso de filtros evita que os spambots sempre se registrem em seus dados - você só precisa saber exatamente de onde eles estão vindo usando as etapas acima.

Por exemplo, se eu soubesse que todos os meus spambots vinham do domínio “ www.spamcentral.com ,” eu iria para o painel do administrador → Filtros → Criar novo filtro. Eu escolheria “excluir” e “tráfego deste domínio ISP” e inserir “ www.spamcentral.com ”. Isso impedirá que o GA registre o tráfego proveniente deste domínio.

Moz faz um ótimo trabalho ao explicar como proteger seus dados de parasitas de spam antes que eles entrem pela porta.

Bots mortos

Um bom spambot é um spambot omitido ou filtrado. Eles causam estragos em seus dados e enviam todos os tipos de indicadores falsos. Identifique quaisquer anomalias (boas ou ruins) em suas métricas e siga as etapas acima para rastrear a origem do culpado e eliminá-lo de seus dados.

Que você tenha dados limpos e nos veremos na próxima semana para outra edição do Web Analytics na segunda-feira.