#WAM: identificación y eliminación de robots de spam

Publicado: 2021-08-02

¿Un aumento sorprendente en los datos? Qué emocionante . Oh espera…

Leones y tigres y robots de spam, ¡oh Dios! Los robots de spam son la pesadilla de la existencia de los especialistas en marketing digital, que arrojan falsos positivos y negativos a todos sus datos absolutamente limpios.

Son las pulgas de la analítica web, que surgen de la nada, dan un mordisco rápido y luego desaparecen en la seguridad de la alfombra. Pero, ¿qué son estas misteriosas criaturas?

¿Qué es un spambot?

Según la definición de Searchexchange , un spambot es “un programa diseñado para recopilar, o recolectar, direcciones de correo electrónico de Internet con el fin de crear listas de correo para enviar correos electrónicos no solicitados, también conocidos como spam . Un spambot puede recopilar direcciones de correo electrónico de sitios web, grupos de noticias, publicaciones de grupos de intereses especiales (SIG) y conversaciones en salas de chat ".

Entonces, básicamente, son parásitos.

Y aunque estos spambots pueden estar rebotando en la seguridad de su sitio de grado del Departamento de Defensa, manteniendo sus datos confidenciales seguros, todavía arruinarán sus datos de análisis web. Así que veamos cómo encontrar esos molestos bots y eliminarlos.

1. Identifica el pico

Extienda su rango de fechas en análisis y vea si algo sobresale como un poco fuera de lugar. Cuando note un aumento brusco y aleatorio en el tráfico, retenga su entusiasmo, ya que probablemente sea una anomalía.

Veo un error. ¿Vos si? Acerquemos el marco de tiempo para verlo más de cerca.

Oh, sí, tenemos un sospechoso de aspecto muy sospechoso el 27 de noviembre. Aíslemos ese día en nuestro rango de fechas y veamos cómo se ve.

Cientos de sesiones entre las 6 y las 7 pm Interesante…

2. Reconocer el comportamiento

Los spambots generalmente se implementan en masa, en lugar de gradualmente. Este es su único defecto fatal. Entre las 6 y las 7 pm, el 27 de noviembre es una prueba irrefutable. Sin embargo, esta no es evidencia suficiente para condenar. Necesitamos entender un poco más sobre el comportamiento de los robots de spam para poder establecer el motivo.

Normalmente, los spambots muestran las siguientes características:

  • Originarse en una ubicación geográfica.
  • Provienen de la misma dirección IP.
  • Crea muchas sesiones a la vez.
  • Alta tasa de rebote.
  • Poco tiempo en el sitio.
  • La fuente de tráfico suele ser directa o de referencia.

Con estas características en mente, echemos un vistazo a las métricas de alto nivel durante el período de tiempo sospechoso.

Debido a que los spambots generalmente sondean solo una página a la vez con una cookie única, cada instancia contará como una sesión, un rebote y un tiempo cero en el sitio. La única razón por la que las métricas no muestran una duración de sesión promedio de 0:00, una tasa de rebote del 100% y sesiones nuevas del 100% en este caso es probablemente porque hubo un par de visitantes reales mezclados en el conjunto de datos. Sin embargo, esta es una evidencia bastante sólida.

3. Aislar la ubicación

La evidencia se está construyendo; sigamos cavando. A continuación, observaremos la ubicación del tráfico y veremos si surge alguna anomalía. Vaya a Audiencia → Geo → Ubicación.

Tenga en cuenta las métricas de participación inusuales que provienen de ubicaciones de EE. UU. Busque en la carpeta de Estados Unidos para ver si hay algo más que se destaque.

Parece poco probable que 349 personas únicas tengan ansias por el producto de nuestro cliente entre las 7 y las 8 pm el fin de semana de Acción de Gracias. Profundicemos identificando la ciudad.

Ashburn, pequeño bicho astuto.

4. Identificar la fuente

Ahora hemos establecido la ubicación del crimen: Ashburn, Virginia. Ahora necesitamos saber cómo llegaron al sitio. Si nuestra teoría es cierta, todo el tráfico debería provenir de una fuente específica: directa o de referencia. Vaya a Adquisición → Todo el tráfico → Fuente / Medio.

Ahí está nuestro tráfico de Ashburn, entrando en Directo. Este caso ahora es bastante hermético. Solo para clavar el último clavo en el ataúd, eche un vistazo a la plataforma tecnológica que nuestro spammer estaba usando para implementar sus bots. Vaya a Audiencia → Tecnología → Red.

Es un mate. Tenemos spambots. Nuestro trabajo de detective ha descubierto 349 sesiones de spambot creadas a partir de una plataforma Hubspot en Ashburn, Virginia, el 27 de noviembre entre las 7 y las 8 pm Caso. Cerrado.

Ahora nos queda la pregunta de cómo omitir estos datos erróneos de nuestros informes.

Matando Spambots

Desafortunadamente, en nuestro caso, el daño ya está hecho. No podemos sobrescribir ni eliminar los datos recopilados en Google Analytics. Lo que podemos hacer es configurar un segmento avanzado para omitir los datos de nuestros informes. En este caso, no "mataremos" a los spambots, sino que los ocultaremos de nuestros informes.

Queremos decidir cuál de las características descritas anteriormente es la más exclusiva de nuestro tráfico limpio. Al omitir el tráfico, queremos asegurarnos de que estamos omitiendo solo el tráfico causado por los spambots para minimizar los daños colaterales.

En este caso, no quiero eliminar el proveedor de servicios de Hubspot, ya que es una plataforma popular que probablemente genera mucho tráfico que no es spam. Extienda el período de tiempo a seis meses para ver cuánto tráfico proviene de Ashburn, Virginia. Quizás simplemente podamos eliminar el tráfico de esta ciudad.

Aparte de los spambots, parece muy raro que recibamos tráfico de Ashburn. Voy a usar Ashburn como nuestro factor común para eliminar. Vaya a "Agregar segmento" en la parte superior de la pantalla y haga clic en "Nuevo segmento". Nombre su segmento, luego haga clic en "Condiciones".

Haga clic en el menú desplegable del filtro para "Excluir", luego seleccione "Ciudad" y escriba "Ashburn". Salvar.

Y ahora sus informes omitirán el tráfico de spam. Eche un vistazo a nuestro período de tiempo para confirmar que se ha eliminado la anomalía.

Spambots, desaparecidos.

Si desea evitar que el problema vuelva a suceder en el futuro, puede explorar la configuración de filtros en su panel de administración para excluir completamente el tráfico de cualquier fuente en particular que haya determinado que es spam. Tiene la opción de filtrar el tráfico de una dirección IP específica o una fuente de referencia. El uso de filtros evita que los spambots se registren en sus datos; solo tiene que saber exactamente de dónde provienen mediante los pasos anteriores.

Por ejemplo, si supiera que todos mis spambots provienen del dominio “ www.spamcentral.com ”, iría al panel de administración → Filtros → Crear nuevo filtro. Luego, elegiría "excluir" y "tráfico de este dominio de ISP" e ingresaría " www.spamcentral.com ". Esto evitará que GA registre el tráfico que proviene de este dominio.

Moz hace un gran trabajo al explicar cómo proteger sus datos de los parásitos de spam antes de que entren por la puerta.

Bots muertos

Un buen spambot es un spambot omitido o filtrado. Causan estragos en sus datos y envían todo tipo de indicadores falsos. Identifique cualquier anomalía (buena o mala) en sus métricas y siga los pasos anteriores para rastrear el origen del culpable y eliminarlo de sus datos.

Que tenga datos limpios, y nos vemos la semana que viene para otra edición de Web Analytics el lunes.