#WAM: identificare e uccidere i bot di spam

Pubblicato: 2021-08-02

Un picco a sorpresa nei dati? Che emozione . Oh aspetta...

Leoni, tigri e bot spam, oh mio! Gli spambot sono la rovina dell'esistenza dei marketer digitali, che gettano falsi positivi e negativi su tutti i tuoi dati perfettamente puliti.

Sono le pulci dell'analisi dei dati web, che spuntano dal nulla, prendono un boccone veloce e poi scompaiono nella sicurezza del tappeto. Ma cosa sono queste misteriose creature?

Che cos'è uno spambot?

Come definito da Searchexchange , uno spambot è “un programma progettato per raccogliere, o raccogliere, indirizzi e-mail da Internet al fine di creare mailing list per l'invio di e-mail non richieste, noto anche come spam . Uno spambot può raccogliere indirizzi e-mail da siti Web, newsgroup, post di gruppi di interesse speciale (SIG) e conversazioni in chat".

Quindi, in pratica, sono parassiti.

E mentre questi spambot potrebbero rimbalzare sulla sicurezza del tuo sito di livello del Dipartimento della Difesa, mantenendo i tuoi dati sensibili al sicuro, continueranno a rovinare i tuoi dati di analisi web. Quindi diamo un'occhiata a come trovare quei fastidiosi bot ed eliminarli.

1. Identifica lo Spike

Espandi il tuo intervallo di date in analisi e vedi se qualcosa salta fuori come un po' fuori. Quando noti un picco di traffico casuale e acuto, trattieni il tuo entusiasmo, poiché è probabile che sia un'anomalia.

Vedo un bug. Fai? Ingrandiamo l'intervallo di tempo per dare un'occhiata più da vicino.

Oh sì, abbiamo un sospetto dall'aspetto molto sospetto il 27 novembre. Isoliamo quel giorno nel nostro intervallo di date e vediamo come appare.

Centinaia di sessioni tra le 18 e le 19 Interessante…

2. Riconosci il comportamento

Gli spambot vengono solitamente distribuiti in massa, piuttosto che gradualmente. Questo è il loro unico difetto fatale. Tra le 18 e le 19 il 27 novembre è una prova inconfutabile. Tuttavia, questa non è una prova sufficiente per condannare. Abbiamo bisogno di capire un po' di più sul comportamento degli spambots per stabilire il movente.

In genere gli spambot presentano le seguenti caratteristiche:

  • Origine in una posizione geografica.
  • Provengono dallo stesso indirizzo IP.
  • Crea molte sessioni contemporaneamente.
  • Alta frequenza di rimbalzo.
  • Poco tempo sul posto.
  • La sorgente del traffico è solitamente Diretta o Referral.

Con queste caratteristiche in mente, diamo un'occhiata alle metriche di alto livello durante il periodo di tempo sospetto.

Poiché gli spambot in genere sondano solo una pagina alla volta con un cookie univoco, ogni istanza conterà come una sessione, un rimbalzo e un tempo zero sul sito. L'unico motivo per cui le metriche non mostrano una durata media della sessione di 0:00, una frequenza di rimbalzo del 100% e nuove sessioni del 100% in questo caso è probabilmente perché c'erano un paio di visitatori reali mescolati nel set di dati. Tuttavia, questa è una prova abbastanza solida.

3. Isolare la posizione

Le prove stanno costruendo; continuiamo a scavare. Successivamente, esamineremo la posizione del traffico e vedremo se si verificano anomalie. Vai a Pubblico → Geo → Posizione.

Nota le metriche di coinvolgimento insolite provenienti da località statunitensi. Scava nella cartella degli Stati Uniti per vedere se c'è qualcos'altro che risalta.

Sembra improbabile che 349 persone uniche possano desiderare il prodotto del nostro cliente tra le 19:00 e le 20:00 nel weekend del Ringraziamento. Approfondiamo identificando la città.

Ashburn, piccolo insetto subdolo.

4. Identifica la fonte

Ora abbiamo stabilito il luogo del crimine: Ashburn, Virginia. Ora dobbiamo sapere come sono arrivati ​​al sito. Se la nostra teoria è vera, tutto il traffico dovrebbe provenire da una fonte specifica: diretta o referral. Vai su Acquisizione → Tutto il traffico → Sorgente/Mezzo.

C'è il nostro traffico di Ashburn, in arrivo diretto. Questo caso ora è abbastanza a tenuta stagna. Giusto per inchiodare l'ultimo chiodo nella bara, dai un'occhiata alla piattaforma tecnologica che il nostro spammer stava usando per distribuire i suoi bot. Vai a Pubblico → Tecnologia → Rete.

È una schiacciata. Abbiamo spambot. Il nostro lavoro investigativo ha scoperto 349 sessioni di spambot create da una piattaforma Hubspot di Ashburn, Virginia, il 27 novembre tra le 19:00 e le 20:00. Chiuso.

Ora ci resta la domanda su come omettere questi dati errati dalla nostra segnalazione.

Uccidere gli spambot

Purtroppo, nel nostro caso, il danno è già fatto. Non possiamo sovrascrivere o cancellare i dati che sono stati raccolti in Google Analytics. Quello che possiamo fare è impostare un segmento avanzato per omettere i dati dai nostri rapporti. Non "uccidiamo" gli spambot in questo caso, ma piuttosto li nasconderemo dai nostri rapporti.

Vogliamo decidere quale delle caratteristiche sopra descritte è la più unica dal nostro traffico pulito. Quando omettiamo il traffico, vogliamo assicurarci di omettere solo il traffico causato dagli spambot per ridurre al minimo i danni collaterali.

In questo caso, non voglio eliminare il fornitore di servizi Hubspot, poiché è una piattaforma popolare che probabilmente indirizza molto traffico non spam. Dividiamo il periodo di tempo a sei mesi per vedere quanto traffico proviene da Ashburn, Virginia. Forse possiamo semplicemente eliminare il traffico da questa città.

A parte gli spambot, sembra molto raro che riceviamo traffico da Ashburn. Userò Ashburn come nostro fattore comune da eliminare. Vai su "Aggiungi segmento" nella parte superiore dello schermo e fai clic su "Nuovo segmento". Assegna un nome al segmento, quindi fai clic su "Condizioni".

Fai clic sul menu a discesa del filtro su "Escludi", quindi seleziona "Città" e digita "Ashburn". Salva.

E ora la tua segnalazione ometterà il traffico spam. Dai un'occhiata al nostro periodo di tempo per confermare che l'anomalia è stata rimossa.

Spambot, spariti.

Se desideri evitare che il problema si ripeta in futuro, puoi esplorare l'impostazione di filtri nel pannello di amministrazione per escludere completamente il traffico da qualsiasi fonte particolare che hai determinato essere spam. Hai la possibilità di filtrare il traffico da un indirizzo IP specifico o da una fonte di riferimento. L'uso dei filtri impedisce agli spambot di registrarsi nei tuoi dati: devi solo sapere esattamente da dove provengono utilizzando i passaggi precedenti.

Ad esempio, se sapessi che tutti i miei spambot provengono dal dominio " www.spamcentral.com ", andrei al Pannello di amministrazione → Filtri → Crea nuovo filtro. Quindi sceglierei "escludi" e "traffico da questo dominio ISP" e inserirei " www.spamcentral.com ". Ciò impedirà a GA di registrare il traffico proveniente da questo dominio.

Moz fa un ottimo lavoro nello spiegare come salvaguardare i tuoi dati dai parassiti dello spam prima che entrino in casa.

Bot morti

Un buon spambot è uno spambot omesso o filtrato. Distruggono i tuoi dati e inviano ogni sorta di falsi indicatori. Identifica eventuali anomalie (buone o cattive) nelle tue metriche e segui i passaggi precedenti per rintracciare la fonte del colpevole ed eliminarla dai tuoi dati.

Che tu possa avere dati puliti e ci vediamo la prossima settimana per un'altra edizione di Web Analytics lunedì.