#WAM: Mengidentifikasi dan membunuh bot spam
Diterbitkan: 2021-08-02Lonjakan data yang mengejutkan? Bagaimana menarik . Oh tunggu…
Singa dan harimau dan bot spam, astaga! Spambot adalah kutukan keberadaan pemasar digital, melemparkan positif dan negatif palsu ke seluruh data bersih Anda yang melengking.
Mereka adalah kutu analitik web, muncul entah dari mana, menggigit cepat, lalu menghilang ke karpet. Tapi apa makhluk misterius ini?
Apa itu robot spam?
Seperti yang didefinisikan oleh Searchexchange , robot spam adalah “sebuah program yang dirancang untuk mengumpulkan, atau memanen, alamat email dari Internet untuk membangun milis untuk mengirim email yang tidak diminta, juga dikenal sebagai spam . Spambot dapat mengumpulkan alamat email dari situs Web, newsgroup, posting kelompok minat khusus (SIG), dan percakapan di ruang obrolan.
Jadi pada dasarnya, mereka adalah parasit.
Dan sementara robot spam ini mungkin memantul dari keamanan situs tingkat Departemen Pertahanan Anda, menjaga keamanan data sensitif Anda, mereka masih akan mengacaukan data analisis web Anda. Jadi mari kita lihat bagaimana menemukan bot sial itu dan menghilangkannya.
1. Identifikasi Paku
Sebarkan rentang tanggal Anda dalam analitik dan lihat apakah ada yang sedikit meleset. Saat Anda melihat lonjakan lalu lintas yang acak dan tajam, tahan antusiasme Anda, karena kemungkinan itu adalah anomali.
Saya melihat bug. Apakah kamu? Mari kita perbesar kerangka waktu untuk melihat lebih dekat.
Oh ya, kami memiliki tersangka yang terlihat sangat mencurigakan pada 27 November. Mari kita pisahkan hari itu dalam rentang tanggal kita dan lihat seperti apa.
Ratusan sesi antara pukul 6 dan 7 malam. Menarik…
2. Kenali Perilaku
Spambot biasanya digunakan secara massal, bukan secara bertahap. Ini adalah salah satu kesalahan fatal mereka. Antara 6 dan 7 malam 27 November adalah senjata merokok. Namun, ini tidak cukup bukti untuk menghukum. Kita perlu memahami sedikit lebih banyak tentang perilaku robot spam untuk menetapkan motif.
Biasanya robot spam menampilkan karakteristik berikut:
- Berasal dari satu lokasi geografis.
- Berasal dari alamat IP yang sama.
- Buat banyak sesi sekaligus.
- Tingkat bouncing yang tinggi.
- Waktu rendah di situs.
- Sumber lalu lintas biasanya Langsung atau Rujukan.
Dengan mempertimbangkan karakteristik ini, mari kita lihat metrik tingkat tinggi selama jangka waktu yang dicurigai.
Karena robot spam biasanya hanya menyelidiki satu halaman dalam satu waktu dengan cookie unik, setiap kejadian akan dihitung sebagai sesi, pantulan, dan waktu nol di situs. Satu-satunya alasan metrik tidak menunjukkan durasi sesi rata-rata 0:00, rasio pentalan 100%, dan sesi baru 100% dalam contoh ini mungkin karena ada beberapa pengunjung asli yang digabungkan ke dalam kumpulan data. Namun demikian, ini adalah bukti yang cukup kuat.
3. Lokasi Terisolasi
Bukti sedang membangun; mari terus menggali. Selanjutnya, kita akan melihat lokasi lalu lintas dan melihat apakah ada anomali yang muncul. Buka Audiens → Geografis → Lokasi.
Perhatikan metrik keterlibatan yang tidak biasa yang berasal dari lokasi AS. Gali ke dalam folder Amerika Serikat untuk melihat apakah ada hal lain yang menonjol.
Tampaknya tidak mungkin bahwa 349 orang unik akan mendambakan produk klien kami antara pukul 7 dan 8 malam pada akhir pekan Thanksgiving. Mari kita masuk lebih dalam dengan mengidentifikasi kota.
Ashburn, kau serangga kecil yang licik.
4. Identifikasi Sumbernya
Kami sekarang telah menetapkan lokasi kejahatan: Ashburn, Virginia. Sekarang kita perlu tahu bagaimana mereka sampai ke situs. Jika teori kami benar, semua lalu lintas harus berasal dari satu sumber tertentu: Langsung atau Rujukan. Buka Akuisisi → Semua Lalu Lintas → Sumber/Media.
Ada lalu lintas Ashburn kami, datang langsung. Kasus ini sekarang cukup kedap air. Hanya untuk memakukan paku terakhir di peti mati, lihat platform Teknologi yang digunakan spammer kami untuk menyebarkan botnya. Buka Audiens → Teknologi → Jaringan.
Ini adalah slam dunk. Kami memiliki robot spam. Pekerjaan detektif kami telah menemukan 349 sesi robot spam yang dibuat dari platform Hubspot di Ashburn, Virginia, 27 November antara pukul 7 dan 8 malam. Tertutup.
Sekarang kita dihadapkan pada pertanyaan tentang bagaimana menghilangkan data buruk ini dari pelaporan kita.
Membunuh Spambot
Sayangnya, dalam kasus kami, kerusakan sudah terjadi. Kami tidak dapat menimpa atau menghapus data yang dikumpulkan di Google Analytics. Yang dapat kami lakukan adalah menyiapkan Segmen Lanjutan untuk menghilangkan data dari pelaporan kami. Kami tidak akan "membunuh" robot spam dalam hal ini, melainkan menyembunyikan mereka dari pelaporan kami.
Kami ingin memutuskan karakteristik mana yang diuraikan di atas yang paling unik dari lalu lintas bersih kami. Saat menghilangkan lalu lintas, kami ingin memastikan bahwa kami hanya menghilangkan lalu lintas yang disebabkan oleh robot spam untuk meminimalkan kerusakan tambahan.
Dalam hal ini, saya tidak ingin menghilangkan penyedia layanan Hubspot, karena itu adalah platform populer yang mungkin mendorong banyak lalu lintas non-spam. Mari kita sebarkan periode waktu hingga enam bulan untuk melihat berapa banyak lalu lintas yang berasal dari Ashburn, Virginia. Mungkin kita bisa menghilangkan lalu lintas dari kota ini.
Selain robot spam, sepertinya sangat jarang kita mendapatkan traffic dari Ashburn. Saya akan menggunakan Ashburn sebagai faktor umum kita untuk dihilangkan. Buka "Tambah Segmen" di bagian atas layar dan klik "Segmen Baru". Beri nama segmen Anda, lalu klik “Ketentuan”.
Klik tarik-turun filter ke "Kecualikan," lalu pilih "Kota" dan ketik "Ashburn." Menyimpan.
Dan sekarang pelaporan Anda akan menghilangkan lalu lintas spam. Lihatlah periode waktu kami untuk mengonfirmasi bahwa anomali telah dihapus.
Spambot, hilang.
Jika Anda ingin mencegah masalah terjadi lagi di masa mendatang, Anda dapat menjelajahi pengaturan filter di panel admin Anda untuk sepenuhnya mengecualikan lalu lintas dari sumber tertentu yang Anda tentukan sebagai spam. Anda memiliki opsi untuk memfilter lalu lintas dari alamat IP tertentu, atau sumber rujukan. Menggunakan filter mencegah robot spam untuk tidak pernah mendaftar di data Anda — Anda hanya perlu tahu persis dari mana mereka berasal menggunakan langkah-langkah di atas.
Misalnya, jika saya tahu semua robot spam saya berasal dari domain “ www.spamcentral.com ,” saya akan membuka panel Admin → Filter → Buat filter baru. Saya kemudian akan memilih "kecualikan" dan "lalu lintas dari domain ISP ini" dan masukkan " www.spamcentral.com ." Ini akan mencegah GA untuk mencatat lalu lintas yang berasal dari domain ini.
Moz menjelaskan dengan baik cara melindungi data Anda dari parasit spam sebelum mereka masuk.
bot mati
Spambot yang baik adalah spambot yang dihilangkan atau difilter. Mereka mendatangkan malapetaka pada data Anda dan mengirim segala macam indikator palsu. Identifikasi setiap anomali (baik atau buruk) dalam metrik Anda dan ikuti langkah-langkah di atas untuk melacak sumber penyebab untuk menghilangkannya dari data Anda.
Semoga Anda memiliki data yang bersih, dan kami akan melihat Anda minggu depan untuk edisi lain Web Analytics hari Senin.