#WAM: การระบุและกำจัดสแปมบอท

เผยแพร่แล้ว: 2021-08-02

ข้อมูลเพิ่มขึ้นอย่างน่าประหลาดใจ? น่าตื่นเต้นขนาดไหน . โอ้รอ…

สิงโต เสือ และสแปมบอท โธ่เว้ย! สแปมบอทคือความหายนะของการดำรงอยู่ของนักการตลาดดิจิทัล โดยโยนข้อดีและข้อเสียที่ผิดพลาดไปทั่วข้อมูลที่ชัดเจนของคุณ

พวกมันคือหมัดของการวิเคราะห์เว็บ โผล่ขึ้นมาจากที่ไหนสักแห่ง กัดอย่างรวดเร็ว แล้วหายเข้าไปในความปลอดภัยของพรม แต่สิ่งมีชีวิตลึกลับเหล่านี้คืออะไร?

สแปมบอทคืออะไร?

ตามที่กำหนดโดย Searchexchange เป็นสแปมคือ“โปรแกรมที่ออกแบบมาเพื่อเก็บรวบรวมหรือเก็บเกี่ยวที่อยู่อีเมลจากอินเทอร์เน็ตเพื่อสร้างรายการทางสำหรับการส่งอีเมลที่ไม่พึงประสงค์ยังเป็นที่รู้จักว่าเป็นสแปม สแปมบอทสามารถรวบรวมที่อยู่อีเมลจากเว็บไซต์ กลุ่มข่าว การโพสต์กลุ่มความสนใจพิเศษ (SIG) และการสนทนาในห้องสนทนา”

โดยพื้นฐานแล้วพวกมันเป็นปรสิต

และในขณะที่สแปมบอทเหล่านี้อาจตีกลับการรักษาความปลอดภัยไซต์ระดับกระทรวงกลาโหมของคุณ การรักษาข้อมูลที่สำคัญของคุณให้ปลอดภัย พวกเขายังคงทำให้ข้อมูลการวิเคราะห์เว็บของคุณเสียหาย มาดูวิธีค้นหาบอทที่น่ารำคาญและกำจัดพวกมันกัน

1. ระบุเข็ม

กระจายช่วงวันที่ของคุณในการวิเคราะห์และดูว่ามีอะไรเกิดขึ้นบ้างหรือไม่ เมื่อคุณสังเกตเห็นการจราจรที่พุ่งสูงขึ้นแบบสุ่มๆ อย่างรวดเร็ว ให้ระงับความกระตือรือร้นของคุณไว้ เนื่องจากอาจเป็นสิ่งผิดปกติ

ฉันเห็นข้อผิดพลาด NS? มาซูมเข้าในกรอบเวลาเพื่อดูรายละเอียดกัน

อ๋อ เรามีผู้ต้องสงสัยหน้าตาน่าสงสัยมาก เมื่อวันที่ 27 พ.ย. ลองแยกวันนั้นออกจากช่วงวันที่ของเราและดูว่าเป็นอย่างไร

หลายร้อยช่วงระหว่าง 18:00 ถึง 19:00 น. น่าสนใจ…

2. รับรู้พฤติกรรม

สแปมบอทมักจะถูกนำไปใช้เป็นจำนวนมาก แทนที่จะค่อยๆ นี่เป็นข้อบกพร่องร้ายแรงอย่างหนึ่งของพวกเขา ระหว่าง 6 ถึง 19.00 น. วันที่ 27 พ.ย. เป็นปืนสูบบุหรี่ อย่างไรก็ตาม หลักฐานนี้ไม่เพียงพอที่จะตัดสินลงโทษ เราจำเป็นต้องเข้าใจพฤติกรรมของสแปมบอทให้มากขึ้นอีกนิดเพื่อสร้างแรงจูงใจ

โดยทั่วไปแล้วสแปมบอทจะแสดงลักษณะดังต่อไปนี้:

  • มีต้นกำเนิดมาจากที่ตั้งทางภูมิศาสตร์แห่งเดียว
  • มาจากที่อยู่ IP เดียวกัน
  • สร้างหลายเซสชันพร้อมกัน
  • อัตราตีกลับสูง
  • เวลาน้อยบนไซต์
  • แหล่งที่มาของการเข้าชมมักจะเป็นโดยตรงหรืออ้างอิง

เมื่อคำนึงถึงคุณลักษณะเหล่านี้ มาดูเมตริกระดับสูงในช่วงเวลาที่น่าสงสัยกัน

เนื่องจากโดยทั่วไปแล้วสแปมบอทจะตรวจสอบเพียงหน้าเดียวในแต่ละครั้งด้วยคุกกี้ที่ไม่ซ้ำกัน ทุกอินสแตนซ์จะนับเป็นเซสชัน การตีกลับ และเวลาบนไซต์เป็นศูนย์ เหตุผลเดียวที่ตัววัดไม่แสดงระยะเวลาเซสชันเฉลี่ย 0:00 น อัตราตีกลับ 100% และเซสชันใหม่ 100% ในตัวอย่างนี้อาจเป็นเพราะมีผู้เข้าชมจริงสองสามรายปะปนกันในชุดข้อมูล อย่างไรก็ตาม นี่เป็นหลักฐานที่ค่อนข้างชัดเจน

3. แยกสถานที่

หลักฐานกำลังสร้าง มาขุดกันต่อ ต่อไปเราจะดูที่ตั้งของการจราจรและดูว่ามีสิ่งผิดปกติเกิดขึ้นหรือไม่ ไปที่ผู้ชม → ภูมิศาสตร์ → ที่ตั้ง

สังเกตเมตริกการมีส่วนร่วมที่ผิดปกติซึ่งมาจากสถานที่ในสหรัฐอเมริกา เจาะลึกเข้าไปในโฟลเดอร์ United States เพื่อดูว่ามีอะไรโดดเด่นอีกหรือไม่

ดูเหมือนไม่น่าเป็นไปได้ที่ 349 คนที่ไม่ซ้ำกันจะมีความอยากในผลิตภัณฑ์ของลูกค้าของเราระหว่างเวลา 19.00 น. ถึง 20.00 น. วันหยุดสุดสัปดาห์วันขอบคุณพระเจ้า มาเจาะลึกกันด้วยการระบุเมือง

แอชเบิร์น เจ้าแมลงตัวน้อยส่อเสียด

4. ระบุแหล่งที่มา

ขณะนี้เราได้กำหนดที่ตั้งของอาชญากรรมแล้ว: แอชเบิร์น รัฐเวอร์จิเนีย ตอนนี้เราต้องรู้ว่าพวกเขามาที่ไซต์ได้อย่างไร หากทฤษฎีของเราเป็นจริง การรับส่งข้อมูลทั้งหมดควรมาจากแหล่งใดแหล่งหนึ่งโดยเฉพาะ: โดยตรงหรือการอ้างอิง ไปที่ การได้มา → การเข้าชมทั้งหมด → แหล่งที่มา/สื่อ

มีการจราจร Ashburn ของเรา กำลังมาทางตรง เคสนี้ค่อนข้างกันน้ำได้ เพียงเพื่อตอกตะปูสุดท้ายในโลงศพ ให้ดูที่แพลตฟอร์มเทคโนโลยีที่นักส่งสแปมของเราใช้ในการปรับใช้บอทของเขาหรือเธอ ไปที่ผู้ชม → เทคโนโลยี → เครือข่าย

มันคือสแลมดังค์ เรามีสแปมบอท งานนักสืบของเราได้ค้นพบ 349 เซสชันสแปมบอทที่สร้างขึ้นจากแพลตฟอร์ม Hubspot ในเมือง Ashburn รัฐเวอร์จิเนีย วันที่ 27 พ.ย. ระหว่าง 19.00 น. ถึง 20.00 น. ปิด.

ตอนนี้เราเหลือคำถามว่าจะละเว้นข้อมูลที่ไม่ดีนี้ออกจากการรายงานของเราได้อย่างไร

ฆ่าสแปมบอท

น่าเสียดาย ในกรณีของเรา ความเสียหายได้เกิดขึ้นแล้ว เราไม่สามารถเขียนทับหรือลบข้อมูลที่รวบรวมใน Google Analytics สิ่งที่เราทำได้คือตั้งค่ากลุ่มขั้นสูงเพื่อละเว้นข้อมูลในการรายงานของเรา เราจะไม่ "ฆ่า" สแปมบอทในกรณีนี้ แต่จะซ่อนไม่ให้รายงานของเรา

เราต้องการตัดสินใจว่าคุณลักษณะใดที่กล่าวถึงข้างต้นเป็นเอกลักษณ์ที่สุดจากการรับส่งข้อมูลที่สะอาดของเรา เมื่อละเว้นการรับส่งข้อมูล เราต้องการให้แน่ใจว่าเรากำลังละเว้น เฉพาะ การรับส่งข้อมูลที่เกิดจากสแปมบอทเพื่อลดความเสียหายหลักประกัน

ในกรณีนี้ ฉันไม่ต้องการกำจัดผู้ให้บริการ Hubspot เนื่องจากเป็นแพลตฟอร์มยอดนิยมที่อาจกระตุ้นปริมาณการใช้งานที่ไม่ใช่สแปมจำนวนมาก มาแบ่งช่วงเวลาเป็นหกเดือนเพื่อดูว่ามีการเข้าชมจาก Ashburn รัฐเวอร์จิเนียมากน้อยเพียงใด บางทีเราสามารถกำจัดการจราจรจากเมืองนี้ได้

นอกจากสแปมบอทแล้ว ดูเหมือนหายากมากที่เราจะได้รับการเข้าชมจากแอชเบิร์น ฉันจะใช้แอชเบิร์นเป็นปัจจัยร่วมในการกำจัด ไปที่ "เพิ่มกลุ่ม" ที่ด้านบนของหน้าจอแล้วคลิก "กลุ่มใหม่" ตั้งชื่อกลุ่มของคุณ แล้วคลิก "เงื่อนไข"

คลิกเมนูแบบเลื่อนลงตัวกรองเพื่อ "ยกเว้น" จากนั้นเลือก "เมือง" แล้วพิมพ์ "Ashburn" บันทึก.

และตอนนี้การรายงานของคุณจะละเว้นการรับส่งข้อมูลที่เป็นสแปม ดูช่วงเวลาของเราเพื่อยืนยันว่าได้ลบความผิดปกติแล้ว

สแปมบอทหายไป

หากคุณต้องการป้องกันไม่ให้ปัญหาเกิดขึ้นอีกในอนาคต คุณสามารถสำรวจการตั้งค่าตัวกรองในแผงการดูแลระบบของคุณเพื่อ แยก การเข้าชมจากแหล่งที่มาใด ๆ ที่คุณพิจารณาว่าเป็นสแปมโดยสมบูรณ์ คุณมีตัวเลือกในการกรองการเข้าชมจากที่อยู่ IP เฉพาะหรือแหล่งอ้างอิง การใช้ตัวกรองช่วยป้องกันไม่ให้สแปมบอทลงทะเบียนในข้อมูลของคุณ คุณเพียงแค่ต้องรู้ว่ามันมาจากไหนโดยใช้ขั้นตอนข้างต้น

ตัวอย่างเช่น ถ้าฉันรู้ว่าสแปมบอททั้งหมดของฉันมาจากโดเมน “ www.spamcentral.com ” ฉันจะไปที่แผงการดูแลระบบ → ตัวกรอง → สร้างตัวกรองใหม่ จากนั้นฉันจะเลือก "ยกเว้น" และ "การเข้าชมจากโดเมน ISP นี้" และป้อน " www.spamcentral.com " ซึ่งจะป้องกันไม่ให้ GA บันทึกการรับส่งข้อมูลที่มาจากโดเมนนี้

Moz ทำงานได้ดีมาก ในการอธิบายวิธีปกป้องข้อมูลของคุณจากปรสิตที่เป็นสแปมก่อนที่จะเข้าไปในประตู

บอทที่ตายแล้ว

สแปมบอทที่ดีคือสแปมบอทที่ถูกละเว้นหรือถูกกรอง พวกเขาสร้างความเสียหายให้กับข้อมูลของคุณและส่งตัวบ่งชี้เท็จทุกประเภท ระบุความผิดปกติใดๆ (ไม่ว่าจะดีหรือไม่ดี) ในตัวชี้วัดของคุณและทำตามขั้นตอนด้านบนเพื่อติดตามแหล่งที่มาของผู้กระทำผิดเพื่อกำจัดมันออกจากข้อมูลของคุณ

ขอให้คุณมีข้อมูลที่ชัดเจน แล้วพบกันใหม่สัปดาห์หน้าสำหรับ Web Analytics รุ่นอื่นในวันจันทร์