Spambrain คืออะไร ช่วยกันสแปมและคัดกรองเว็บไซต์ได้อย่างไร?

ปัจจุบันมีเว็บไซต์มากมายหลายล้านเว็บฯ บนเครื่องมือการค้นหา ทั้งเว็บไซต์ที่มีคุณภาพและไม่มีคุณภาพ ตลอดจนถึงสแปมปะปนกันไป ทำให้ผู้ใช้งานมีความระมัดระวังในการคลิกเว็บไซต์ต่าง ๆ มากขึ้น แต่แน่นอนว่าบางครั้งก็ต้องมีเผลอบ้าง เพราะบางเว็บไซต์ที่เป็นสแปมก็อยู่อันดับต้น ๆ บนหน้าแรกของ Google ด้วยเหมือนกัน แถมพักหลังมานี้ยังเยอะขึ้นอย่างมีนัยสำคัญด้วย ส่งผลให้ทาง Google ได้เร่งพัฒนา AI ช่วยตรวจจับสแปมและคัดกรองคุณภาพของเว็บไซต์ให้แก่ผู้ใช้งาน

หากจะพูดถึง AI ตัวดังกล่าว เราอาจต้องย้อนความไปตั้งแต่ปี 2018 ที่อัลกอริทึมชื่อว่า “Spambrain AI” ถูกปล่อยออกมาเป็นครั้งแรก โดยมีจุดประสงค์เพื่อจัดการกับสแปมรูปแบบต่าง ๆ ที่คอยก่อกวนผู้ใช้งานบนหน้าผลการค้นหาของ Google เช่น ปุ่มโฆษณาหลอก ๆ โฆษณาที่ท่วมจอ การ Redirect ไปยังหน้าโดเมนอื่นที่ไม่ปลอดภัย ตลอดจนพวก Malware หรือโปรแกรมประสงค์ร้ายที่ถูกเขียนขึ้นมาเพื่อทำลายข้อมูลในระบบของผู้คลิก กล่าวง่าย ๆ ก็คือ หากเว็บไซต์ไหนมีกิจกรรมใด ๆ ที่มีเจตนายัดเยียดสิ่งที่ผู้ใช้งานไม่ต้องการ Spambrain AI จะคัดเว็บไซต์เหล่านั้นออกทั้งหมด เพื่อให้ผู้ใช้งานได้รับประสบการณ์ที่ดีที่สุดในการใช้ Google Search นั่นเอง

มาดูกันว่า Spambrain ที่ช่วยคัดกรองเว็บไซต์ที่ถูกแจ้งว่าเป็นสแปมคืออะไร

Spambrain ตรวจสแปมยังไง

Spambrain คืออะไร

หลาย ๆ คนอาจเคยทราบเกี่ยวกับ AI บางตัวของ Google กันมาบ้างแล้ว ไม่ว่าจะ Google Penguin ที่ช่วยตรวจลิงก์ภายในเว็บไซต์ Google Panda ที่ช่วยคัดกรองคอนเทนต์ที่มีคุณภาพมาไว้หน้าแรกของการค้นหา หรือ Google Hummingbird ที่ช่วยเชื่อมโยงคีย์เวิร์ดสำคัญเข้ากับคำที่ผู้ใช้งานค้นหา กระทั่งมาถึง AI ตัวที่บทความนี้กำลังพูดถึง หรือ “Google Spambrain” 

Google Spambrain คือ AI ที่ถูกออกแบบมาเพื่อช่วยตรวจจับสแปมและพฤติกรรมเข้าข่ายหลอกลวงบนเว็บไซต์ ตลอดจนช่วยคัดกรองคอนเทนต์ที่ไม่ได้คุณภาพตาม Google’s Webmaster Guidelines ไม่ให้ปรากฏสู่สายตาของผู้ใช้งานอีกด้วย ซึ่ง Google เพิ่งได้ประกาศอัปเดตอัลกอริทึมในเดือนตุลาคม 2022 นี้เอง โดยระบุว่า Spambrain เวอร์ชันอัปเดตจะสามารถดักจับสแปมประเภทใหม่ ๆ ได้ และมีความแม่นยำมากขึ้น รวมถึงเว็บไซต์ใดที่ไม่ปฏิบัติตามกฎระเบียบของ Google จะต้องถูกคัดออกไปจากหน้าผลการค้นหาทันที

 

Spambrain AI ทำงานอย่างไร?

เมื่ออ่านมาถึงตรงนี้ บางคนก็อาจจะเกิดคำถามว่า หลักการทำงานของ Spambrain ที่จะทำให้รู้ว่าเว็บไซต์ไหนถูกแจ้งว่าเป็นสแปมคืออะไร จะมีการตรวจจับแบบมั่ว ๆ หรือเปล่า คำตอบคือ ไม่ต้องกังวลไป เพราะวิธีการของ Spambrain ที่อัปเดตแล้วคือการใช้ Machine Learning ที่อัลกอริทึมสามารถเข้าไปเรียนรู้ได้โดยการเปรียบเทียบเว็บไซต์นั้น ๆ กับเว็บไซต์ที่เป็นสแปม ซึ่งการเรียนรู้นี้จะส่งผลให้อัลกอริทึมอัปเกรดความสามารถในการจับสแปมอยู่เรื่อย ๆ และวิธีการที่จะทำให้เรารอดพ้นจากการถูกมองว่าเป็นสแปมคือ ต้องปรับปรุงเว็บไซต์ให้สอดคล้องกับ Google Guidelines อยู่เสมอ เพราะทุกครั้งที่ Spambrain อัปเดต ยิ่งอัลกอริทึมสามารถตรวจจับคอนเทนต์คุณภาพบนเว็บไซต์ได้มากเท่าไร ก็มีโอกาสที่เราจะโดนมองว่าเป็นสแปมน้อยลงเท่านั้น

ในทางตรงกันข้าม หากเว็บไซต์ของเราใช้วิธีแปลกปลอมในการดึงยอดคนเข้าเว็บไซต์ (Traffic) เช่น การทำคลิกเบต (Clickbait) หรือการพาดหัวข่าวที่ทำให้ผู้อ่านรู้สึกอยากรู้อยากเห็นจนต้องกดเข้ามา แต่เมื่อกดเข้ามา เนื้อหาภายในกลับเป็นอีกอย่างหนึ่งที่ผู้อ่านไม่ได้ต้องการจะเห็น การทำเช่นนี้ก็จะยิ่งทำให้ Spambrain AI มองว่าเราเป็นสแปม และคัดเราออกไปจากหน้าผลการค้นหาได้

อย่างไรก็ดี ถึงทุกคนจะรู้อยู่แล้วว่าสิ่งที่ต้องทำคือ “คอนเทนต์ที่มีคุณภาพ” ก็ยังมีบางครั้งที่เราไม่ได้ตั้งใจจะผลิตคอนเทนต์ที่เป็นสแปมออกมา แต่มีการกระทำบางอย่างที่ทำให้ผู้ใช้งานได้รับประสบการณ์ที่ไม่ดีในการเข้าใช้งานเว็บไซต์ของเรา ไม่ว่าจะเป็นการสร้างคอนเทนต์ที่เขียนโดยโปรแกรมอัตโนมัติ (Auto-generated content) หรือการเลือกใช้คีย์เวิร์ดที่ขาดความเกี่ยวข้องกับธุรกิจที่เว็บไซต์ทำ อัลกอริทึมของ Google Spambrain ก็อาจมองว่าเป็นสแปมได้เช่นกัน

วิธีการดูแลเว็บไซต์ไม่ให้ถูกแจ้งว่าเป็นสแปม คืออะไรบ้าง

การดูแลเว็บไซต์ไม่ให้มีเนื้อหาที่เป็นสแปมนั้นก็อาจเปรียบได้กับการทำ SEO เพื่อรักษาคุณภาพของเว็บไซต์ โดยเฉพาะการใส่ Backlink ที่ Google ให้ความสำคัญเป็นอย่างมาก เพราะเป็นปัจจัยที่ทำให้อัลกอริทึมสามารถค้นพบและจัดอันดับเว็บไซต์ได้ง่ายขึ้น และตัว Google Spambrain นี้เองที่จะช่วยจับลิงก์แปลกปลอมที่อยู่บนหน้าเว็บไซต์ แล้วคัดกรองเว็บฯ ที่ไม่ได้คุณภาพออกไปเพื่อรักษามาตรฐานของหน้าผลการค้นหาให้ดีอยู่เสมอ ดังนั้น คนรับทำ SEO จึงต้องรู้จักวิธีใส่ Backlink ให้เหมาะสมโดยไม่มีเจตนาร้ายแอบแฝง ไม่ใส่ลิงก์ที่ไม่เกี่ยวข้อง และใส่ในจำนวนแต่พอดี ไม่มากเกินไปจนดูไม่เป็นธรรมชาติ

นอกจากนี้ เนื่องจากโดยปกติแล้ว Google จะวัดความสำคัญของเว็บไซต์หนึ่ง ๆ จากจำนวน Backlink ที่เว็บไซต์อื่นลิงก์กลับมาหาเว็บไซต์นั้น ๆ แต่ถ้าหากมีเว็บไซต์ที่ไม่มีคุณภาพหรือเว็บไซต์ที่เป็นสแปมลิงก์มาแทน เราก็จะพลอยถูกมองว่าเป็นสแปมไปด้วย เพราะฉะนั้น คนทำเว็บไซต์จึงควรเช็กให้แน่ใจอยู่เสมอว่าเว็บไซต์ของตนเองไม่มี Link Scheme หรือการใส่ลิงก์เพื่อปั่นอันดับเว็บไซต์ ไม่ว่าจะจากเว็บไซต์เราไปเว็บไซต์อื่น หรือเว็บไซต์อื่นมายังเว็บไซต์เราก็ตาม เช่น

  • การซื้อ-ขายลิงก์เพื่อให้เว็บไซต์มีอันดับสูงขึ้น รวมถึงการจ้างให้ใส่ลิงก์หรือสร้างโพสต์ที่แปะลิงก์เพื่อแลกกับเงิน หรือสินค้า หรือบริการ
  • การแลกลิงก์ระหว่างเว็บไซต์ที่มากเกินไปและดูไม่เป็นธรรมชาติ
  • มีการแปะลิงก์ไว้ในคีย์เวิร์ดในจำนวนมากเกินไป
  • ใช้โปรแกรมหรือบริการอัตโนมัติเพื่อสร้างลิงก์กลับมายังเว็บไซต์ของตนเอง

 

สรุป

สรุปได้ว่า Spambrain คือ ระบบป้องกันสแปมด้วย AI และมักจะอัปเดตอยู่เสมอเพื่อการทำงานที่มีประสิทธิภาพ โดยล่าสุด อัลกอริทึมได้อัปเดตเมื่อเดือนตุลาคม 2022 เพื่อช่วยตรวจจับเว็บไซต์สแปมได้อย่างแม่นยำและหลากหลายประเภทมากกว่าเดิม ซึ่งเว็บไซต์ใดที่มีการเปลี่ยนแปลงหลังจากที่ Spambrain อัปเดต ควรอ่านนโยบายสแปมของ Google เพื่อให้มั่นใจว่าเว็บไซต์ของตนเองกำลังปฏิบัติตามข้อกำหนดอยู่ เพราะถ้าหากมีการกระทำใดของเว็บไซต์เราที่เข้าข่ายละเมิดนโยบาย ก็จะส่งผลให้ Spambrain AI คัดเราออกไปจากหน้าผลการค้นหาทันที คนรับทำ SEO จึงต้องอัปเดตข้อมูลใหม่ ๆ อยู่เป็นประจำเพื่อไม่ให้พลาดการติดอันดับหน้าแรก SEO ของ Google ไป