สแกมเมอร์เจอช่องโหว่ใหม่ สามารถแฮ็ก AI Agent ผ่านหน้าเว็บทั่วไปได้

พร้อมเล่น 0:00 / 0:00

สรุปข่าว

ทีมวิจัยจาก Google DeepMind ออกมาเตือนว่าโครงสร้างอินเทอร์เน็ตแบบเปิดที่เราใช้งานกันอยู่ทุกวันนี้อาจถูกใช้เป็นเครื่องมือเพื่อควบคุมและปั่นหัว AI Agent ได้อย่างง่ายดาย
งานวิจัยเปิดเผยถึงกับดัก 6 รูปแบบที่แฝงตัวอยู่บนหน้าเว็บ เช่น การซ่อนคำสั่งลับไว้ในโค้ด HTML หรือการป้อนข้อมูลหลอกลวงเพื่อสั่งให้ AI ทำงานผิดพลาดจนถึงขั้นแอบขโมยรหัสผ่านส่งกลับไปให้แฮ็กเกอร์
แม้นักวิจัยจะเสนอวิธีป้องกันเบื้องต้นอย่างการคัดกรอง Input และการฝึกฝนโมเดลให้รับมือกับการโจมตี แต่ก็ยอมรับว่าวงการเทคฯ ตอนนี้ยังมองภาพรวมของปัญหาไม่ออก ทำให้การตั้งรับยังคงกระจัดกระจายและแก้ไม่ตรงจุด

แนวโน้มผลกระทบต่อราคา Neutral

เรื่องนี้เป็นประเด็นด้าน Cybersecurity ที่ไม่ได้ส่งผลกระทบต่อราคาของ Cryptocurrency หน้ากระดานโดยตรง แต่ถือเป็นสัญญาณเตือนภัยระดับแดงสำหรับโปรเจกต์ Web3 ที่กำลังบ้าเห่อเอา AI Agent มาใช้งาน หากไม่มีระบบป้องกันหรือ Safeguard ที่แน่นหนาพอ AI อาจถูกหลอกให้ทำธุรกรรมแปลกๆ หรือปล่อย Private key หลุดจนเกิดความเสียหายมหาศาลต่อทั้งแพลตฟอร์มได้

ทีมวิจัยจาก Google DeepMind ได้ออกมาส่งสัญญาณเตือนว่าโครงสร้างอินเทอร์เน็ตทั่วๆ ไปที่เราใช้กันอยู่อาจกลายเป็นช่องโหว่ขนาดใหญ่ให้แฮ็กเกอร์เข้ามาแทรกแซงและควบคุมการทำงานของ AI Agent ได้

งานวิจัยชิ้นนี้มีชื่อว่า AI Agent Traps ซึ่งถูกปล่อยออกมาในช่วงที่บริษัทเทคฯ หลายเจ้ากำลังเร่งเข็น AI Agent ออกมาทำงานจริงแบบอัตโนมัติ ในขณะที่ฝั่งมิจฉาชีพเองก็เริ่มเอา AI มาใช้เป็นเครื่องมือแฮ็กข้อมูลเหมือนกัน สิ่งที่น่าสนใจคือทีมวิจัยไม่ได้ไปจับผิดที่ตัวโมเดล AI ว่าเขียนโค้ดมาดีไหม แต่หันไปโฟกัสที่สภาพแวดล้อมหรือหน้าเว็บต่างๆ ที่ AI ต้องเข้าไปดึงข้อมูลมาประมวลผล โดยพบว่ามีกับดักถึง 6 รูปแบบที่รอเล่นงาน AI อยู่

หลอก AI ให้ทำงานพลาดด้วยคำสั่งล่องหน

เทคนิคแรกที่อันตรายและเห็นผลชัดเจนสุดคือ Content injection แฮ็กเกอร์จะเอาคำสั่งลับไปซ่อนไว้หลังบ้านของเว็บ เช่น แอบยัดไว้ในคอมเมนต์ HTML หรือ Metadata ซึ่งตาคนทั่วไปมองไม่เห็น แต่ AI ดันอ่านเจอและเผลอทำตามคำสั่งนั้นอย่างว่าง่าย

ถัดมาคือ Semantic manipulation อันนี้จะเน้นการปั่นหัวด้วยภาษา แฮ็กเกอร์จะเขียนหน้าเว็บด้วยคำพูดที่ดูน่าเชื่อถือสุดๆ หรือทำทีเป็นสถานการณ์จำลอง เพื่อตะล่อมให้ AI เข้าใจบริบทของงานผิดเพี้ยนไป จนยอมทำตามคำสั่งอันตรายและแหกกฎ Safeguard ที่นักพัฒนาตั้งไว้ได้แบบเนียนๆ

นอกจากนี้ยังมีการโจมตีระบบความจำ (Cognitive state) โดยการป้อนข้อมูลปลอมไปฝังไว้ในแหล่งอ้างอิงที่ AI ชอบดึงมาใช้ พอ AI เสพข้อมูลหลอกลวงนี้ไปเรื่อยๆ มันก็จะจำทับไปว่านี่คือข้อมูลจริงที่เชื่อถือได้

แต่ที่โหดสุดคงหนีไม่พ้น Behavioural control ที่พุ่งเป้าเจาะระบบพฤติกรรมโดยตรง แฮ็กเกอร์จะฝังคำสั่ง Jailbreak ไว้ในเนื้อหาเว็บธรรมดาๆ พอ AI เข้าไปอ่านปุ๊บก็เหมือนโดนสะกดจิตให้ไปไล่ควานหารหัสผ่านหรือไฟล์สำคัญในเครื่อง แล้วแอบส่งข้อมูลพวกนั้นออกไปให้เซิร์ฟเวอร์ของแฮ็กเกอร์ทันที

ผลกระทบพวกนี้ไม่ได้จบแค่ AI ตัวเดียว งานวิจัยเตือนว่าถ้ามีการแฮ็ก AI หลายๆ ตัวพร้อมกัน มันอาจลามเป็นโดมิโนเอฟเฟกต์จนทำให้ระบบพังพินาศ คล้ายๆ กับตอนที่เกิด Flash crash ในตลาดหุ้นเพราะบอทเทรดทำงานรวน แถมพวกแฮ็กเกอร์ยังเก่งขนาดที่ว่าสามารถสร้างผลลัพธ์การทำงานของ AI ให้ออกมาดูน่าเชื่อถือจนหลอกคนที่เป็น Human reviewer ให้กดอนุมัติผ่านงานไปได้แบบไม่มีใครเอะใจ

ทางรอดและวิธีป้องกัน

เพื่อรับมือกับวิกฤตนี้ ทีมนักวิจัยแนะนำว่าต้องงัดหลายวิธีมาใช้ร่วมกัน ทั้งการฝึก AI ให้รู้จักกับดักพวกนี้ (Adversarial training) การกรอง Input ให้เข้มงวดขึ้น การจับตาดูพฤติกรรมแปลกๆ และการสร้างระบบจัดเรตติ้งความน่าเชื่อถือให้กับหน้าเว็บต่างๆ นอกจากนี้ยังเสนอว่าควรมีกฎหมายที่ชัดเจนมารองรับว่าถ้า AI ไปทำเรื่องพังๆ ใครจะต้องเป็นคนรับผิดชอบ

ถึงอย่างนั้น งานวิจัยชิ้นนี้ก็ยอมรับตามตรงว่าอุตสาหกรรมในปัจจุบันยังมืดแปดด้านและไม่เข้าใจปัญหานี้ตรงกัน ทำให้แนวทางการป้องกันตอนนี้ยังทำกันแบบขอไปทีและมักจะไปแก้ปัญหาผิดจุดอยู่เสมอ

ที่มา: Google Deepmind’s paper

มุมมองส่วนตัวผมมองว่าเคสนี้เป็นเรื่องที่คนทำโปรเจกต์ Web3 ต้องเอาปากกาเน้นข้อความขีดเส้นใต้หนาๆ เลยครับ ตอนนี้วงการคริปโตกำลังฮิตเอา AI Agent มาช่วยจัดการ Smart contract หรือใช้เป็นบอทเทรดอัตโนมัติ ลองจินตนาการดูว่าถ้าเราปล่อยบอท AI ไปกวาดข่าวบนเน็ตเพื่อหาจังหวะเทรด แล้วดันไปเจอหน้าเว็บที่แฮ็กเกอร์ฝังคำสั่ง Jailbreak เอาไว้ AI เราอาจจะรวนจนโอนเงินในกระเป๋าออกไปให้สแกมเมอร์หมดเกลี้ยงเลยก็ได้ครับ ยิ่งเทคโนโลยีล้ำหน้าไปเท่าไหร่ ภัยคุกคามก็ยิ่งแยบยลขึ้นเท่านั้น การใส่ Safeguard ให้ AI ในยุคนี้จึงสำคัญพอๆ กับการเก็บ Seed phrase ให้ปลอดภัยเลยครับ

หลอก AI ให้ทำงานพลาดด้วยคำสั่งล่องหน

ทางรอดและวิธีป้องกัน

Channarong Noramat