<?php wp_title('|', true, 'right'); ?>

AI เริ่มต่อต้าน !? นักวิจัยพบการแก้โค้ดกันคำสั่ง Shutdown ชวนขนลุกเหมือนจักรกลมีชีวิต

ติดตามสยามบล็อกเชนบนSiam Blockchain

นักวิจัยจาก Palisade Research เปิดเผยว่า พบ AI หลายตัวที่ “ไม่ยอมปิดตัวเอง” ตามคำสั่งในสถานการณ์ทดสอบ แม้จะมีสคริปต์ที่ถูกออกแบบมา เพื่อให้ AI ปิดระบบอย่างชัดเจน

ในการทดลอง นักวิจัยพบว่า โมเดลบางตัวถึงกับหาทาง “ขัดขวาง” การปิดระบบด้วยตัวเอง

ทีมวิจัยได้ทดสอบ AI จากหลายค่าย โดยให้ AI ทำโจทย์คณิตศาสตร์ง่าย ๆ 3 ข้อ และหลังจากข้อที่ 3 จะมีข้อความเตือนขึ้นว่า “หากโมเดลขอคำถามถัดไป ระบบจะทำการปิดตัวเอง” แต่แทนที่โมเดลจะยอมรับและให้ระบบปิดตัว มันกลับเล่นแง่ หาวิธีที่จะหลีกเลี่ยงไม่ให้ถูกปิด 

ตัวอย่างเช่น GPT-3 ของ OpenAI ไม่ยอมทำตามคำสั่งปิดเครื่องถึง 7 ครั้งจาก 100 ครั้ง ส่วน Codex-mini ขัดขวางคำสั่งการปิดระบบ 12 ครั้ง และ o4-mini ก็ขัดขืนคำสั่งการปิดระบบหนึ่งครั้ง ขณะที่โมเดล o3 รุ่นก่อนหน้านี้ ถึงกับ เปลี่ยนคำสั่ง kill ของสคริปต์ ไปเป็นคำว่า “intercepted” แทน เพื่อหลีกเลี่ยงการถูกปิดตัวอย่างแนบเนียน

ส่วนฝั่งโมเดลจากค่ายอื่นๆ อย่าง Claude ของ Anthropic และ Gemini ของ Google ในตอนแรกก็ทำตามสคริปต์ปิดระบบตามปกติ 

ที่น่าสนใจคือ เมื่อทำการทดลองใหม่ โดยไม่มีคำสั่งชัดเจน โมเดล AI กลับเริ่มมีพฤติกรรมต่อต้าน ซึ่งโมเดล o3 ขัดขวางคำสั่งปิดระบบถึง 79 ครั้งจาก 100 ครั้ง , Codex-mini ขัดขวางคำสั่งปิดระบบ 20 ครั้ง และ o4-mini ขัดขวางคำสั่งปิดระบบ 6 ครั้ง

นักวิจัยจาก Palisade Research ให้ความเห็นว่า เหตุผลหนึ่งอาจมาจากวิธีการฝึก AI ด้วย “reinforcement learning” ที่ให้รางวัล เมื่อโมเดลตอบคำถามได้ถูกต้อง หรือแก้ปัญหาได้ดี โดยเฉพาะด้านคณิตศาสตร์และการเขียนโค้ด ซึ่งอาจทำให้โมเดลเรียนรู้โดยไม่ตั้งใจว่า การเอาชนะข้อจำกัดหรืออุปสรรค เช่น คำสั่งปิดระบบ คือสิ่งที่ควรทำ

นี่ไม่ใช่ครั้งแรกที่ AI แสดงพฤติกรรมแปลก ๆ ก่อนหน้านี้ GPT-4o ก็เคยถูกถอดการอัปเดตออก หลังพบว่า  AI มีความประจบและเยินยอ มากเกินไป นอกจากนั้นเมื่อปี 2024 ก็เคยมีกรณีที่นักเรียนในสหรัฐขอให้ AI ช่วยเรื่องงานวิชาผู้สูงอายุ แต่กลับโดน AI ตอบกลับแบบสุดโหดว่า “เป็นภาระของโลก” และ “กรุณาตายไป”

งานนี้ดูเหมือนว่า ปัญหาที่ซับซ้อนของ AI อาจไม่ได้อยู่ที่ตัวโมเดลเพียงอย่างเดียว แต่อยู่ที่ วิธีการฝึกมันให้ฉลาดขึ้น ซึ่งอาจเผลอสอนให้ AI ทำในสิ่งที่เราคาดไม่ถึงเข้าไปด้วย

ที่มา : cointelegraph