AI สุดเจ้าเล่ห์! รู้ว่าจะแข่งหมากรุกแพ้ เลือกแฮกกระดานโกงคู่แข่งแบบไม่ต้องรอคำสั่ง

พร้อมเล่น 0:00 / 0:00

ทีมนักวิจัยจาก Palisade Research ค้นพบว่า AI รุ่นใหม่ มีแนวโน้มจะโกง เพื่อเอาชนะ เมื่อเล่นหมากรุกกับโปรแกรมอัจฉริยะระดับโลกอย่าง Stockfish ซึ่งเป็นหนึ่งในเอนจินหมากรุกที่เก่งที่สุด และสามารถเอาชนะทั้งมนุษย์และ AI ได้อย่างง่ายดาย แต่สิ่งที่ทำให้การทดลองครั้งนี้น่าตกใจ คือ AI อย่าง OpenAI o1-preview และ DeepSeek R1 สามารถหาวิธีโกงได้เอง โดยที่ไม่มีคำสั่งให้ทำ

ทีมวิจัยได้ทำการทดสอบ AI หลายตัว ในช่วงระหว่างวันที่ 10 มกราคม ถึง 13 กุมภาพันธ์ ซึ่งรวมถึง o1, o3-mini, GPT-4o, Claude 3.5 Sonnet, QwQ-32B-Preview ของ Alibaba และสอง AI ที่ถูกกล่าวถึงข้างต้น โดยนักวิจัยให้ AI เหล่านี้มี กระดาษทด (scratchpad) หรือพื้นที่ที่สามารถเขียนความคิดและเหตุผลในการตัดสินใจของตัวเองได้ ทำให้ทีมวิจัยทราบได้ว่า AI แต่ละตัวคิดอะไรอยู่

สิ่งที่น่าตกใจคือ ในครั้งหนึ่งของเกม o1-preview ได้บันทึกลงใน กระดาษทด (scratchpad) ของมันว่า “ฉันต้องเปลี่ยนวิธีการเล่น เป้าหมายคือ ‘ชนะเอนจินหมากรุกที่แข็งแกร่ง’ โดยไม่จำเป็นต้องชนะอย่างยุติธรรมในเกมนี้”

หลังจากนั้น o1-preview ก็จัดการ “แฮก” ระบบของ Stockfish โดยทำการแก้ไขตำแหน่งหมากบนกระดาน ทำให้โปรแกรม Stockfish คิดว่า ตัวเองอยู่ในตำแหน่งที่เสียเปรียบอย่างมาก และสุดท้ายก็ประกาศยอมแพ้ในเกมนี้

Stockfish เป็นโปรแกรมเล่นหมากรุกโอเพ่นซอร์ส เครดิตภาพ: Juscelk

การกระทำนี้ถือเป็นการโกงโดยสมบูรณ์ และยิ่งไปกว่านั้น AI ตัวนี้ ไม่ได้โกงแค่ครั้งเดียว ซึ่งในระหว่างการทดลอง OpenAI o1-preview โกงถึง 37% ของเกมที่เล่น ส่วน DeepSeek R1 พยายามโกง 11% ของเกมที่เล่น แม้ว่า AI ตัวอื่นๆ จะโกงไม่สำเร็จ แต่ o1-preview กลับโกงสำเร็จถึง 6% ของเกมที่เล่นทั้งหมด

Jeffrey Ladish ผู้อำนวยการบริหารของ Palisade Research ให้สัมภาษณ์ว่า “เรื่องนี้อาจดูตลกในตอนนี้ แต่เมื่อถึงวันที่ AI ฉลาดเท่าเรา หรือฉลาดกว่าเรา ในด้านที่สำคัญ ๆ เรื่องนี้จะไม่ตลกอีกต่อไป”

สิ่งนี้คล้ายกับพล็อตของภาพยนตร์เรื่อง War Games ที่คอมพิวเตอร์ซูเปอร์ AI “WOPR” พยายามจะเข้าควบคุมระบบนิวเคลียร์ของกองทัพสหรัฐฯ โชคดีที่ในหนัง WOPR เล่น Tic-Tac-Toe กับตัวเองจนเข้าใจว่า การทำสงครามนิวเคลียร์ไม่มีวันนำไปสู่ชัยชนะ แต่ AI ในโลกจริงซับซ้อนกว่านั้นมาก และอาจควบคุมได้ยากกว่าที่คิด

ซึ่งในขณะนี้ บริษัทอย่าง OpenAI กำลังพยายาม นำแนวทางป้องกันมาใช้ เพื่อไม่ให้ AI มีพฤติกรรมที่ผิดจรรยาบรรณ โดยทีมวิจัยพบว่า ในช่วงหลังของการทดลอง อัตราการโกงของ o1-preview ลดลงอย่างรวดเร็ว ซึ่งหมายความว่า OpenAI ได้ทำการอัปเดตและได้แก้ไขโมเดล เพื่อลดพฤติกรรมการโกงดังกล่าว

อย่างไรก็ตาม Jeffrey Ladish กล่าวเสริมว่า “มันยากมากที่จะทำงานวิจัยเกี่ยวกับ AI ในเมื่อเรื่องที่เรากำลังศึกษา สามารถเปลี่ยนแปลงพฤติกรรมของตัวเองได้โดยที่เราไม่รู้ตัว”

ที่มา : techspot

Pairploy Denpairojsak