Google DeepMind ได้สร้างแรงสั่นสะเทือนไปทั่วทั้งโลกเทคโนโลยีและวงการ AI อีกครั้ง ด้วยการประกาศเปิดตัว Genie 3 แบบจำลองโลก (World Model) ที่มีความสามารถ “เหมือนพระเจ้า” ในการ “สร้างโลกที่สามารถโต้ตอบได้ทั้งใบ” ขึ้นมาจากคำสั่งที่เป็นข้อความเพียงประโยคเดียว การเปิดตัวครั้งประวัติศาสตร์นี้ไม่เพียงแต่จะทลายกำแพงของวงการ Generative Media แต่ยังเป็นก้าวที่สำคัญที่สุดบนเส้นทางสู่การสร้างปัญญาประดิษฐ์ทั่วไป (AGI)
ในประกาศเมื่อวันที่ 5 สิงหาคม 2568 Google DeepMind ได้เปิดเผยว่า Genie 3 คือแบบจำลองโลกรุ่นแรกของบริษัทที่อนุญาตให้ผู้ใช้งานสามารถ “เข้าไปสำรวจและโต้ตอบ” กับโลกที่ AI สร้างขึ้นได้แบบเรียลไทม์ ที่ความเร็ว 24 เฟรมต่อวินาที และความละเอียดสูงถึง 720p ลองจินตนาการว่าคุณเพียงแค่พิมพ์ประโยคว่า
“ขับเจ็ตสกีท่ามกลางเทศกาลแห่งแสงไฟ” หรือ “สำรวจพระราชวังคนอสซอสในยุครุ่งเรืองที่สุด” และในอีกไม่กี่วินาทีต่อมา คุณก็สามารถเข้าไป “เดินเล่น” หรือ “ขับ” อยู่ในโลกนั้นได้จริงๆ ผ่านการควบคุมที่เรียบง่าย
สิ่งที่ทำให้ Genie 3 แตกต่างจาก AI สร้างวิดีโอทั่วไปอย่าง Veo คือความสามารถในการรักษา “ความต่อเนื่องของสภาพแวดล้อม” (Environmental consistency) ได้นานหลายนาที แม้ว่าผู้ใช้จะหันไปทางอื่นแล้วกลับมายังจุดเดิม ต้นไม้หรืออาคารที่เคยเห็นก็จะยังคงตั้งอยู่ที่เดิม “ความต่อเนื่องของ Genie 3 เป็นความสามารถที่เกิดขึ้นเอง” รายงานระบุ ซึ่งแตกต่างจากเทคโนโลยีอื่นที่ต้องอาศัยการสร้างแบบจำลอง 3 มิติที่ชัดเจน แต่โลกของ Genie 3 นั้นมีความสมจริงและเต็มไปด้วยชีวิตชีวามากกว่า เพราะมันถูกสร้างขึ้นทีละเฟรมโดยอิงจากคำอธิบายโลกและการกระทำของผู้ใช้งาน
นอกจากนี้ Genie 3 ยังมาพร้อมกับฟีเจอร์ที่น่าทึ่งอย่าง “Promptable World Events” ซึ่งอนุญาตให้ผู้ใช้สามารถ “เปลี่ยนแปลง” โลกที่กำลังเล่นอยู่ได้ด้วยการใช้คำสั่งข้อความ เช่น การเปลี่ยนสภาพอากาศ หรือการเสกวัตถุและตัวละครใหม่ๆ เข้ามาในฉาก
Google DeepMind ไม่ได้สร้าง Genie 3 ขึ้นมาเพื่อความบันเทิงเท่านั้น แต่ยังมองว่ามันคือ “สนามเด็กเล่นที่ไร้ขีดจำกัด” สำหรับการฝึกฝน AI Agent ในอนาคต โดยพวกเขาได้ทดลองนำ SIMA Agent ซึ่งเป็น AI ที่ถูกออกแบบมาสำหรับสภาพแวดล้อม 3 มิติ เข้าไปทดลองปฏิบัติภารกิจในโลกที่สร้างโดย Genie 3 ซึ่งความสามารถในการรักษาความต่อเนื่องของ Genie 3 ได้เปิดโอกาสให้ Agent สามารถเรียนรู้ที่จะทำภารกิจที่ซับซ้อนและยาวนานขึ้นได้เป็นครั้งแรก “เราคาดว่าเทคโนโลยีนี้จะมีบทบาทสำคัญอย่างยิ่งในขณะที่เรากำลังมุ่งไปสู่ AGI และในขณะที่ Agent จะเข้ามามีบทบาทมากขึ้นในโลก” รายงานระบุ
อย่างไรก็ตาม ทีมงานยอมรับว่า Genie 3 ยังคงมีข้อจำกัดอยู่หลายประการ ทั้งการที่ Agent ยังไม่สามารถกระทำการที่ซับซ้อนได้ด้วยตนเอง, การจำลองปฏิสัมพันธ์ระหว่าง Agent หลายตัวที่ยังเป็นเรื่องท้าทาย และความสามารถในการจำลองสถานที่จริงที่ยังไม่สมบูรณ์ ด้วยเหตุนี้ Genie 3 จึงจะยังคงเปิดให้ใช้งานในรูปแบบ “พรีวิวสำหรับการวิจัยแบบจำกัด” สำหรับกลุ่มนักวิชาการและนักสร้างสรรค์เท่านั้นในตอนนี้ แต่การมาถึงของมันก็ได้ส่งสัญญาณที่ชัดเจนแล้วว่า อนาคตที่เราจะสามารถสร้างและท่องไปในโลกเสมือนจริงได้อย่างอิสระนั้น ใกล้เข้ามามากกว่าที่เราเคยจินตนาการไว้
ที่มา: deepmind

