bitkub-banner

World Models คืออะไร? ทำไมมันอาจมาแทน ChatGPT และ LLM ทั้งหมด

พร้อมเล่น 0:00 / 0:00
สรุปข่าว

แนวโน้มผลกระทบต่อราคา: Bullish

World Models ใช้พลังประมวลผลสูงกว่า LLM ราว 8 ถึง 32 เท่า ส่งผลให้ความต้องการ GPU เพิ่มขึ้นอย่างมาก ซึ่งเป็นปัจจัยบวกต่อ NVIDIA ขณะเดียวกันเมื่อทำงานร่วมกับ AI agents ก็จะยิ่งเพิ่มความต้องการด้าน Decentralized compute และ data มากขึ้น ทำให้โครงสร้างพื้นฐานฝั่งคริปโตอย่าง Render Bittensor และ Fetch.ai มีโอกาสได้รับประโยชน์ตามไปด้วย

ลองนึกภาพว่าคุณบอก ChatGPT ว่า “ลูกบอลกำลังกลิ้งลงทางลาด” มันสามารถอธิบายออกมาได้ดี แต่ไม่ได้เข้าใจฟิสิกส์จริง เช่น แรงโน้มถ่วงหรือโมเมนตัม Built In ระบุว่า นี่คือข้อจำกัดสำคัญของ LLM และเป็นเหตุผลที่ World Models ถูกพัฒนาขึ้นมาเพื่อแก้ปัญหานี้

ความแตกต่างระหว่าง LLM และ World Models

LLM อย่าง ChatGPT Claude และ Gemini ทำงานด้วยการ “ทำนายคำถัดไป” จากข้อมูลข้อความจำนวนมหาศาล จึงสามารถสร้างคำตอบที่ลื่นไหลเหมือนมนุษย์ แต่ไม่ได้เข้าใจโลกจริง

ข้อจำกัดสำคัญคือ “Hallucination” ที่อาจสร้างข้อมูลผิดแต่ดูน่าเชื่อ อีกทั้งยังไม่เข้าใจฟิสิกส์จริง แม้อธิบายได้แต่ไม่มีโมเดลของโลกอยู่ภายใน ไม่สามารถเรียนรู้จากประสบการณ์ใหม่แบบเรียลไทม์ และไม่สามารถลงมือทำในโลกจริงได้ จึงเป็น AI ที่พูดได้แต่ยังควบคุมหรือโต้ตอบกับสิ่งจริงไม่ได้

World Models ทำงานอย่างไร

ข้อมูลจาก Scientific American และ AI 2 Work ระบุว่า LLM ทำงานด้วยการทำนาย “คำถัดไป” และเรียนรู้จากข้อมูลประเภทข้อความ ขณะที่ World Model จะทำนายจาก “สถานะถัดไปของโลกจริง” โดยเรียนรู้จากวิดีโอ simulation และข้อมูลจากเซนเซอร์ ทำให้สามารถเข้าใจแรงโน้มถ่วง การชน และความสัมพันธ์ของเหตุและผลได้

Yann LeCun อธิบายว่า World Models เรียนรู้คล้ายเด็กที่ค่อย ๆ สังเกตโลก สร้างแบบจำลองในหัว แล้วใช้สิ่งนั้นในการทำนายและวางแผน ส่วน LLM เปรียบเหมือนคนที่อ่านสารานุกรม รู้ข้อมูลจำนวนมากแต่ไม่ได้เข้าใจโลกจริง

World Models ใช้งานจริงในหุ่นยนต์ Self-driving และเกม

หุ่นยนต์: NVIDIA Cosmos ร่วมกับ Figure AI และ Agility Robotics ใช้ world models เพื่อให้หุ่นยนต์เข้าใจสภาพแวดล้อม ส่งผลให้การเคลื่อนไหวและการทำงานมีประสิทธิภาพมากขึ้นอย่างชัดเจน

Self-driving: Uber และ XPENG ใช้ Cosmos ในการสร้างสถานการณ์จำลอง เพื่อฝึก AI ให้รับมือกับเหตุการณ์ที่ไม่เคยเจอมาก่อน

Game AI: ตลาดถูกคาดว่าจะเติบโตจาก 1.2 พันล้านดอลลาร์ เป็น 2.76 แสนล้านดอลลาร์ ภายในปี 2030 ทำให้ world models สามารถสร้างโลกในเกมที่ตอบสนองต่อผู้เล่นแบบ real-time แทนระบบ scripted แบบเดิม

3D Design: Fei-Fei Li ผ่าน World Labs พัฒนา Marble สำหรับสร้างสภาพแวดล้อม 3 มิติจากข้อความหรือภาพ ซึ่งสามารถนำไปใช้จริงในงานออกแบบ โดยมี Autodesk ลงทุนกว่า $200 ล้าน

บริษัทไหนกำลังพัฒนาบ้าง

ข้อมูลจาก Introl และ Emergent ระบุว่า

  • AMI Labs ของ Yann LeCun ระดมทุนได้ 1 พันล้านดอลลาร์ โดยมีเป้าหมายสร้าง AI แนวใหม่เพื่อแข่งขันกับ OpenAI และ Anthropic
  • World Labs ของ Fei-Fei Li ระดมทุน $1B เพื่อพัฒนา Marble ซึ่งเป็น world model เชิงพาณิชย์
  • NVIDIA Cosmos เป็น open source ที่ใช้ข้อมูลมากกว่า 20 ล้านชั่วโมง และมียอดดาวน์โหลดกว่า 2 ล้านครั้ง
  • Google DeepMind พัฒนา Genie 3 ซึ่งเป็น world model แบบ interactive ที่ทำงานแบบ real time
  • Runway พัฒนา GWM-1 สำหรับการสร้างวิดีโอด้วย AI

ผลกระทบต่อ AI Agents และ Crypto

AI 2 Work มองว่า อนาคตของ AI จะเกิดจากการทำงานร่วมกันระหว่าง LLM ที่ทำหน้าที่ด้านภาษาและการสื่อสาร กับ World Model ที่ทำหน้าที่เข้าใจโลกจริง ทำให้ AI พัฒนาไปสู่ระบบที่ทั้งพูดได้ ลงมือทำได้ และเข้าใจบริบทของโลกจริง ซึ่งถือเป็นก้าวสำคัญสู่ AGI

ในมุมของคริปโต World Models ใช้พลังประมวลผลสูงขึ้น ทำให้ความต้องการ GPU เพิ่มขึ้นและเป็นปัจจัยบวกต่อ NVIDIA เมื่อระบบขยายตัวในระดับใหญ่จะต้องพึ่งพา decentralized compute และ data marketplace มากขึ้น ส่งผลให้โครงสร้างพื้นฐานฝั่งคริปโตอย่าง Render Network และ Fetch.ai มีบทบาทสำคัญมากขึ้น

Tips: ทำไมนักลงทุน AI ต้องจับตา World Models

  1. เงินลงทุนกว่า 2 พันล้านดอลลาร์ไหลเข้าในเวลาเพียง 3 เดือน สะท้อนว่า smart money เริ่มให้ความสำคัญกับเทคโนโลยีนี้อย่างจริงจัง
  2. Yann LeCun และ Fei-Fei Li ซึ่งเป็นนักวิจัย AI ระดับโลก ต่างเลือกเดิมพันกับแนวทาง World Models
  3. ขนาดตลาดที่คาดว่าจะเติบโตถึง 2.76 แสนล้านดอลลาร์ในฝั่งเกม และ 1.2 ล้านล้านดอลลาร์ในฝั่ง เทคโนโลยีที่ผสานโลกจริงเข้ากับโลกเสมือน โดยมีแนวโน้มใหญ่กว่าตลาด LLM ในปัจจุบัน
  4. หุ้นและสินทรัพย์ที่มีโอกาสได้ประโยชน์ ได้แก่ NVIDIA Microsoft Alphabet Meta รวมถึงโทเคน AI อย่าง Render Bittensor Fetch.ai และ Akash Network

ผู้เขียนมองว่า World Models จะไม่เข้ามาแทน LLM แต่จะทำหน้าที่เสริมกัน โดย LLM เป็นตัวสื่อสาร ขณะที่ World Model เป็นตัวที่ช่วยให้ AI เข้าใจโลกจริง เมื่อรวมกันจะทำให้ AI สามารถทั้งสื่อสารและลงมือทำได้อย่างมีประสิทธิภาพมากขึ้น

สำหรับนักลงทุนไทย นี่อาจเป็นการปฏิวัติ AI รอบที่ 2 ต่อจาก LLM ซึ่งรอบแรกเป็นแรงผลักดันสำคัญให้ NVIDIA เติบโตอย่างมาก แต่รอบใหม่นี้มีโอกาสขยายใหญ่กว่าเดิม เพราะครอบคลุมการใช้งานในโลกจริง ไม่ว่าจะเป็นหุ่นยนต์ รถยนต์ เกม และภาคอุตสาหกรรม

แหล่งข้อมูลอ้างอิง: