ทำความรู้จักกับ “Deepseek” โมเดลเอไอตัวใหม่สุดร้อนแรงจากแดนมังกร ที่จะมาล้ม OpenAI

พร้อมเล่น 0:00 / 0:00

ล่าสุดได้มีกระแสหนึ่งผุดขึ้นมาอย่างรวดเร็วในโลกออนไลน์ โดยเฉพาะอย่างยิ่งบน X ซึ่งกระแสดังกล่าวคือการมาถึงของเอไอโมเดลตัวใหม่ Deepseek-R1 ที่มีความสามารถทัดเทียมกับยักษ์ใหญ่ในวงการอย่าง OpenAI และจะเข้ามาเขย่าวงการเอไอทั้งโลก

บริษัท Deepseek คืออะไร?

DeepSeek เป็นบริษัทวิจัยปัญญาประดิษฐ์ที่เป็นบริษัทย่อยของ High-Flyer กองทุน quant hedge fund จากประเทศจีน ที่ถูกก่อตั้งโดยคุณ Liang Wenfeng ซึ่งในปี 2023 เขาได้ทำการทุ่มทรัพยากรเพื่อนำมาพัฒนาเอไอ และเพียง 2 ปีต่อมาโมเดลเอไอ Deepseek ก็ได้ถือกำเนิดขึ้น

รายงานของสำนักข่าว The Kobeissi Letter เปิดเผยว่าพวกเขานั้นใช้เวลาพัฒนาโมเดลตัวดังกล่าวในเวลาแค่ 2 เดือนเท่านั้น และใช้เงินทุนไปแค่ 10 ล้านดอลลาร์ มิหนำซ้ำชิปที่ใช้ยังเป็นของตกรุ่น และใช้ทีมพัฒนาเพียงแค่ 200 ชีวิต โดยในปัจจุบันมันได้กลายเป็นแอปยอดนิยมอันดับหนึ่งบน App Store ในเวลาเพียงไม่กี่วัน ต่างกับวงการเอไอในสหรัฐฯเป็นอย่างมากที่ต้องใช้เงินพัฒนาไปกว่า 5 แสนล้านดอลลาร์

Let us get this straight:

DeepSeek was built in UNDER 2 months for less than $10 million and it's now #1 on the App Store.

On top of this, it was built with outdated chips and small team of <200 people.

Meanwhile, the US is pouring $500 BILLION into AI.

How is the Nasdaq not… pic.twitter.com/3cYiDC0cUC
— The Kobeissi Letter (@KobeissiLetter) January 26, 2025

ทั้งนี้หนึ่งในสิ่งที่เป็นที่น่าจับตามองที่สุดของ DeepSeek คือการที่บริษัทนั้นบริหารงานได้อย่างอิสระ ไม่ขึ้นตรงต่อยักษ์ใหญ่อย่าง Baidu หรือ Alibaba อีกทั้งวิสัยทัศน์ของผู้ก่อตั้งอย่าง Liang ยังได้เน้นไปที่การพัฒนาทางวิทยาศาสตร์มากกว่าการแสวงหาผลกำไรในระยะสั้นทำให้มันถูกพูดถึงเป็นอย่างมาก

โมเดล DeepSeek-R1 คืออะไร?

DeepSeek-R1 เป็นโมเดลเอไอจำลองการใช้เหตุผลขั้นสูงแบบ open-sorce ที่เคลมว่าสามารถผ่านการทดสอบมาตรฐานที่มีอยู่ในปัจจุบันได้หลายประการ โดยหนึ่งในโมเดลย่อยของมันอย่าง DeepSeek-R1-Zero นั้นใช้เทคนิคการเรียนรู้แบบเสริมกำลัง (RL) ขนาดใหญ่และมีการฝึกอบรมแบบหลายขั้นตอนเพื่อให้บรรลุความสามารถ

ทั้งนี้ตัวของ DeepSeek-R1 นั้นได้มีการเปิดเผยซอร์สโค้ด ไม่เพียงแต่โมเดลหลักเท่านั้น แต่ยังรวมถึงโมเดลรุ่นเล็ก 6 รุ่นที่มีขนาดเล็กลง ตั้งแต่ 1.5 พันล้าน ถึง 7 หมื่นล้านพารามิเตอร์ โดยโมเดลเหล่านี้ได้รับอนุญาตภายใต้ MIT License ซึ่งช่วยให้นักวิจัยและนักพัฒนาสามารถปรับแต่ง และใช้ประโยชน์เชิงพาณิชย์จากงานของพวกเขาได้อย่างอิสระ

DeepSeek vs OpenAI

สำหรับคำถามที่หลายคนสังสัย ว่าโมเดลตัวใหม่นี้จะโค่นแชมป์เก่าได้หรือไม่ ซึ่งคำตอบในปัจจุบันยังคงไม่แน่ชัด แต่สิ่งหนึ่งที่เราทราบแล้วคือ DeepSeek-R1 นั้นสามารถทำผลงานได้เท่าเทียบกับ OpenAI o1 หรือตัวล่าสุดได้ในเชิงของตรรกะและเหตุผล

ส่วนทางด้านต้นทุนนั้น DeepSeek สามารถทำได้ดีกว่าโดยเป็นผลมาจากการดีไซน์ทางเทคนิคที่ซับซ้อน ซึ่งข้อมูลเปิดเผยว่าตัวของมันนั้นใช้พลังการประมวลผลเพียงแค่ 1 ใน 10 ของโมเดลเอไอ Llama 3.1 ของทาง Meta อ้างอิงข้อมูลจาก Epoch AI

ทั้งนี้ Marc Andreessen นักธุรกิจชื่อดัง ยังได้ออกมาชื่นชมความสำเร็จดังกล่าวว่าเหมือนกับเหตุการณ์ดาวเทียม Sputnik ของสหภาพโซเวียต ในวงการ AI ซึ่งสิ่งนี้หมายความว่ามีผู้พัฒนาเอไอจากประเทศอื่นสามารถแสดงศักยภาพเหนือสหรัฐฯ ที่อ้างตัวเป็นผู้นำด้านเอไอได้สำเร็จ

https://t.co/HFuCmxf0Gr pic.twitter.com/m88RYzOEhO
— Marc Andreessen 🇺🇸 (@pmarca) January 26, 2025

ที่มา : business standard
ภาพ : Latenode

บริษัท Deepseek คืออะไร?

โมเดล DeepSeek-R1 คืออะไร?

DeepSeek vs OpenAI

Patiphan Santivarotai