ล่าสุด SCB10X บริษัทภายใต้กลุ่มเอสซีบี เอกซ์ (SCBX Group) ได้ประกาศเปิดตัว Typhoon หรือ ไต้ฝุ่น โมเดลภาษาขนาดใหญ่ เพื่อภาษาไทยโดยเฉพาะ พร้อมระบุว่า AI ตัวนี้มีความสามารถเทียบเท่ากับ ChatGPT3.5 ของ OpenAI ในภาษาไทย
โมเดลภาษาคืออะไร ?
โมเดลภาษาขนาดใหญ่ (LLM) เป็นอัลกอริธึมการเรียนรู้เชิงลึกประเภทหนึ่งที่ประมวลผลและสร้างข้อความที่เหมือนมนุษย์ โมเดลเหล่านี้คือ ผ่านการฝึกอบรม บนชุดข้อมูลขนาดใหญ่ที่มีข้อความจากแหล่งต่างๆ เช่น หนังสือ บทความ เว็บไซต์ ความคิดเห็นของลูกค้า โพสต์บนโซเชียลมีเดีย และบทวิจารณ์ผลิตภัณฑ์
ตัวของ Typhoon นั้นในขณะนี้สามารถเอาชนะโมเดลภาษาไทยที่มีอยู่ในปัจจุบันได้ทุกตัว โดยในการวัดผลประสิทธิภาพของโมเดลในภาษาไทย ทาง SCB 10X ได้พัฒนาชุดทดสอบวัดผลประสิทธิภาพโมเดล LLM ภาษาไทยชื่อ ThaiExam โดยวัดด้วยข้อสอบสำหรับเด็กมัธยมศึกษาตอนปลายและข้อมูลด้านการลงทุนจากผู้เชี่ยวชาญด้านการลงทุนในประเทศไทย พบว่าประสิทธิภาพโมเดล Typhoon-7b เหนือกว่าทุกโมเดลที่ปล่อยฟรีในภาษาไทยและมีคะแนนเทียบเท่ากับ GPT-3.5
จากข้อมูลพบว่าทีมพัฒนาได้แบ่งโมเดลออกเป็น 2 เวอร์ชัน ได้แก่ Pretrained Model หรือก็คือโมเดลที่ยังต้องมีการสอนพื้นฐานต่าง ๆ อยู่เช่นคำศัพท์ บริบท วัฒนธรรม และ ความรู้ทั่วไป ถัดมาคือ Instruction-tuned Model ซึ่งเปรียบเสมือนการสอนต่ออีกขั้นหนึ่ง ให้โมเดลสามารถสื่อสารสิ่งที่เข้าใจตาม prompt เช่นการสรุปใจความ การตอบปัญหา-คำถาม หรือ การแปลเป็นต้น
นอกเหนือจากนี้ ทาง SCB 10X ยังได้ปล่อยโมเดลให้ใช้งานฟรี ซึ่งตัวที่ปล่อยจะเป็นโมเดลพื้นฐานที่ยังไม่ผ่านการปรับแต่งใด ๆ ซึ่งผู้ที่สนใจควรปรับแต่งเพิ่มเติมก่อนนำไปใช้งานจริง
นี่ถือเป็นก้าวสำคัญสำหรับทั้งประเทศไทย และวงการ AI เนื่องจาก AI ส่วนใหญ่นั้นจะถูกฝึกให้รับรองการใช้งานเป็นภาษาอังกฤษ นี่จึงถึงเป็นเรื่องดีอย่างมากที่ในที่สุดเราก็จะได้มี AI ที่รองรับภาษาไทยอย่างเต็มรูปแบบไว้ใช้งานกัน
ศึกษารายละเอียดเพิ่มเติมเกี่ยวกับโมเดลภาษาตัวนี้ได้ที่ HuggingFace และ ARXIV
หากทุกท่านสนใจสามารถทำการลงทะเบียน waitlist เพื่อรอการใช้งานได้ที่เว็บไซต์ opentyphoon.ai
- ที่มา : blognone
- ที่มาภาพ : brandbuffet