<?php wp_title('|', true, 'right'); ?>

SCB10X ประกาศเปิดตัว “ไต้ฝุ่น” โมเดลภาษาขนาดใหญ่ ดีกรีเทียบเคียง ChatGPT3.5

ติดตามสยามบล็อกเชนบนSiam Blockchain

ล่าสุด SCB10X บริษัทภายใต้กลุ่มเอสซีบี เอกซ์ (SCBX Group) ได้ประกาศเปิดตัว Typhoon หรือ ไต้ฝุ่น โมเดลภาษาขนาดใหญ่ เพื่อภาษาไทยโดยเฉพาะ พร้อมระบุว่า AI ตัวนี้มีความสามารถเทียบเท่ากับ ChatGPT3.5 ของ OpenAI ในภาษาไทย

โมเดลภาษาคืออะไร ?

โมเดลภาษาขนาดใหญ่ (LLM) เป็นอัลกอริธึมการเรียนรู้เชิงลึกประเภทหนึ่งที่ประมวลผลและสร้างข้อความที่เหมือนมนุษย์ โมเดลเหล่านี้คือ ผ่านการฝึกอบรม บนชุดข้อมูลขนาดใหญ่ที่มีข้อความจากแหล่งต่างๆ เช่น หนังสือ บทความ เว็บไซต์ ความคิดเห็นของลูกค้า โพสต์บนโซเชียลมีเดีย และบทวิจารณ์ผลิตภัณฑ์

ตัวของ Typhoon นั้นในขณะนี้สามารถเอาชนะโมเดลภาษาไทยที่มีอยู่ในปัจจุบันได้ทุกตัว โดยในการวัดผลประสิทธิภาพของโมเดลในภาษาไทย ทาง SCB 10X ได้พัฒนาชุดทดสอบวัดผลประสิทธิภาพโมเดล LLM ภาษาไทยชื่อ ThaiExam โดยวัดด้วยข้อสอบสำหรับเด็กมัธยมศึกษาตอนปลายและข้อมูลด้านการลงทุนจากผู้เชี่ยวชาญด้านการลงทุนในประเทศไทย พบว่าประสิทธิภาพโมเดล Typhoon-7b เหนือกว่าทุกโมเดลที่ปล่อยฟรีในภาษาไทยและมีคะแนนเทียบเท่ากับ GPT-3.5

ภาพ : ผลการเปรียบเทียบ AI แต่ละตัว

จากข้อมูลพบว่าทีมพัฒนาได้แบ่งโมเดลออกเป็น 2 เวอร์ชัน ได้แก่ Pretrained Model หรือก็คือโมเดลที่ยังต้องมีการสอนพื้นฐานต่าง ๆ อยู่เช่นคำศัพท์ บริบท วัฒนธรรม และ ความรู้ทั่วไป ถัดมาคือ Instruction-tuned Model ซึ่งเปรียบเสมือนการสอนต่ออีกขั้นหนึ่ง ให้โมเดลสามารถสื่อสารสิ่งที่เข้าใจตาม prompt เช่นการสรุปใจความ การตอบปัญหา-คำถาม หรือ การแปลเป็นต้น

นอกเหนือจากนี้ ทาง SCB 10X ยังได้ปล่อยโมเดลให้ใช้งานฟรี ซึ่งตัวที่ปล่อยจะเป็นโมเดลพื้นฐานที่ยังไม่ผ่านการปรับแต่งใด ๆ ซึ่งผู้ที่สนใจควรปรับแต่งเพิ่มเติมก่อนนำไปใช้งานจริง

นี่ถือเป็นก้าวสำคัญสำหรับทั้งประเทศไทย และวงการ AI เนื่องจาก AI ส่วนใหญ่นั้นจะถูกฝึกให้รับรองการใช้งานเป็นภาษาอังกฤษ นี่จึงถึงเป็นเรื่องดีอย่างมากที่ในที่สุดเราก็จะได้มี AI ที่รองรับภาษาไทยอย่างเต็มรูปแบบไว้ใช้งานกัน

ศึกษารายละเอียดเพิ่มเติมเกี่ยวกับโมเดลภาษาตัวนี้ได้ที่ HuggingFace และ ARXIV

หากทุกท่านสนใจสามารถทำการลงทะเบียน waitlist เพื่อรอการใช้งานได้ที่เว็บไซต์ opentyphoon.ai