<?php wp_title('|', true, 'right'); ?>

ChatGPT อัปเกรดยกเครื่องใหม่ ! พูด ฟัง และมองเห็นได้แล้ว ก้าวสู่ยุค AI เต็มรูปแบบ

ติดตามสยามบล็อกเชนบนSiam Blockchain

เมื่อวันที่ 25 กันยายนที่ผ่านมา OpenAI ได้ประกาศการเปิดตัวความสามารถด้านเสียงและรูปภาพใน ChatGPT เพื่อนำเสนออินเทอร์เฟซรูปแบบใหม่ ๆ ที่อนุญาตให้ผู้ใช้สามารถสนทนาด้วยเสียงกับ ChatGPT หรือแสดงให้แชทบอทเห็นว่าเรากำลังพูดถึงอะไร

พูดคุยด้วยเสียงกับ ChatGPT

ในอีกสองสัปดาห์ข้างหน้า ผู้ใช้จะสามารถสนทนาด้วยเสียงกับ ChatGPT และจากนั้น ChatGPT ก็จะตอบกลับมาด้วยเสียงเช่นกัน โดยถ้าหากต้องการเริ่มต้นใช้งานฟีเจอร์นี้ ให้ไปที่การตั้งค่า → คุณสมบัติใหม่บนแอปมือถือ และเลือกใช้การสนทนาด้วยเสียง จากนั้นแตะปุ่มหูฟังที่มุมขวาบนของหน้าจอหลัก แล้วเลือกเสียงของ ChatGPT ตามที่ต้องการ โดยจะมีเสียงให้เลือกทั้งหมด 5 เสียงด้วยกัน

ตามประกาศจาก OpenAI ความสามารถด้านเสียงดังกล่าวจะขับเคลื่อนโดยโมเดลการอ่านออกเสียงแบบใหม่ ซึ่งจะสามารถสร้างเสียงที่เหมือนกับมนุษย์ได้จากการอ่านข้อความและคำพูดตัวอย่างเพียงไม่กี่วินาที

“เราร่วมมือกับนักพากย์มืออาชีพเพื่อสร้างเสียงแต่ละเสียง นอกจากนี้เรายังใช้ Whisper ซึ่งเป็นระบบรู้จำคำพูดแบบโอเพ่นซอร์สของเราเพื่อถอดเสียงคำพูดของคุณเป็นข้อความ” OpenAI กล่าว

พูดคุยด้วยรูปภาพกับ ChatGPT

จากนี้ไป ผู้ใช้จะสามารถส่งรูปภาพให้กับ ChatGPT เพื่อให้ AI ช่วยวิเคราะห์รูปภาพนั้น ๆ ได้ เช่น ส่งรูปวัตถุดิบอาหารในตู้เย็น เพื่อขอให้ ChatGPT ช่วยคิดเมนู หรือขอให้วิเคราะห์กราฟข้อมูลของงานที่เรากำลังทำอยู่ เป็นต้น โดยถ้าหากต้องการโฟกัสไปที่ส่วนใดส่วนหนึ่งของรูปภาพ ผู้ใช้ก็สามารถใช้เครื่องมือวาดภาพในแอป ChatGPT บนมือถือได้

สำหรับการเริ่มต้นใช้งานฟีเจอร์นี้ ให้แตะปุ่มรูปภาพเพื่อถ่ายภาพหรือเลือกรูปภาพจากแกลอรี่ (ผู้ใช้งาน iOS หรือ Android ให้แตะปุ่มบวกก่อน)

ฟีเจอร์การทำความเข้าใจรูปภาพดังกล่าวจะขับเคลื่อนโดย multimodal GPT-3.5 และ GPT-4 โดยโมเดลเหล่านี้จะใช้ทักษะการใช้เหตุผลทางภาษากับรูปภาพที่หลากหลาย เช่น ภาพถ่าย ภาพหน้าจอ และเอกสารที่มีทั้งข้อความและรูปภาพ

ฟีเจอร์นี้พร้อมใช้งานเมื่อไร?

ChatGPT เวอร์ชันใหม่จะรองรับคุณสมบัติเสียงและรูปภาพสำหรับผู้ใช้ระดับ Plus และ Enterprise ภายในสองสัปดาห์ข้างหน้า โดยสำหรับฟีเจอร์เสียง ผู้ใช้จะสามารถพูดคุยกับ ChatGPT ได้บน iOS และ Android ซึ่งผู้ใช้สามารถเปิดใช้งานฟีเจอร์นี้ได้ในการตั้งค่า ในขณะที่ฟีเจอร์ด้านรูปภาพจะพร้อมใช้งานบนทุกแพลตฟอร์ม

ที่มา: OpenAI