Meta เผยภาพรวมของระบบ AI ใหม่ ‘Voicebox’ ที่ช่วยให้ผู้ใช้งานสามารถแปลงข้อความ (Text) เป็นเสียง (Voice) ในรูปแบบต่าง ๆ ได้
หากใครนึกภาพไม่ออกก็ลองนึกถึงการที่เราใส่ข้อความแบบ Text ลงไปในคลิป TikTok และตัวแอปจะสามารถอ่านออกเสียง Text เหล่านั้นในวิดีโอโดยที่เราไม่ต้องใส่ Voice over ของตนเอง
โดย AI ตัวนี้มีความสามารถในการประมวลผลได้ถึง 6 ภาษา และยังสามารถทำการลบเสียงรบกวน แก้ไขเนื้อหา เปลี่ยนแปลงสไตล์เสียงและอื่น ๆ อีกมากมาย นอกจากนี้ Voicebox ยังสามารถสร้างคลิปเสียงที่มีคุณภาพสูงและแก้ไขเสียงที่บันทึกไว้ล่วงหน้าได้ เช่นการลบเสียงรบกวนจากยานพาหนะหรือเสียงสุนัขเห่า
อีกทั้งยังช่วยให้ผู้ที่มีปัญหาด้านการมองเห็นได้ยินข้อความที่เพื่อนส่งมาในรูปแบบเสียง นอกจากนี้ยังช่วยให้ผู้ใช้งานสามารถพูดภาษาต่างประเทศด้วยเสียงของตัวเองได้อีกด้วย
ซึ่งการพัฒนาในครั้งนี้ก็อาจนำมาสู่เทคโนโลยี Deepfake รูปแบบใหม่ซึ่งถึงแม้ว่าจะมีเครื่องมือที่คล้ายกันอยู่แล้ว แต่ก็ไม่เหมือนกันเสียทีเดียวและทาง Meta ก็ได้กล่าวว่ามันไม่ได้มีประสิทธิภาพเท่ากระบวนการ Voicebox นี้
และหากมองประโยชน์ของ AI ตัวนี้ในวงกว้างเลยก็คือ ความสามารถในการแปลและการเปลี่ยนแปลงข้อความแบบตัวอักษรไปเป็นข้อความเสียงที่ฟังดูเป็นธรรมชาติและเข้าใจง่าย ซึ่งประโยชน์ข้อนี้ก็อาจช่วยเปิดโอกาสในการทำการค้าหรือการสื่อสารระหว่างประเทศอีกด้วย
โดยในขั้นตอนการสร้างเจ้า Voicebox นี้ Meta ยังไม่ได้เปิดเผยคำสั่ง รวมถึงโค้ดในโปรแกรม หรือแอปพลิเคชันสู่สาธารณะ และอ้างถึงความเสี่ยงที่อาจเกิดจากการใช้งานที่ผิดประเภท ดังนั้นการออกมาประกาศของ Meta ในครั้งนี้ เพียงแค่เพื่อให้ข้อมูลเท่านั้น ไม่ใช่การเปิดตัวแบบจริงจังแต่อย่างใด
ที่มา: SocialMediaToday