Deepmind โชว์ความสามารถของปัญญาประดิษฐ์ video-to-audio (V2A)
Text To Video ก็มีแล้ว เห็นภาพความสามารถของน้อง Ai ที่สร้างภาพในจินตนาการของเราให้ออกมาได้ รอบนี้เพื่อความครบเครื่องสมบูรณ์ ขอแนะนำให้รู้จัก Deepmind เทคโนโลยีปัญญาประดิษฐ์ใหม่ล่าสุดที่ชื่อว่า “V2A” ย่อมาจาก “Video-to-Audio” ซึ่งมีความสามารถในการเติมเสียงเข้าไปยังวิดีโอได้ตามคำสั่ง เทคโนโลยีนี้เปิดกว้างแนวทางการใช้งานที่หลากหลาย ดังนี้
- เติมเสียงใส่วิดีโอที่สร้างจาก Ai : V2A สามารถสร้างเสียงบรรยายหรือบทสนทนาให้กับวิดีโอที่สร้างจาก AI ได้อย่างสมจริง
- เติมเสียงใส่วิดีโอเก่าที่ไม่มีเสียงแล้ว: V2A สามารถเติมเสียงบรรยายหรือเพลงประกอบให้กับวิดีโอเก่าที่ไม่มีเสียงแล้วได้
- ปรับแต่งโทนของเสียง: V2A รองรับ Prompt จากผู้ใช้ ทำให้สามารถปรับแต่งโทนของเสียงได้หลากหลาย เช่น ต้องการใส่เพลงประกับซีนนั้นๆ หรือต้องการเพียงเสียงประกอบเฉยๆ
จุดเด่นของ V2A:
- เข้าใจเนื้อหาของวิดีโอ: V2A เข้าใจบริบทของวิดีโอ ทำให้สามารถสร้างเสียงที่ลงจังหวะกับวิดีโอพอดีได้ในตัว
- ซิงก์เสียงกับใบหน้า: V2A สามารถสร้างเสียงจากบทพูดแล้วซิงก์กับใบหน้าของตัวละครในวิดีโอได้
ถือว่าเป็นอีกสิ่งที่น่าสนใจมากที่ Deepmind สามารถเข้ามาช่วยสร้างประสบการณ์ให้กับคอนเทนต์วิดีโอได้ดีมาก แต่ก็ยังคงมีข้อจำกัดการใช้งาน V2A ไว้กับชุมชนครีเอเตอร์ในช่วงแรก เพื่อควบคุมการใช้งานและป้องกันการใช้ในทางที่ผิด สามารถติดตามการเคลื่อนไหวของเจ้า Ai เสียงตัวนี้ได้ที่ https://www.youtube.com/@Google_DeepMind
ที่มา: nbcnews