Deepmind เปิดตัว Video-to-Audio (V2A) สร้างเสียงให้วิดีโอได้! (มีคลิปให้ดู)

Deepmind โชว์ความสามารถของปัญญาประดิษฐ์ video-to-audio (V2A)

Text To Video ก็มีแล้ว เห็นภาพความสามารถของน้อง Ai ที่สร้างภาพในจินตนาการของเราให้ออกมาได้ รอบนี้เพื่อความครบเครื่องสมบูรณ์ ขอแนะนำให้รู้จัก Deepmind เทคโนโลยีปัญญาประดิษฐ์ใหม่ล่าสุดที่ชื่อว่า “V2A” ย่อมาจาก “Video-to-Audio” ซึ่งมีความสามารถในการเติมเสียงเข้าไปยังวิดีโอได้ตามคำสั่ง เทคโนโลยีนี้เปิดกว้างแนวทางการใช้งานที่หลากหลาย ดังนี้

เติมเสียงใส่วิดีโอที่สร้างจาก Ai : V2A สามารถสร้างเสียงบรรยายหรือบทสนทนาให้กับวิดีโอที่สร้างจาก AI ได้อย่างสมจริง
เติมเสียงใส่วิดีโอเก่าที่ไม่มีเสียงแล้ว: V2A สามารถเติมเสียงบรรยายหรือเพลงประกอบให้กับวิดีโอเก่าที่ไม่มีเสียงแล้วได้
ปรับแต่งโทนของเสียง: V2A รองรับ Prompt จากผู้ใช้ ทำให้สามารถปรับแต่งโทนของเสียงได้หลากหลาย เช่น ต้องการใส่เพลงประกับซีนนั้นๆ หรือต้องการเพียงเสียงประกอบเฉยๆ

จุดเด่นของ V2A:

เข้าใจเนื้อหาของวิดีโอ: V2A เข้าใจบริบทของวิดีโอ ทำให้สามารถสร้างเสียงที่ลงจังหวะกับวิดีโอพอดีได้ในตัว
ซิงก์เสียงกับใบหน้า: V2A สามารถสร้างเสียงจากบทพูดแล้วซิงก์กับใบหน้าของตัวละครในวิดีโอได้

ถือว่าเป็นอีกสิ่งที่น่าสนใจมากที่ Deepmind สามารถเข้ามาช่วยสร้างประสบการณ์ให้กับคอนเทนต์วิดีโอได้ดีมาก แต่ก็ยังคงมีข้อจำกัดการใช้งาน V2A ไว้กับชุมชนครีเอเตอร์ในช่วงแรก เพื่อควบคุมการใช้งานและป้องกันการใช้ในทางที่ผิด สามารถติดตามการเคลื่อนไหวของเจ้า Ai เสียงตัวนี้ได้ที่ https://www.youtube.com/@Google_DeepMind

ที่มา: nbcnews