AIFacebookMetaNews

Avatar

Thesky October 7, 2024

Meta โชว์พรีวิว ‘Movie Gen’ เครื่องมือ AI ใหม่ที่สร้างซีนทั้งภาพ วิดีโอ เสียง และแอนิเมชัน 3D ได้

ถือว่าเป็น Next wave ใหม่ของ Meta เลยก็ว่าได้ ซึ่งเครื่องมือ Video generation tool ตัวนี้มีชื่อว่า “Movie Gen” ที่สามารถสร้างภาพ และวิดีโอคุณภาพสูงได้ รวมถึงแก้ไขได้ด้วย โดยหวังว่าเครื่องมือนี้จะช่วยทำให้ความคิดสร้างสรรค์ออกมาเป็นผลงานคุณภาพได้

ด้วยโมเดลซีรีส์ Make-A-Scene ก็จะช่วยให้สามารถสร้างภาพเสียงวิดีโอและแอนิเมชัน 3D ได้ง่ายขึ้น โดยมีการทำงานผสมผสานกับ  Llama Image foundation เลยทำให้วิดีโอที่ได้ไม่เคยมีความละเอียดเท่านี้มาก่อน ซึ่ง Meta มีการฝึกชุดโมเดลจากชุดข้อมูลที่ได้รับอนุญาตแล้ว รวมถึงชุดข้อมูลที่เปิดให้ใช้งานสาธารณะ

Video generation

โมเดลทรานสฟอร์มเมอร์พารามิเตอร์ 30B ช่วยสร้างวิดีโอที่มีความยาวสูงสุด 16 วินาทีด้วยอัตรา 16 เฟรมต่อวินาทีได้ ทำให้การเคลื่อนไหวของวัตถุ หรือการโต้ตอบระหว่างวัตถุ รวมถึงการเคลื่อนที่ของกล้องสามารถเรียนรู้ถึงความสมจริงของเฟรมแบบภาพยนตร์ได้ ทำให้โมเดลเหล่านี้กลายเป็นโมเดลที่ทันสมัยที่สุดในหมวดหมู่นี้

Personalized Videos

สำหรับ Movie Gen ยังสามารถใช้สร้างวิดีโอแบบส่วนบุคคลได้ด้วย โดยการรวมภาพที่มีอยู่เข้ากับ text prompt เพื่อเจนออกมาเป็นวิดีโอที่ต้องการได้ โดยการลักษณะ และท่าทางการเคลื่อนไหวยังคงมีความเป็นมนุษย์อยู่ และรูปที่นำมาเป็นต้นแบบใบหน้าบุคคลก็ถูกทำให้มีความเหมือนมากขึ้น

Precise video editing

การแก้ไขส่วนองค์ประกอบในวิดีโอที่มีความละเอียด และต้องกลมกลืนไปกับวัตถุนั้น Movie Gen ก็สามารถทำให้เนียนขึ้นกว่าเดิมได้ ด้วยการผสมผสานการสร้างวิดีโอเข้ากับการแก้ไขภาพขั้นสูงแบบเฉพาะจุด เช่น การลบวัตถุ การเพิ่มองค์ประกอบ และการเปลี่ยนสี เป็นต้น
แต่ที่แตกต่างคือ Movie Gen จะรักษาเนื้อหาต้นฉบับในวิดีโอไว้ และกำหนดเป้าหมายการเปลี่ยนแปลงเฉพาะจุดได้กับพิกเซลที่เกี่ยวข้องเลย

Audio generation

ในที่สุด Meta ก็สามารถเปลี่ยนให้โมเดลการสร้างเสียงพารามิเตอร์ 13B สามารถรองรับวิดีโอ และสร้างเสียงคุณภาพสูงได้นานถึง 45 วินาที แม้กระทั่งเสียงสัง ambient และเสียงเอฟเฟกต์แบบ Foley หรือ instrumental background music ก็ทำให้ได้ เพียงแค่นำมาซิงก์เข้ากับวิดีโอที่มี

ซึ่งการซิงก์ระหว่างวิดีโอ และเสียงจากการป้อนพรอมพ์ที่ต้องการ จะมีการทำให้เหมือนภาพยนตร์ ทั้งความคมชัด และปรับความดังเบาไปตามเนื้อหาวิดีโอที่ควรจะเป็นได้

Results

จากผลลัพธ์การใช้งานก็สามารถเปรียบเทียบผ่านการทดสอบแบบ A/B human evaluation ได้ ว่าความสามารถทั้ง 4 ของโมเดล Movie Gen ก็พบว่ายังต้องผลักดันนวัตกรรมทางเทคนิคหลายๆ อย่างเกี่ยวกับการฝึกอบรมโมเดล สูตรข้อมูล โปรโตคอลการประเมิน และการปรับปรุงการวินิจฉัยที่คาดว่าจะเกิดขึ้นกับการใช้งานให้มีประสิทธิภาพมากที่สุด

โดยสรุปแล้ว Movie Gen นั้นนับว่าเป็นโมเดลที่น่าสนใจไม่น้อยสำหรับการนำไปสร้างวิดีโอ ภาพหรือเสียงที่ต้องการ โดยไม่ต้องผ่านโปรแกรมเฉพาะทาง แต่สามารถทำได้บน Meta ซึ่งตอนนี้ยังเป็นพรีวิวการใช้งานอยู่

ที่มา: https://ai.meta.com/blog/movie-gen-media-foundation-models-generative-ai-video/

Copyright © 2024 RAiNMaker. All rights reserved.

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า

Privacy Preferences

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

Allow All
Manage Consent Preferences
  • Always Active

Save