จาก ChatGPT ที่สร้างปรากฏการณ์ AI ให้ทุกคนไปทั่วโลก ตอนนี้ OpenAI ก็ได้มีโมเดล AI ใหม่อย่าง “Sora” ที่สามารถเจนวิดีโอจากการป้อนพรอมพ์ตัวอักษรออกมาให้เห็นกันแล้ว ซึ่งแม้คลิปที่สร้างจะต้องมีความยาวเพียงแค่ 1 นาทีเท่านั้น แต่บอกเลยว่าทั้งความละเอียด และการเคลื่อนไหวนั้นเหมือนจริงเข้าไปทุกที!
ในตอนนี้วิวัฒนาการของ AI นั้นนับว่ามีความใกล้เคียง และเหมือนจริงมาก แต่เรามักจะคุ้นเคยกับการแยกภาพนิ่งระหว่างภาพจริง กับภาพที่เจนจาก AI ไม่ออกมากกว่า แต่ครั้งนี้จะยกระดับขึ้นไปอีกขั้น เพราะ Sora โมเดล AI ใหม่จากผู้สร้าง ChatGPT พิสูจน์ให้เห็นแล้วว่าอนาคตย่อมเป็นไปได้
โดย Sora สามารถสร้างฉาก และการเคลื่อนไหวที่ซับซ้อนเหมือนกับภาพยนตร์เรื่องหนึ่งได้ ต่อให้จะมีองค์ประกอบหลายแบบ หรือตัวละครหลายคน และการเคลื่อนไหวแบบเฉพาะแค่ไหนก็สามารถสร้างออกมาให้ตามบรีฟ หรือไม่ก็เกินคาดไปมากกว่าบรีฟเลยก็ว่าได้
เพราะ Sora เป็นโมเดล AI ขั้นสูงที่มีความเข้าใจทั้งกายภาพ และทุกสิ่งทุกอย่างที่โลกมีจริง ๆ ก็เลยทำให้มีความเข้าใจสิ่งที่ผู้ป้อนพรอพม์ต้องการด้วย โดยเฉพาะโมเดลภาษาต่าง ๆ ที่เข้าใจ และตีความได้แบบลึกมากขึ้น เลยทำให้วิดีโอ หรือภาพเคลื่อนไหวออกมาดูมีชีวิต
แต่ก็ยังมีติดขัดเรื่องของรายละเอียดในเชิงพื้นที่ มุมกล้อง การสับสนระหว่างซ้ายขวา หรือการคิดให้เชื่อมโยงจากเหตุการณ์ที่เกิดขึ้นอยู่ เช่น บรีฟให้กัดคุกกี้แต่ยังไม่มีรอยกัด หรือคนวิ่งบนลู่วิ่งแต่หันหน้าผิดทาง เป็นต้น ซึ่งทางทีมก็คงนำไปพัฒนาให้ดีขึ้นต่อในเวอร์ชันอนาคต
นอกจากนี้เรื่องความปลอดภัยอื่น ๆ ที่การเป็นโมเดล AI ขั้นสูงอย่าง Sora ที่เป็นการต่อยอดมาจาก มเดล DALL·E และ GPT ต้องระวัง นั่นก็คือการคัดกรองเนื้อหา หรือพรอมพ์ที่ไม่ถูกต้อง หรือพรอมพ์ที่สามารถสร้างความเกลียดชัง หรือคติ นักวิจัยก็ต้องทำการทดสอบให้โมเดลนี้มีความปลอดภัยมากยิ่งขึ้นด้วย แต่เราเชื่อว่านี่จะเป็นวิวัฒนาการโมเดล AI ที่เปลี่ยนอะไรหลาย ๆ อย่างในอนาคตได้ไม่มากก็น้อยค่ะ
สามารถเข้าไปรับชมวิดีโอจาก Sora ได้ที่นี่: https://openai.com/sora