Runway ra mắt Gen-4: AI tạo video 'nhất quán' đầu tiên, giải quyết bài toán khó của Sora, OpenAI

Yu Ki San
Yu Ki San
Phản hồi: 0

Yu Ki San

Writer
Công ty trí tuệ nhân tạo (AI) Runway vừa giới thiệu Gen-4, mô hình tạo video thế hệ mới nhất của mình, với tuyên bố đã giải quyết được một trong những thách thức lớn nhất của các công cụ AI tạo video hiện nay: tính nhất quán.

hq720_jpg_75(9).jpg

Những điểm chính:
  • Công ty AI Runway ra mắt mô hình tạo video mới Gen-4 vào ngày 1/4.
  • Gen-4 được quảng bá là có khả năng duy trì tính nhất quán về nhân vật, phong cách, địa điểm tốt hơn các AI tạo video hiện có (như Sora).
  • Công nghệ sử dụng tài liệu tham khảo trực quan (ảnh/video) kết hợp câu lệnh văn bản để kiểm soát kết quả.
  • Hiện chỉ khả dụng cho người dùng trả phí và doanh nghiệp của Runway.
  • Runway là startup AI nổi tiếng, từng tham gia kỹ xảo cho phim đoạt Oscar Everything Everywhere All At Once.
Gen-4: Hứa hẹn video AI 'nhất quán' hơn

Một trong những hạn chế lớn của các mô hình AI tạo video như Sora của OpenAI là khó khăn trong việc duy trì sự nhất quán của nhân vật, đối tượng hoặc phong cách qua nhiều cảnh quay khác nhau trong một video dài. Nhân vật có thể thay đổi ngoại hình, trang phục, hoặc bối cảnh có thể biến đổi một cách phi logic.

Runway cho biết Gen-4 được thiết kế để khắc phục vấn đề này. "Video do AI tạo ra có thể gặp khó khăn khi duy trì tính nhất quán trong việc kể chuyện," Runway viết trên X (trước đây là Twitter) vào ngày 1/4. "Bằng cách sử dụng tài liệu tham khảo trực quan kết hợp câu lệnh hướng dẫn, Gen-4 cho phép người dùng tạo hình ảnh và video với phong cách, chủ đề, địa điểm thống nhất, liên tục và khả năng kiểm soát trong câu chuyện."

RW_HEADER_V2-1_webp_75.jpg


Theo Runway, Gen-4 có thể tạo ra nhân vật, địa điểm một cách chính xác, sau đó tái tạo các yếu tố này từ nhiều góc nhìn và vị trí khác nhau theo yêu cầu, giúp các cảnh quay trở nên liền mạch và "giữ nguyên phong cách, tâm trạng và các yếu tố điện ảnh đặc trưng".

Các video demo do Runway công bố, có độ dài từ 60-100 giây với nhiều thể loại, cho thấy khả năng duy trì nhân vật (ví dụ: một người phụ nữ) qua các bối cảnh và điều kiện ánh sáng khác nhau. The Verge đánh giá các đoạn phim này "có độ nhất quán và liền mạch hơn hẳn các trình tạo video AI hiện nay" như Sora.


Cách sử dụng và nền tảng công nghệ

Gen-4 hiện được triển khai cho người dùng trả phí và doanh nghiệp của Runway. Quy trình sử dụng bao gồm việc truy cập công cụ Runway, tạo nội dung ban đầu (bằng câu lệnh hoặc ảnh/video tham chiếu), sau đó mô tả bố cục và các yếu tố mong muốn để AI tiếp tục tạo hoặc chỉnh sửa.

Runway không tiết lộ chi tiết về dữ liệu huấn luyện cho Gen-4. Mô hình này được giới thiệu sau một năm kể từ khi hãng ra mắt Gen-3 Alpha (cho phép tạo video dài hơn 1 phút), vốn từng gây tranh cãi vì nghi vấn sử dụng dữ liệu video không xin phép.

Runway_Gen_4_-_01_jpg_75.jpg

Runway: Startup AI và thành tựu

Runway
, thành lập năm 2018, là một startup nổi tiếng trong lĩnh vực AI ứng dụng cho video. Công ty cung cấp các công cụ hỗ trợ chỉnh sửa video nhanh chóng bằng AI, như xóa phông, thêm hiệu ứng. Đặc biệt, Runway từng tham gia thực hiện kỹ xảo AI cho bộ phim đoạt giải Oscar "Everything Everywhere All At Once".

Runway Gen-4 được xem là một bước tiến đáng kể trong lĩnh vực AI tạo video, đặc biệt là trong việc giải quyết vấn đề cốt lõi về tính nhất quán. Nếu những tuyên bố của Runway là chính xác và công cụ này hoạt động hiệu quả trong thực tế, Gen-4 có thể trở thành một công cụ mạnh mẽ hơn cho các nhà làm phim, nhà sáng tạo nội dung so với các đối thủ hiện có như Sora, định vị Runway là một đối thủ cạnh tranh đáng gờm của OpenAI trong cuộc đua AI tạo video.
 
  • Untitled-60-1024x576_png_75.jpg
    Untitled-60-1024x576_png_75.jpg
    54.8 KB · Lượt xem: 12


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top