Runway ra mắt Gen-4: AI tạo video 'nhất quán' đầu tiên, giải quyết bài toán khó của Sora, OpenAI

Yu Ki San · 19:38 Hôm qua

Công ty trí tuệ nhân tạo (AI) Runway vừa giới thiệu Gen-4, mô hình tạo video thế hệ mới nhất của mình, với tuyên bố đã giải quyết được một trong những thách thức lớn nhất của các công cụ AI tạo video hiện nay: tính nhất quán.

Những điểm chính:

Công ty AI Runway ra mắt mô hình tạo video mới Gen-4 vào ngày 1/4.
Gen-4 được quảng bá là có khả năng duy trì tính nhất quán về nhân vật, phong cách, địa điểm tốt hơn các AI tạo video hiện có (như Sora).
Công nghệ sử dụng tài liệu tham khảo trực quan (ảnh/video) kết hợp câu lệnh văn bản để kiểm soát kết quả.
Hiện chỉ khả dụng cho người dùng trả phí và doanh nghiệp của Runway.
Runway là startup AI nổi tiếng, từng tham gia kỹ xảo cho phim đoạt Oscar Everything Everywhere All At Once.

Gen-4: Hứa hẹn video AI 'nhất quán' hơn

Một trong những hạn chế lớn của các mô hình AI tạo video như Sora của OpenAI là khó khăn trong việc duy trì sự nhất quán của nhân vật, đối tượng hoặc phong cách qua nhiều cảnh quay khác nhau trong một video dài. Nhân vật có thể thay đổi ngoại hình, trang phục, hoặc bối cảnh có thể biến đổi một cách phi logic.

Runway cho biết Gen-4 được thiết kế để khắc phục vấn đề này. "Video do AI tạo ra có thể gặp khó khăn khi duy trì tính nhất quán trong việc kể chuyện," Runway viết trên X (trước đây là Twitter) vào ngày 1/4. "Bằng cách sử dụng tài liệu tham khảo trực quan kết hợp câu lệnh hướng dẫn, Gen-4 cho phép người dùng tạo hình ảnh và video với phong cách, chủ đề, địa điểm thống nhất, liên tục và khả năng kiểm soát trong câu chuyện."

Theo Runway, Gen-4 có thể tạo ra nhân vật, địa điểm một cách chính xác, sau đó tái tạo các yếu tố này từ nhiều góc nhìn và vị trí khác nhau theo yêu cầu, giúp các cảnh quay trở nên liền mạch và "giữ nguyên phong cách, tâm trạng và các yếu tố điện ảnh đặc trưng".

Các video demo do Runway công bố, có độ dài từ 60-100 giây với nhiều thể loại, cho thấy khả năng duy trì nhân vật (ví dụ: một người phụ nữ) qua các bối cảnh và điều kiện ánh sáng khác nhau. The Verge đánh giá các đoạn phim này "có độ nhất quán và liền mạch hơn hẳn các trình tạo video AI hiện nay" như Sora.

Cách sử dụng và nền tảng công nghệ

Gen-4 hiện được triển khai cho người dùng trả phí và doanh nghiệp của Runway. Quy trình sử dụng bao gồm việc truy cập công cụ Runway, tạo nội dung ban đầu (bằng câu lệnh hoặc ảnh/video tham chiếu), sau đó mô tả bố cục và các yếu tố mong muốn để AI tiếp tục tạo hoặc chỉnh sửa.

Runway không tiết lộ chi tiết về dữ liệu huấn luyện cho Gen-4. Mô hình này được giới thiệu sau một năm kể từ khi hãng ra mắt Gen-3 Alpha (cho phép tạo video dài hơn 1 phút), vốn từng gây tranh cãi vì nghi vấn sử dụng dữ liệu video không xin phép.

Runway: Startup AI và thành tựu

Runway, thành lập năm 2018, là một startup nổi tiếng trong lĩnh vực AI ứng dụng cho video. Công ty cung cấp các công cụ hỗ trợ chỉnh sửa video nhanh chóng bằng AI, như xóa phông, thêm hiệu ứng. Đặc biệt, Runway từng tham gia thực hiện kỹ xảo AI cho bộ phim đoạt giải Oscar "Everything Everywhere All At Once".

Runway Gen-4 được xem là một bước tiến đáng kể trong lĩnh vực AI tạo video, đặc biệt là trong việc giải quyết vấn đề cốt lõi về tính nhất quán. Nếu những tuyên bố của Runway là chính xác và công cụ này hoạt động hiệu quả trong thực tế, Gen-4 có thể trở thành một công cụ mạnh mẽ hơn cho các nhà làm phim, nhà sáng tạo nội dung so với các đối thủ hiện có như Sora, định vị Runway là một đối thủ cạnh tranh đáng gờm của OpenAI trong cuộc đua AI tạo video.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Runway ra mắt Gen-4: AI tạo video 'nhất quán' đầu tiên, giải quyết bài toán khó của Sora, OpenAI

Yu Ki San

Writer

Yu Ki San

Nghiên cứu của Carnegie Mellon và Microsoft: AI tạo sinh đang âm thầm làm "teo não" dân công sở như thế nào?

Báo cáo GSMA 2025: 82% năng lượng mạng di động tiêu tốn ở RAN. AI và các giải pháp xanh đóng vai trò chiến lược

Chuyên gia cảnh báo AI có thể làm suy giảm kỹ năng cốt lõi của con người trong 10 năm tới

Cách sử dụng AI viết content sao cho hiệu quả

Hàn Quốc tuyên chiến với sản phẩm âm nhạc tạo ra bằng AI

AI vượt qua bài kiểm tra Turing, mở ra kỷ nguyên AI không thể phân biệt với con người

Tại sao xôi xoài là một trong những món ăn mùa hè được yêu thích nhất của Thái Lan

Pisen hợp tác Viettel Store: Đưa trải nghiệm thay pin đạt chuẩn quốc tế tới người Việt

MediaTek ra mắt chip Kompanio Ultra cho laptop: hiệu suất AI tới 50 TOPS, thách thức Intel và Qualcomm

BYD SEALION 6 chuẩn bị 'đổ bộ' Việt Nam, mẫu xe Hybrid đầu tiên BYD có gì ấn tượng?

iPhone 14 và 14 Plus giảm giá sâu tại Việt Nam sau khi bị Apple 'khai tử', nguồn cung sắp cạn

Việt Nam có thể sở hữu một trong những mạng lưới trạm mặt đất Starlink lớn nhất khu vực

Người dùng Internet Việt Nam sẽ hưởng lợi lớn trong năm 2025 nhờ 2 yếu tố này

Nghiên cứu của Carnegie Mellon và Microsoft: AI tạo sinh đang âm thầm làm "teo não" dân công sở như thế nào?

Phát hiện chấn động từ vũ trụ có thể viết lại sách giáo khoa vật lý!

Báo cáo GSMA 2025: 82% năng lượng mạng di động tiêu tốn ở RAN. AI và các giải pháp xanh đóng vai trò chiến lược

Đánh giá nổi bật