Runway, công ty đứng sau hiệu ứng hình ảnh AI trong bộ phim đoạt giải Oscar "Everything Everywhere All At Once", vừa ra mắt mô hình tạo video từ văn bản mới và nhanh chóng gây sốt trong cộng đồng mạng.
Được giới thiệu vào đầu tháng 7, Gen-3 Alpha là một bước tiến lớn so với mô hình Gen-2 miễn phí trước đó, với "sự cải thiện đáng kể về độ chân thực, tính nhất quán và chuyển động". Tốc độ tạo video cũng nhanh hơn đáng kể so với thế hệ trước.
Ngay sau khi ra mắt, Gen-3 Alpha đã thu hút sự chú ý lớn trên mạng xã hội. Nhiều người dùng đã chia sẻ video do công cụ này tạo ra và nhận được hàng trăm lượt bình luận. Đa số đều khen ngợi Gen-3 Alpha "tuyệt vời, chân thực", "không thể tin được", thậm chí còn lo ngại rằng các nhà quay phim và nhà sáng tạo nội dung video có thể "mất việc sớm hơn dự kiến". Nhiều người so sánh Gen-3 Alpha với Sora của OpenAI và nhận xét rằng hai mô hình này "ngang tài ngang sức", là "đối thủ xứng tầm".
Theo Runway, Gen-3 Alpha được phát triển lại từ đầu, sử dụng cơ sở hạ tầng mới được thiết kế riêng cho việc huấn luyện mô hình đa phương thức quy mô lớn. Mô hình mới được huấn luyện đồng thời trên cả hình ảnh và video để cải thiện tính chân thực.
Ngoài ra, Runway cũng tích hợp thuật toán AI cho phép cải thiện và kiểm soát chuyển động trong video một cách tự nhiên hơn. Mô hình có thể "hiểu" chuyển động trong thế giới thực và tái tạo lại chính xác trong video đầu ra. "Kết quả là người dùng có thể tạo ra những video gần gũi với thực tế", đại diện Runway cho biết trên blog của công ty.
Trong khi Gen-2 mất khoảng một phút để tạo video dài bốn giây, Gen-3 Alpha có thể xuất video tối thiểu 10 giây trong vòng chưa đầy 30 giây. Người dùng có thể sử dụng video, hình ảnh hoặc thậm chí chỉ một đoạn văn bản ngắn để tạo video. Phiên bản cũ chỉ hỗ trợ hình ảnh và văn bản.
Khác với Sora vẫn chưa được cung cấp rộng rãi, Gen-3 Alpha đã có sẵn để trải nghiệm, nhưng với mức phí 15 USD mỗi tháng hoặc 144 USD mỗi năm.
Runway được thành lập vào năm 2018, là một startup AI nổi tiếng với 45 nhân viên toàn thời gian. Công ty cung cấp các công cụ giúp người dùng chỉnh sửa video nhanh chóng, chẳng hạn như xóa phông hoặc thêm hiệu ứng. Ví dụ, trong bộ phim "Everything Everywhere All At Once" đoạt giải Oscar 2023, nghệ sĩ hiệu ứng hình ảnh Evan Halleck đã sử dụng AI tiên tiến của Runway để tạo hiệu ứng đặc biệt. "AI có thể tách chủ thể tốt hơn cả mắt người", ông nói. "Tôi có thể tách nhân vật khỏi hậu cảnh và đặt chúng lên một bức ảnh khác chỉ trong vài phút, thay vì mất cả nửa ngày như trước đây".
Runway hiện được định giá 1,5 tỷ USD sau khi huy động được 141 triệu USD từ các nhà đầu tư như Google và Nvidia. Theo The Information, công ty có thể sẽ nhận thêm 450 triệu USD vốn đầu tư trong thời gian tới, qua đó nâng mức định giá lên khoảng 4 tỷ USD.
Được giới thiệu vào đầu tháng 7, Gen-3 Alpha là một bước tiến lớn so với mô hình Gen-2 miễn phí trước đó, với "sự cải thiện đáng kể về độ chân thực, tính nhất quán và chuyển động". Tốc độ tạo video cũng nhanh hơn đáng kể so với thế hệ trước.
Ngay sau khi ra mắt, Gen-3 Alpha đã thu hút sự chú ý lớn trên mạng xã hội. Nhiều người dùng đã chia sẻ video do công cụ này tạo ra và nhận được hàng trăm lượt bình luận. Đa số đều khen ngợi Gen-3 Alpha "tuyệt vời, chân thực", "không thể tin được", thậm chí còn lo ngại rằng các nhà quay phim và nhà sáng tạo nội dung video có thể "mất việc sớm hơn dự kiến". Nhiều người so sánh Gen-3 Alpha với Sora của OpenAI và nhận xét rằng hai mô hình này "ngang tài ngang sức", là "đối thủ xứng tầm".
Theo Runway, Gen-3 Alpha được phát triển lại từ đầu, sử dụng cơ sở hạ tầng mới được thiết kế riêng cho việc huấn luyện mô hình đa phương thức quy mô lớn. Mô hình mới được huấn luyện đồng thời trên cả hình ảnh và video để cải thiện tính chân thực.
Ngoài ra, Runway cũng tích hợp thuật toán AI cho phép cải thiện và kiểm soát chuyển động trong video một cách tự nhiên hơn. Mô hình có thể "hiểu" chuyển động trong thế giới thực và tái tạo lại chính xác trong video đầu ra. "Kết quả là người dùng có thể tạo ra những video gần gũi với thực tế", đại diện Runway cho biết trên blog của công ty.
Trong khi Gen-2 mất khoảng một phút để tạo video dài bốn giây, Gen-3 Alpha có thể xuất video tối thiểu 10 giây trong vòng chưa đầy 30 giây. Người dùng có thể sử dụng video, hình ảnh hoặc thậm chí chỉ một đoạn văn bản ngắn để tạo video. Phiên bản cũ chỉ hỗ trợ hình ảnh và văn bản.
Khác với Sora vẫn chưa được cung cấp rộng rãi, Gen-3 Alpha đã có sẵn để trải nghiệm, nhưng với mức phí 15 USD mỗi tháng hoặc 144 USD mỗi năm.
Runway được thành lập vào năm 2018, là một startup AI nổi tiếng với 45 nhân viên toàn thời gian. Công ty cung cấp các công cụ giúp người dùng chỉnh sửa video nhanh chóng, chẳng hạn như xóa phông hoặc thêm hiệu ứng. Ví dụ, trong bộ phim "Everything Everywhere All At Once" đoạt giải Oscar 2023, nghệ sĩ hiệu ứng hình ảnh Evan Halleck đã sử dụng AI tiên tiến của Runway để tạo hiệu ứng đặc biệt. "AI có thể tách chủ thể tốt hơn cả mắt người", ông nói. "Tôi có thể tách nhân vật khỏi hậu cảnh và đặt chúng lên một bức ảnh khác chỉ trong vài phút, thay vì mất cả nửa ngày như trước đây".
Runway hiện được định giá 1,5 tỷ USD sau khi huy động được 141 triệu USD từ các nhà đầu tư như Google và Nvidia. Theo The Information, công ty có thể sẽ nhận thêm 450 triệu USD vốn đầu tư trong thời gian tới, qua đó nâng mức định giá lên khoảng 4 tỷ USD.