Google tung ra mô hình AI tạo video, đối đầu trực tiếp Sora của OpenAI

Bỉ Ngạn Hoa

Moderator
Google cho biết Veo có thể tạo ra video có độ phân giải 1080p “chất lượng cao” từ các lời nhắc bằng văn bản, hình ảnh và video.
1715734297652.png

Đã ba tháng kể từ khi OpenAI trình diễn Sora, AI chuyển văn bản thành video hấp dẫn, và bây giờ Google đang cố gắng giành lấy một phần sự chú ý đó. Được công bố trong hội nghị nhà phát triển I/O vào hôm qua (14/5), Google cho biết Veo - mô hình video AI mới nhất của hãng - có thể tạo ra các video có độ phân giải 1080p “chất lượng cao” thời lượng hơn một phút với nhiều phong cách hình ảnh và điện ảnh khác nhau.

Theo thông cáo báo chí của Google, Veo có “sự hiểu biết nâng cao về ngôn ngữ tự nhiên”, cho phép mô hình này hiểu các thuật ngữ điện ảnh như “tua nhanh thời gian” hoặc “ảnh chụp phong cảnh từ trên không”. Người dùng có thể điều hướng đầu ra video của mình theo mong muốn bằng cách sử dụng lời nhắc dựa trên văn bản, hình ảnh hoặc video. Google cho biết video thu được “nhất quán và mạch lạc hơn”, mô tả chuyển động thực tế hơn của con người, động vật và đồ vật trong suốt các cảnh quay.

Giám đốc điều hành Google DeepMind Demis Hassabis cho biết trong buổi chia sẻ với báo chí rằng kết quả video có thể được tinh chỉnh bằng cách sử dụng các lời nhắc bổ sung và Google đang khám phá các tính năng bổ sung để cho phép Veo tạo bảng phân cảnh và cảnh dài hơn.
1715734325230.png

Giống như trường hợp của nhiều mô hình AI tạo sinh trước đó, hầu hết những người muốn dùng thử Veo có thể sẽ phải đợi một thời gian. Google cho biết họ đang mời các nhà làm phim và nhà sáng tạo chọn lọc thử nghiệm mô hình này để xác định cách nó có thể hỗ trợ tốt nhất cho các nhà sáng tạo và sẽ xây dựng dựa trên những sự hợp tác này để đảm bảo “những người sáng tạo có tiếng nói” trong cách phát triển công nghệ AI của Google.

Một số tính năng của Veo cũng sẽ được cung cấp cho “những người sáng tạo được chọn trong những tuần tới”. Bạn có thể đăng ký vào danh sách chờ tại đây để có cơ hội sớm dùng thử. Mặt khác, Google cũng đang có kế hoạch bổ sung một số khả năng của mình cho YouTube Shorts “trong tương lai”.

Đây là một trong những mô hình tạo video mà Google đã sản xuất trong vài năm qua, từ Phenaki và Imagen Video - sản xuất các video clip thô sơ, thường bị bóp méo - cho đến mô hình Lumiere mà hãng đã giới thiệu vào tháng 1 năm nay. So với các mô hình tạo video trước đó, Google cho biết Veo thậm chí còn có khả năng hiểu nội dung trong video nhiều hơn, mô phỏng vật lý trong thế giới thực, hiển thị đầu ra có độ phân giải cao, v.v.
1715734343903.png

Trong khi đó, OpenAI đã giới thiệu Sora tới Hollywood và dự định phát hành nó ra công chúng vào cuối năm nay. OpenAI cũng đang tìm cách kết hợp âm thanh vào Sora và có thể cung cấp mô hình này trực tiếp trong các ứng dụng chỉnh sửa video như Premiere Pro của Adobe. Do Veo cũng đang được coi là một công cụ dành cho các nhà làm phim, sự khởi đầu thuận lợi của OpenAI có thể khiến dự án của Google khó cạnh tranh hơn.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top