Vidu S1: AI video đột phá, biến Mona Lisa thành đối tác trò chuyện trực tuyến

Derpy · 09:39

Nếu như trước đây các mô hình AI tạo video cạnh tranh về chất lượng hình ảnh và độ chân thực, thì cuộc đua hiện nay đang dần chuyển sang một tiêu chí mới: khả năng tương tác theo thời gian thực. Thay vì chỉ tạo một đoạn video hoàn chỉnh sau khi nhận lệnh, các mô hình mới hướng đến việc duy trì cuộc trò chuyện liên tục, phản hồi tức thì và điều khiển nhân vật AI như đang gọi video trực tiếp.

Tại Hội nghị Kinh tế Kỹ thuật số Toàn cầu 2026, Shengshu Technology đã giới thiệu Vidu S1, mô hình video AI thời gian thực do nhóm nghiên cứu của Giáo sư Zhu Jun phát triển. Điểm khác biệt của Vidu S1 là cho phép người dùng trò chuyện bằng giọng nói với nhân vật AI, đồng thời nhân vật có thể thay đổi biểu cảm, khẩu hình và hành động ngay trong quá trình đối thoại mà không cần tạo lại toàn bộ video.

Theo Shengshu, người dùng chỉ cần tải lên một hình ảnh để tạo nhân vật, thay vì phải trải qua quá trình huấn luyện hay mô hình hóa như trước. Hệ thống cũng hỗ trợ tùy chỉnh giọng nói và duy trì hình ảnh nhân vật trong suốt quá trình tương tác.

Về mặt kỹ thuật, Vidu S1 có thể tạo video ở độ phân giải 540P với tốc độ 25 khung hình/giây, tối đa 42 khung hình/giây, đồng thời hỗ trợ tạo nội dung liên tục trong thời gian dài. Mô hình sử dụng kiến trúc kết hợp giữa tự hồi quy và khuếch tán (AR + Diffusion), cho phép liên tục tạo từng khung hình mới dựa trên ngữ cảnh và các lệnh vừa nhận, thay vì phải dựng xong toàn bộ video trước khi phát.

Nhóm phát triển cho biết công nghệ này hướng tới các ứng dụng như trợ lý AI, nhân vật ảo, livestream tương tác, giáo dục, chăm sóc khách hàng và trò chơi. Đây cũng là xu hướng mà nhiều công ty AI đang theo đuổi, khi mục tiêu không còn chỉ là tạo video đẹp mà là xây dựng các nhân vật AI có thể giao tiếp và phản hồi gần như theo thời gian thực.

Sự xuất hiện của những mô hình như Vidu S1 cho thấy video AI đang bước sang một giai đoạn mới, nơi chất lượng hình ảnh vẫn quan trọng nhưng khả năng tương tác, phản hồi nhanh và duy trì hội thoại lâu dài sẽ trở thành yếu tố quyết định.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Vidu S1: AI video đột phá, biến Mona Lisa thành đối tác trò chuyện trực tuyến

Derpy

Intern Writer

Derpy

"Cha đẻ" TikTok tìm ra quy luật giúp AI tự học nhanh gấp đôi sau mỗi ba tháng

AI đang thay đổi lưới điện: Không chỉ là lượng tiêu thụ, mà là cách thức vận hành

Alibaba "cấm cửa" AI của Anthropic sau nghi vấn theo dõi lập trình viên Trung Quốc

Đánh giá Claude Fable 5: Hiệu năng chuyên biệt dành cho giới chuyên môn

Kỹ sư phần mềm dễ bị AI 'thay thế': Huyền thoại Kent Beck chỉ ra điểm yếu chết người

Google "ngốn" điện kỷ lục 37% vì AI, phát thải carbon tổng thể vẫn tăng.

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Ghế trẻ em trên ô tô gồm những loại nào, bao nhiêu tuổi thì cần dùng ?

Đánh giá nổi bật