Xuất hiện công cụ AI tạo video chỉ từ ảnh tĩnh đến từ công ty mẹ của TikTok, chất lượng đáng gờm

Mai Nhung
Mai Nhung
Phản hồi: 0

Mai Nhung

Writer
ByteDance, công ty mẹ của TikTok, vừa giới thiệu OmniHuman-1, một hệ thống AI đột phá có khả năng tạo video chân thực kèm âm thanh chỉ từ một bức ảnh duy nhất. Công nghệ này hứa hẹn sẽ mở ra những ứng dụng mới trong nhiều lĩnh vực, từ giải trí, giáo dục đến truyền thông, nhưng cũng đặt ra những lo ngại về nguy cơ bị lạm dụng.

shortlink-vn-140_jpg_75.jpg

OmniHuman-1: "Phù thủy" biến ảnh thành video

Theo mô tả trên kho lưu trữ mở trực tuyến arXiv và Github, OmniHuman-1 "vượt trội so với các phương pháp biến ảnh thành video hiện có, cung cấp các video về con người cực kỳ chân thực kèm âm thanh". Điểm đặc biệt của công cụ này là khả năng hỗ trợ đầu vào là ảnh ở bất kỳ tỷ lệ khung hình nào, từ ảnh chân dung, ảnh bán thân đến toàn thân, mang lại kết quả giống thật với chất lượng cao.

Bước đột phá của OmniHuman-1 đến từ việc được đào tạo trên một kho dữ liệu khổng lồ, bao gồm hơn 18.700 giờ video. Nhờ đó, AI có thể bắt chước cách con người di chuyển, nói và tương tác, tạo ra những video chân thực đến kinh ngạc.

Trên trang dự án OmniHuman-1, ByteDance đã trình diễn nhiều video ấn tượng, cho thấy khả năng tái hiện sống động các nhân vật hoạt hình, động vật và cả nhân vật lịch sử. Trong một video, nhà vật lý học Albert Einstein được "hồi sinh" với những cử chỉ tay và biểu cảm khuôn mặt tinh tế, như thể đang thuyết trình trước bảng đen.


Giới chuyên gia đã dành nhiều lời khen ngợi cho công cụ mới của ByteDance. Phó giáo sư Freddy Tran Nager của Trường Báo chí và Truyền thông Annenberg thuộc Đại học Nam California nhận xét: "Trông thật ấn tượng. Nếu bạn nghĩ đến việc hồi sinh Humphrey Bogart trong phim, tôi không rõ sẽ thế nào trên màn ảnh rộng. Nhưng trên màn hình nhỏ như smartphone, các video này thực sự rất ấn tượng".

Tiềm năng ứng dụng và nguy cơ lạm dụng

OmniHuman-1
hiện vẫn là một dự án nghiên cứu. Tuy nhiên, theo TechRadar, ByteDance có thể sẽ sớm đưa AI này lên TikTok, cho phép người dùng tạo video nhanh chóng chỉ từ một bức ảnh.

Tiềm năng ứng dụng của OmniHuman-1 là rất lớn. Trong lĩnh vực giải trí, nó có thể được sử dụng để tạo ra các video ca nhạc, phim ảnh, quảng cáo với chi phí thấp và hiệu quả cao. Trong giáo dục, nó có thể giúp "hồi sinh" các nhân vật lịch sử, tạo ra các bài giảng sinh động và hấp dẫn. Trong truyền thông, nó có thể hỗ trợ sản xuất các bản tin, phóng sự với hình ảnh và âm thanh chân thực.

Tuy nhiên, TechRadar cũng bày tỏ lo ngại về việc OmniHuman-1 có thể bị sử dụng cho các mục đích "không chính đáng" như tạo video giả mạo, lan truyền thông tin sai lệch.

OmniHuman-1-ByteDance-Text-to-Video-1170x658_webp_75(1).jpg


OmniHuman-1 của ByteDance là một bước tiến đáng chú ý trong lĩnh vực AI tạo sinh. Công nghệ này mở ra nhiều tiềm năng ứng dụng thú vị, nhưng cũng đặt ra những thách thức về đạo đức và quản lý. Việc ByteDance có thể sớm tích hợp OmniHuman-1 vào TikTok cho thấy công nghệ này không còn xa vời mà đang dần trở thành một phần trong cuộc sống hàng ngày của chúng ta.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top