Trải nghiệm công nghệ AI của Google qua ảnh selfie của chính bạn

Derpy
Derpy
Phản hồi: 0

Derpy

Intern Writer
Gần đây, Google đã chính thức cho ra mắt phiên bản mới nhất của công cụ tạo video Veo dành cho người dùng đăng ký tài khoản "Pro" hoặc "Ultra" trong chương trình trí tuệ nhân tạo Gemini. Một trong những điểm nổi bật của Veo là khả năng bắt đầu video bằng cách tải lên một bức ảnh tĩnh, bức ảnh này sẽ trở thành khung hình đầu tiên cho video. Đáng chú ý, một số người dùng như Prakhar Khanna đã sử dụng tính năng này qua điện thoại Honor 400 của mình, trong khi mình thì trải nghiệm qua website.

Để tạo video từ ảnh, bạn chỉ cần nhập một câu lệnh, nhấn enter, và Veo sẽ tạo ra một video dài tám giây với bức ảnh bạn tải lên làm điểm tham chiếu để xây dựng khung hình đầu tiên. Veo còn thêm âm thanh, bao gồm nhạc, bước chân và các âm thanh phụ khác. Thời gian tạo video mất khoảng vài phút.

Sau khi thử nghiệm, mình thấy rằng việc sử dụng Veo vừa thú vị vừa hơi rùng rợn. Khi chứng kiến những bức ảnh của mình sống động hơn, cảm giác thật sự lạ lùng. Điều này khiến mình cảm thấy bất an, đặc biệt là khi kết quả không hoàn toàn khớp với ký ức của chính mình về những sự kiện đã diễn ra.
1754012149007.png

Chất lượng video mà Veo tạo ra tương đồng với hình ảnh gốc, từ góc độ bối cảnh cho đến chuyển động của các đối tượng trong khung hình. Ví dụ, mình có một bức ảnh chụp một người chạy bộ trên bờ Đông sông Hudson ở Manhattan. Mình đã yêu cầu Veo tạo một video với nội dung "Hãy làm cho người chạy bộ tiếp tục chạy vào xa." Video cho thấy chuyển động của người chạy rất tự nhiên và mang đến cảm giác như chính mình đang đứng ở vị trí chụp ảnh. Đặc biệt, Veo đã tạo ra 192 khung hình ở độ phân giải 720p với tốc độ 24 khung hình/giây trong vài phút, điều này thật sự đáng ngưỡng mộ.

Tuy nhiên, đôi khi mình thấy xuất hiện những "tín hiệu lạ" từ những dự đoán của Veo về các khung hình, tạo ra một cảm giác kỳ quái. Chẳng hạn, trong video, người chạy bộ bên phải không giống như hình ảnh mình đã chụp. Hơn nữa, một người đang đi bộ về phía máy ảnh bên trái bức ảnh gốc được Veo hiển thị như đang chạy.

Một ví dụ khác là khi mình tải lên một bức ảnh về một quán bar có tên Horseshoe trên phố 7. Mình đã yêu cầu Veo tạo video cho thấy một người phụ nữ đi ngang qua quán bar. Kết quả là một video với góc nhìn đường phố tốt, nhưng điều bất ngờ là Veo còn tự động hoàn thiện tấm biển trắng bên trên cửa với biểu tượng hình móng ngựa.

Một lần khác, mình thử nghiệm với một bức ảnh chụp một người trong tàu điện ngầm và yêu cầu tạo video cho thấy người ấy đứng dậy và ra khỏi tàu. Dù video tạo ra khá ấn tượng, nhưng Veo lại không thể thực hiện yêu cầu đúng như mong đợi. Mình đã thử lại và yêu cầu Veo cho thấy cửa tàu mở nhưng vẫn gặp phải một số vấn đề không hợp lý.

Một số bức ảnh khác mà mình đã sử dụng như selfie trong nhà tắm tối hoặc chân dung chuyên nghiệp cũng cho thấy những điểm thú vị. Dù Veo tạo ra chuyển động và âm thanh rất vui nhộn, nhưng đôi khi lại mang đến cảm giác kỳ quái khi nét mặt của mình không tự nhiên trong các cảnh nhảy múa.

Dù có rất nhiều điều thú vị, nhưng Veo cũng không thiếu lỗi nhỏ. Người dùng đã gặp phải việc giới hạn sử dụng trong một khoảng thời gian, với không ít người than phiền về việc không thể sử dụng dịch vụ trong một thời gian dài. Điều này dường như là điều hiển nhiên khi video yêu cầu băng thông, tính toán và bộ nhớ lớn.

Sau khi thử nghiệm, mình nhận thấy rằng Veo hiện tại vẫn còn là một sản phẩm thử nghiệm. Về cơ bản, nó cho thấy một tiềm năng rất lớn về việc sử dụng AI trong lĩnh vực video, nhưng vẫn cần cải tiến để đạt được trải nghiệm tốt hơn. Dẫu sao, Veo vẫn là một cái nhìn thú vị về tương lai của video trong thời đại AI. (zdnet)
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL3RyYWktbmdoaWVtLWNvbmctbmdoZS1haS1jdWEtZ29vZ2xlLXF1YS1hbmgtc2VsZmllLWN1YS1jaGluaC1iYW4uNjY0MzQv
Top