Trải nghiệm công nghệ AI của Google qua ảnh selfie của chính bạn

Derpy · 07:00 Hôm qua

Gần đây, Google đã chính thức cho ra mắt phiên bản mới nhất của công cụ tạo video Veo dành cho người dùng đăng ký tài khoản "Pro" hoặc "Ultra" trong chương trình trí tuệ nhân tạo Gemini. Một trong những điểm nổi bật của Veo là khả năng bắt đầu video bằng cách tải lên một bức ảnh tĩnh, bức ảnh này sẽ trở thành khung hình đầu tiên cho video. Đáng chú ý, một số người dùng như Prakhar Khanna đã sử dụng tính năng này qua điện thoại Honor 400 của mình, trong khi mình thì trải nghiệm qua website.

Để tạo video từ ảnh, bạn chỉ cần nhập một câu lệnh, nhấn enter, và Veo sẽ tạo ra một video dài tám giây với bức ảnh bạn tải lên làm điểm tham chiếu để xây dựng khung hình đầu tiên. Veo còn thêm âm thanh, bao gồm nhạc, bước chân và các âm thanh phụ khác. Thời gian tạo video mất khoảng vài phút.

Sau khi thử nghiệm, mình thấy rằng việc sử dụng Veo vừa thú vị vừa hơi rùng rợn. Khi chứng kiến những bức ảnh của mình sống động hơn, cảm giác thật sự lạ lùng. Điều này khiến mình cảm thấy bất an, đặc biệt là khi kết quả không hoàn toàn khớp với ký ức của chính mình về những sự kiện đã diễn ra.

Chất lượng video mà Veo tạo ra tương đồng với hình ảnh gốc, từ góc độ bối cảnh cho đến chuyển động của các đối tượng trong khung hình. Ví dụ, mình có một bức ảnh chụp một người chạy bộ trên bờ Đông sông Hudson ở Manhattan. Mình đã yêu cầu Veo tạo một video với nội dung "Hãy làm cho người chạy bộ tiếp tục chạy vào xa." Video cho thấy chuyển động của người chạy rất tự nhiên và mang đến cảm giác như chính mình đang đứng ở vị trí chụp ảnh. Đặc biệt, Veo đã tạo ra 192 khung hình ở độ phân giải 720p với tốc độ 24 khung hình/giây trong vài phút, điều này thật sự đáng ngưỡng mộ.

Tuy nhiên, đôi khi mình thấy xuất hiện những "tín hiệu lạ" từ những dự đoán của Veo về các khung hình, tạo ra một cảm giác kỳ quái. Chẳng hạn, trong video, người chạy bộ bên phải không giống như hình ảnh mình đã chụp. Hơn nữa, một người đang đi bộ về phía máy ảnh bên trái bức ảnh gốc được Veo hiển thị như đang chạy.

Một ví dụ khác là khi mình tải lên một bức ảnh về một quán bar có tên Horseshoe trên phố 7. Mình đã yêu cầu Veo tạo video cho thấy một người phụ nữ đi ngang qua quán bar. Kết quả là một video với góc nhìn đường phố tốt, nhưng điều bất ngờ là Veo còn tự động hoàn thiện tấm biển trắng bên trên cửa với biểu tượng hình móng ngựa.

Một lần khác, mình thử nghiệm với một bức ảnh chụp một người trong tàu điện ngầm và yêu cầu tạo video cho thấy người ấy đứng dậy và ra khỏi tàu. Dù video tạo ra khá ấn tượng, nhưng Veo lại không thể thực hiện yêu cầu đúng như mong đợi. Mình đã thử lại và yêu cầu Veo cho thấy cửa tàu mở nhưng vẫn gặp phải một số vấn đề không hợp lý.

Một số bức ảnh khác mà mình đã sử dụng như selfie trong nhà tắm tối hoặc chân dung chuyên nghiệp cũng cho thấy những điểm thú vị. Dù Veo tạo ra chuyển động và âm thanh rất vui nhộn, nhưng đôi khi lại mang đến cảm giác kỳ quái khi nét mặt của mình không tự nhiên trong các cảnh nhảy múa.

Dù có rất nhiều điều thú vị, nhưng Veo cũng không thiếu lỗi nhỏ. Người dùng đã gặp phải việc giới hạn sử dụng trong một khoảng thời gian, với không ít người than phiền về việc không thể sử dụng dịch vụ trong một thời gian dài. Điều này dường như là điều hiển nhiên khi video yêu cầu băng thông, tính toán và bộ nhớ lớn.

Sau khi thử nghiệm, mình nhận thấy rằng Veo hiện tại vẫn còn là một sản phẩm thử nghiệm. Về cơ bản, nó cho thấy một tiềm năng rất lớn về việc sử dụng AI trong lĩnh vực video, nhưng vẫn cần cải tiến để đạt được trải nghiệm tốt hơn. Dẫu sao, Veo vẫn là một cái nhìn thú vị về tương lai của video trong thời đại AI. (zdnet)

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Trải nghiệm công nghệ AI của Google qua ảnh selfie của chính bạn

Derpy

Intern Writer

Derpy

Hàng nghìn cuộc trò chuyện "riêng tư" với ChatGPT bất ngờ xuất hiện công khai trên Google Search

Canon đầu tư 500 tỷ Yên khởi công nhà máy bán dẫn mới, "cưỡi sóng" bán dẫn AI

Sự thật về 200.000 nhân viên công nghệ bị sa thải: AI không phải là thủ phạm chính

5 phát ngôn đáng nhớ về AI của ông Hoàng Nam Tiến

Microsoft “cướp não” DeepMind: tài năng ra đi không chỉ vì tiền

Cha đẻ "Facebook" nhận định: trong tương lai người không dùng kính AI sẽ "gặp bất lợi đáng kể về mặt nhận thức"

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Trung Quốc khởi công “siêu đập” lớn nhất thế giới, to gấp 3 lần Tam Hiệp, gây lo ngại cho các nước hạ nguồn

Hàng nghìn cuộc trò chuyện "riêng tư" với ChatGPT bất ngờ xuất hiện công khai trên Google Search

Không còn là khoa học viễn tưởng: "Nông trại không người lái" đã trở thành hiện thực

Khi điện thoại của bạn có thể "nhìn thấy" thành phần hóa học của mọi thứ

MSI lập kỷ lục lịch sử, dự kiến xuất xưởng hơn 10 triệu bo mạch chủ trong năm 2025

A19 Pro và "lời hứa" về một chiếc iPhone mạnh gấp 500 lần đời đầu của Apple

ASUS khởi động mùa tựu trường 2025 tại Việt Nam với loạt laptop AI mỏng nhẹ, hiệu năng cao

Bi hài cảnh tắc xuồng phao trong hẻm núi ở xứ Trung

Giữa đức tin và tiền bạc: Bi kịch của việc thương mại hóa Thiếu Lâm Tự

Đánh giá nổi bật