Google mang Gemini lên trình duyệt Chrome: Bước tiến nhỏ hướng tới AI "biết tuốt, làm hộ"

Nhật Quang
Nhật Quang
Phản hồi: 0

Nhật Quang

Editor
Thành viên BQT
Phóng viên Emma Roth của The Verge đã dành buổi sáng để khám phá trợ lý AI Gemini được tích hợp trực tiếp vào trình duyệt Chrome. Dù có những tiện ích thú vị như tóm tắt video YouTube hay tìm công thức nấu ăn, Gemini trong Chrome vẫn còn nhiều hạn chế và chưa thực sự "chủ động" như kỳ vọng.

gemini-in-chrome_png_75.jpg

Gemini "hiện diện" ngay trong trình duyệt Chrome

Google đang từng bước hiện thực hóa tham vọng đưa Trí tuệ Nhân tạo (AI) len lỏi sâu hơn vào trải nghiệm người dùng hàng ngày. Mới đây, hãng đã cho phép một số người dùng trải nghiệm sớm tính năng tích hợp trợ lý AI Gemini trực tiếp vào trình duyệt Chrome.1 Thay vì phải truy cập ứng dụng web riêng của chatbot, người dùng giờ đây có thể nhấp vào một nút Gemini mới ở góc trên bên phải của Chrome để bắt đầu cuộc trò chuyện. Điểm khác biệt chính là trợ lý AI tích hợp này có khả năng "nhìn thấy" những gì đang hiển thị trên màn hình của người dùng khi họ lướt web.

Phóng viên Emma Roth của trang công nghệ The Verge đã có một buổi sáng trải nghiệm tính năng này. Hiện tại, phiên bản truy cập sớm của Gemini trong Chrome chỉ dành cho những người đăng ký gói AI Pro hoặc AI Ultra và sử dụng các phiên bản Chrome Beta, Dev hoặc Canary.

comments-summary_png_75.jpg

Những trải nghiệm ban đầu: Tiện ích và hạn chế

Theo Emma Roth, việc tích hợp Gemini vào Chrome dường như mới chỉ là bước khởi đầu trong sứ mệnh của Google nhằm làm cho AI của mình trở nên "có tính tác tử" (agentic – có khả năng tự thực hiện các tác vụ thay người dùng) hơn. Cô cho biết mình đã mong muốn Gemini có thể làm được nhiều việc hơn những gì nó thực sự có thể.
  • Tóm tắt và tìm kiếm thông tin: Roth bắt đầu bằng việc yêu cầu Gemini tóm tắt một số bài viết trên The Verge và tìm kiếm các tin tức liên quan đến game trên trang chủ. Gemini đã chỉ ra được các trò chơi Game Boy mới được Nintendo thêm vào dịch vụ Switch Online, thông tin về bộ phim chuyển thể Elden Ring sắp tới và bản cập nhật lớn của Steam Deck từ Valve.
  • Hạn chế về "tầm nhìn": Tuy nhiên, Gemini chỉ có thể "nhìn thấy" những gì đang hiển thị trên màn hình. Nếu người dùng muốn nó tóm tắt các yếu tố cụ thể, ví dụ như phần bình luận của một bài viết, họ sẽ cần phải cuộn đến phần đó để nó hiển thị trước khi chatbot có thể đưa ra phản hồi. Gemini cũng theo dõi khi người dùng chuyển tab, nhưng nó chỉ có thể lấy thông tin từ một tab tại một thời điểm.
  • Tính năng "Live" – tương tác bằng giọng nói: Nếu không muốn gõ, người dùng có thể chuyển sang tính năng "Live" bằng cách chọn nút ở góc dưới bên phải hộp thoại. Từ đó, họ có thể đặt câu hỏi bằng giọng nói và Gemini sẽ trả lời bằng giọng nói.

gemini-amazon-listing_png_75.jpg


Những trường hợp sử dụng hữu ích:

Emma Roth nhận thấy tính năng này đặc biệt hữu ích khi xem video trên YouTube.
  • Trong một video về sửa sang phòng tắm, khi được hỏi "Anh ấy đang dùng dụng cụ gì?", Gemini đã trả lời: "Có vẻ như anh ấy đang dùng súng bắn đinh để gắn các mảnh gỗ lại với nhau."
  • Trong một video khác, Gemini đã xác định chính xác một tụ điện trên bo mạch chủ, cùng với nhíp và súng thổi hơi nóng mà YouTuber đã sử dụng để tháo nó ra.
  • Gemini cũng có thể tóm tắt video và cho bạn biết về những phần cụ thể bạn chưa xem, nhưng Roth nhận thấy tính năng này không phải lúc nào cũng chính xác nếu video không có các chương (chapters) được đặt tên rõ ràng để nó lấy thông tin.
  • Trường hợp sử dụng yêu thích nhất của Roth là yêu cầu Gemini trích xuất công thức nấu ăn từ các video YouTube, giúp cô không phải tự ghi chép hoặc tìm kiếm liên kết trong phần mô tả. Nó cũng hữu ích khi cô yêu cầu Gemini chỉ ra các loại túi chống nước trên một trang tìm kiếm của Amazon.
Những điểm chưa nhất quán và cần cải thiện:

Tuy nhiên, Gemini không phải lúc nào cũng hoạt động một cách nhất quán.
  • Khi được hỏi MrBeast đang ở đâu trong một video anh ấy khám phá các thành phố Maya cổ đại, ban đầu Gemini trả lời: "Tôi không có quyền truy cập thông tin thời gian thực, vì vậy tôi không thể xác định vị trí hiện tại chính xác của MrBeast." Khi được hỏi lại, nó đã trả lời với địa điểm được liệt kê trong mô tả của video: Mexico.
  • Một lần khác, khi được yêu cầu cung cấp liên kết để mua một cặp kìm cụ thể được hiển thị trong video, Gemini lại nói rằng nó "không có quyền truy cập thông tin thời gian thực, bao gồm danh sách sản phẩm hoặc kho hàng." Tuy nhiên, Gemini lại cung cấp được liên kết đến các sản phẩm khác khi được nhắc.
Đôi khi, Emma Roth cảm thấy các câu trả lời của Gemini quá dài so với một cửa sổ pop-up nhỏ trong Chrome, ngay cả khi kéo dài ra thì nó cũng chiếm nhiều không gian trên màn hình 13 inch của MacBook Air. Điều này có phần đi ngược lại một trong những ưu điểm chính của AI là giúp tiết kiệm thời gian bằng cách cung cấp câu trả lời nhanh chóng và súc tích (trừ khi người dùng yêu cầu cụ thể). Các câu hỏi theo sau của Gemini, như liệu người dùng có muốn biết thêm về một chủ đề cụ thể hay không, cũng trở nên hơi lặp đi lặp lại.


gemini-recipe-youtube_png_75.jpg

Hướng tới một tương lai "Agentic" hơn

Mặc dù có những trục trặc này, Emma Roth vẫn dễ dàng nhận thấy Google có thể mở rộng tích hợp Gemini trong Chrome vượt ra ngoài những câu hỏi và câu trả lời đơn giản. Google muốn AI của mình trở nên "có tính tác tử", nghĩa là nó có thể thực hiện các tác vụ thay mặt bạn, và Gemini trong Chrome dường như đã sẵn sàng để một ngày nào đó áp dụng những loại tính năng này. Sau khi yêu cầu Gemini tóm tắt thực đơn của một nhà hàng, Roth thậm chí đã nghĩ đến việc yêu cầu nó đặt một đơn hàng mang đi – một tác vụ "tác tử" mà nó chưa thể làm được.

Trong tương lai, cô có thể thấy Gemini trong Chrome trở nên hữu ích bằng cách tự động đánh dấu các trang liên quan đến nghiên cứu du lịch, hoặc thậm chí tìm và lưu các video YouTube về các công thức nấu ăn khác nhau vào danh sách "Xem sau".

Google dường như đang tiến gần hơn đến việc biến điều đó thành hiện thực với "Chế độ Tác tử" (Agent Mode) của Project Mariner sắp có mặt trên ứng dụng Gemini, cho phép nó quản lý tới 10 tác vụ cùng lúc và tìm kiếm trên web thay bạn. Và có lẽ một ngày nào đó, Google sẽ mang những khả năng này lên cả Gemini trong Chrome.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL2dvb2dsZS1tYW5nLWdlbWluaS1sZW4tdHJpbmgtZHV5ZXQtY2hyb21lLWJ1b2MtdGllbi1uaG8taHVvbmctdG9pLWFpLWJpZXQtdHVvdC1sYW0taG8uNjE5MDQv
Top