Một tính năng mang tính cách mạng của Gemini đang bị rò rỉ ngay trước thềm sự kiện Google I/O 2026. Đây không đơn thuần là một bản cập nhật chatbot thông thường, mà là bước đi chiến lược nhằm biến Gemini thành một tác nhân AI (AI Agent) có khả năng tự động xử lý các tác vụ văn phòng phức tạp mà không cần sự can thiệp liên tục từ người dùng.
Sự chuyển mình này hứa hẹn thay đổi cách thức con người tương tác với trí tuệ nhân tạo, từ việc chỉ phản hồi câu lệnh sang thực hiện các quy trình công việc đa bước.
Giao diện Gemini Spark
Điểm khác biệt lớn nhất nằm ở khả năng hoạt động tự hành, cho phép AI thực hiện các nhiệm vụ mà không cần sự giám sát liên tục hay phê duyệt từng bước từ con người. Điều này cho thấy nỗ lực của Google trong việc bắt kịp và vượt qua Claude Cowork của Anthropic – đối thủ vốn đang dẫn đầu trong mảng AI có khả năng điều khiển máy tính.
Người dùng có thể yêu cầu AI tự động quét và dọn dẹp thư rác, tin quảng cáo trong Gmail, tổng hợp tài liệu chuẩn bị cho các cuộc họp hoặc biên soạn bản tin cá nhân hóa mỗi buổi sáng dựa trên thói quen cá nhân. Đặc biệt, Spark cho phép thiết lập các kỹ năng chuyên biệt, tương tự như tính năng Projects trên Claude. Người dùng có thể cài đặt một khung hướng dẫn cố định cho các công việc lặp lại, và AI sẽ tự động điều chỉnh linh hoạt dựa trên các biến số mới từ câu lệnh.
Bên cạnh việc quản lý ứng dụng, Gemini Spark còn có khả năng điều khiển trình duyệt Chrome và truy cập vào các tệp tin lưu trữ cục bộ trên máy tính để thu thập dữ liệu. Mặc dù khả năng điều khiển toàn bộ hệ thống máy tính hiện tại của Spark vẫn còn một số giới hạn nhất định so với Claude Cowork, nhưng việc tích hợp chặt chẽ vào hệ sinh thái sẵn có là một lợi thế cạnh tranh lớn giúp Google giữ chân người dùng Workspace.
Sự chuyển mình này hứa hẹn thay đổi cách thức con người tương tác với trí tuệ nhân tạo, từ việc chỉ phản hồi câu lệnh sang thực hiện các quy trình công việc đa bước.
Bước chuyển mình thành tác nhân AI tự hành
Khác với các phiên bản trước đó chỉ hoạt động bó hẹp trong khung chat, Gemini Spark được phát hiện dưới dạng một tùy chọn ẩn trong menu ứng dụng Gemini trên hệ điều hành Android. Công cụ này đóng vai trò như một trợ lý thường trực, có quyền can thiệp vào các quy trình công việc đa bước giữa nhiều ứng dụng khác nhau.
Giao diện Gemini Spark
Điểm khác biệt lớn nhất nằm ở khả năng hoạt động tự hành, cho phép AI thực hiện các nhiệm vụ mà không cần sự giám sát liên tục hay phê duyệt từng bước từ con người. Điều này cho thấy nỗ lực của Google trong việc bắt kịp và vượt qua Claude Cowork của Anthropic – đối thủ vốn đang dẫn đầu trong mảng AI có khả năng điều khiển máy tính.
Tự động hóa hệ sinh thái Google Workspace
Dựa trên các hình ảnh rò rỉ, Gemini Spark thể hiện khả năng can thiệp sâu vào hệ sinh thái Google Workspace để thay thế con người thực hiện các tác vụ thủ công.Người dùng có thể yêu cầu AI tự động quét và dọn dẹp thư rác, tin quảng cáo trong Gmail, tổng hợp tài liệu chuẩn bị cho các cuộc họp hoặc biên soạn bản tin cá nhân hóa mỗi buổi sáng dựa trên thói quen cá nhân. Đặc biệt, Spark cho phép thiết lập các kỹ năng chuyên biệt, tương tự như tính năng Projects trên Claude. Người dùng có thể cài đặt một khung hướng dẫn cố định cho các công việc lặp lại, và AI sẽ tự động điều chỉnh linh hoạt dựa trên các biến số mới từ câu lệnh.
Bên cạnh việc quản lý ứng dụng, Gemini Spark còn có khả năng điều khiển trình duyệt Chrome và truy cập vào các tệp tin lưu trữ cục bộ trên máy tính để thu thập dữ liệu. Mặc dù khả năng điều khiển toàn bộ hệ thống máy tính hiện tại của Spark vẫn còn một số giới hạn nhất định so với Claude Cowork, nhưng việc tích hợp chặt chẽ vào hệ sinh thái sẵn có là một lợi thế cạnh tranh lớn giúp Google giữ chân người dùng Workspace.