Microsoft cho phép AI Copilot Studio tự động 'dùng máy tính' như người

Nhật Quang
Nhật Quang
Phản hồi: 0

Nhật Quang

Editor
Thành viên BQT
Microsoft vừa bổ sung một khả năng mới đầy mạnh mẽ cho nền tảng xây dựng trợ lý AI dành cho doanh nghiệp Copilot Studio. Trong tuần này, hãng đã kích hoạt tính năng "computer use" (tạm dịch: sử dụng máy tính), cho phép các agent AI (tác nhân AI) được tạo ra từ Copilot Studio có thể tự động tương tác với các trang web và ứng dụng trên máy tính để bàn giống như cách con người thao tác. Đây được xem là bước tiến quan trọng hướng tới việc tự động hóa các quy trình phức tạp, đặc biệt là với các hệ thống cũ không có giao diện lập trình ứng dụng (API) sẵn có.

Microsoft-Copilot-Studio_webp_75.jpg

Những điểm chính (Tóm tắt ngắn gọn)
  • Microsoft ra mắt tính năng "computer use" cho Copilot Studio, cho phép agent AI tự động tương tác với UI của website và ứng dụng desktop (click, gõ phím...).
  • Mục đích chính: Tự động hóa các tác vụ ngay cả khi hệ thống không có API để kết nối trực tiếp, ví dụ như nhập liệu, xử lý hóa đơn trên phần mềm cũ.
  • Tính năng này tương tự các khái niệm "agentic AI" đang được OpenAI (Operator) và Anthropic (Claude "computer use") phát triển, nhưng linh hoạt hơn "Actions" của Copilot bản tiêu dùng.

AI 'học' cách click chuột, gõ phím

Ông Charles Lamanna, Phó Chủ tịch mảng Copilot cho doanh nghiệp và ngành công nghiệp của Microsoft, giải thích: "Tính năng 'computer use' cho phép các agent tương tác với website và ứng dụng desktop bằng cách nhấp vào nút bấm, chọn menu và nhập liệu vào các trường trên màn hình". Điểm mấu chốt là nó cho phép tự động hóa ngay cả khi "không có API để kết nối trực tiếp với hệ thống". Ông nhấn mạnh: "Nếu một người có thể sử dụng ứng dụng đó, thì agent AI cũng có thể."

20250413-Computer-use-tool-1536x_jpg_75.jpg

Điều này mở ra khả năng tự động hóa hàng loạt tác vụ lặp đi lặp lại hoặc tốn thời gian trong doanh nghiệp, ví dụ như nhập liệu tự động, thực hiện nghiên cứu thị trường trực tuyến, hay xử lý hóa đơn trên các phần mềm kế toán cũ. Microsoft còn cho biết công cụ mới này đủ thông minh để nhận biết và thích ứng khi các nút bấm hoặc bố cục màn hình trên ứng dụng/website thay đổi, giúp quy trình tự động hóa hoạt động liên tục mà không dễ bị lỗi hay gián đoạn.

Cuộc đua 'Agentic AI' và so sánh với đối thủ

Tính năng "computer use" của Microsoft Copilot Studio đi theo một xu hướng đang lên trong ngành AI: phát triển các "agentic AI" – những tác nhân AI có khả năng chủ động thực hiện chuỗi hành động phức tạp để hoàn thành mục tiêu, bao gồm cả việc tương tác trực tiếp với giao diện người dùng (UI). Công nghệ này tương tự như các tính năng "Operator" được OpenAI trình diễn hay tính năng cùng tên "computer use" mà Anthropic đã ra mắt cho Claude AI.

tri-tue-nhan-tao-crop-1703642089635.jpeg_75.jpg

Cần phân biệt tính năng này với "Actions" mà Microsoft vừa bổ sung cho Copilot phiên bản người dùng tiêu dùng vào đầu tháng 4. "Actions" cho phép Copilot thực hiện các tác vụ cụ thể như đặt nhà hàng, mua vé sự kiện thông qua các đối tác tích hợp sẵn. Ngược lại, "computer use" trong Copilot Studio có vẻ linh hoạt và rộng rãi hơn nhiều, cho phép doanh nghiệp tự xây dựng agent để tương tác với hầu hết các website và ứng dụng desktop phục vụ cho quy trình nghiệp vụ của họ, không bị giới hạn bởi danh sách đối tác.

Sự ra đời của "computer use" trong Copilot Studio hứa hẹn sẽ trao thêm sức mạnh tự động hóa cho các doanh nghiệp, giúp họ tối ưu hóa quy trình, giảm chi phí và giải phóng nhân viên khỏi các công việc thủ công nhàm chán, ngay cả với những hệ thống phần mềm tưởng chừng khó có thể tích hợp với công nghệ AI hiện đại.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top