Thảo Nông
Writer
ManageEngine (nhà cung cấp giải pháp quản lý doanh nghiệp trực thuộc Zoho Corporation) đã chính thức công bố việc tích hợp công nghệ Trí tuệ nhân tạo nhân quả (Causal Intelligence) và Trí tuệ nhân tạo tự hành (Autonomous AI) vào nền tảng quan sát toàn diện Site24x7. Lần cập nhật cấu hình này được thiết kế nhằm thay đổi phương thức vận hành của các đội ngũ công nghệ thông tin (CNTT), định hướng chuyển dịch từ mô hình "ứng cứu sự cố" thụ động sang khả năng tự động phục hồi hệ thống. Mục tiêu cốt lõi của giải pháp là rút ngắn tối đa thời gian phục hồi trung bình (MTTR) và đảm bảo các tiêu chuẩn cam kết mức độ dịch vụ (SLA) cho doanh nghiệp.
Giải quyết bài toán phân mảnh hạ tầng và nhiễu cảnh báo
Môi trường hạ tầng CNTT hiện đại đang đối mặt với sự phức tạp ngày càng tăng do sự đan xen của các nền tảng đám mây lai (hybrid cloud), kiến trúc vi dịch vụ (microservices) và các mạng lưới động. Sự phân mảnh này tạo ra một khối lượng dữ liệu đo lường và tín hiệu cảnh báo khổng lồ phát sinh liên tục. Khi một sự cố xảy ra, các kỹ sư thường gặp khó khăn trong việc xâu chuỗi các tín hiệu bất thường trên nhiều lớp hệ thống khác nhau, dẫn đến thời gian gián đoạn dịch vụ bị kéo dài.
Để giải quyết nút thắt này, ManageEngine áp dụng công nghệ phân tích tương quan nhân quả chuyên sâu kết hợp với tính năng phát hiện bất thường dự đoán. Nền tảng Site24x7 có khả năng tự động thu thập, phân tích và kết nối các tín hiệu cảnh báo rời rạc từ lớp ứng dụng, hạ tầng vật lý cho đến mạng lưới để tổng hợp thành một báo cáo sự cố duy nhất, giàu ngữ cảnh. Ông Srinivasa Raghavan, Giám đốc quản lý sản phẩm tại ManageEngine, nhấn mạnh rằng hệ thống AI không chỉ đơn thuần thông báo lỗi mà còn có khả năng chỉ ra chính xác nguyên nhân gốc rễ và đánh giá mức độ ảnh hưởng của các thành phần liên quan, giúp đội ngũ kỹ thuật nhanh chóng khoanh vùng vấn đề.
Tự động hóa có kiểm soát với AI Agent và nền tảng MCP
Điểm nhấn kỹ thuật đáng chú ý nhất trong đợt cập nhật này là việc đưa Autonomous AI vào môi trường vận hành thực tế thông qua các tác tử trí tuệ nhân tạo (AI Agent) có khả năng tùy chỉnh. Thay vì chỉ đưa ra các phân tích, các AI Agent này được giao nhiệm vụ thực thi các hành động khắc phục lỗi tự động. Tuy nhiên, để ngăn ngừa rủi ro từ việc AI tự đưa ra các quyết định ngoài tầm kiểm soát, ManageEngine đã thiết lập nền tảng MCP đóng vai trò là lớp quản trị và kiểm soát trung tâm.
Nền tảng MCP thiết lập các ranh giới bảo mật nghiêm ngặt, chuẩn hóa cách thức các AI Agent truy cập dữ liệu quản trị và buộc chúng phải tuân thủ các tài liệu giải pháp (solution documents) do con người phê duyệt trước. Hỗ trợ cho quá trình này là hệ thống điều phối Qntrl của Zoho. Qntrl đóng vai trò phối hợp các hành động khắc phục sự cố thông qua một quy trình công việc có cấu trúc rõ ràng, tích hợp sẵn các bước chờ phê duyệt từ quản trị viên và đảm bảo khả năng truy xuất nguồn gốc kiểm toán cho mọi thao tác mà AI thực hiện.
Đánh giá về tính ứng dụng thực tiễn của bộ công cụ mới, ông Pravir Kumar Sinha, lãnh đạo mảng CNTT tại công ty dịch vụ toàn cầu Synechron, xác nhận rằng việc ứng dụng Site24x7 AIOps đã giúp hệ thống của họ lọc bỏ gần 90% lượng cảnh báo nhiễu. Điều này giúp đẩy nhanh tốc độ phân loại và giải quyết sự cố trong môi trường hạ tầng đám mây lai phức tạp. Theo thông báo từ nhà phát hành, toàn bộ các tính năng AIOps này hiện đã được mở khóa và cung cấp sẵn cho cộng đồng người dùng đang sử dụng gói dịch vụ Professional và Enterprise của Site24x7.
Môi trường hạ tầng CNTT hiện đại đang đối mặt với sự phức tạp ngày càng tăng do sự đan xen của các nền tảng đám mây lai (hybrid cloud), kiến trúc vi dịch vụ (microservices) và các mạng lưới động. Sự phân mảnh này tạo ra một khối lượng dữ liệu đo lường và tín hiệu cảnh báo khổng lồ phát sinh liên tục. Khi một sự cố xảy ra, các kỹ sư thường gặp khó khăn trong việc xâu chuỗi các tín hiệu bất thường trên nhiều lớp hệ thống khác nhau, dẫn đến thời gian gián đoạn dịch vụ bị kéo dài.
Để giải quyết nút thắt này, ManageEngine áp dụng công nghệ phân tích tương quan nhân quả chuyên sâu kết hợp với tính năng phát hiện bất thường dự đoán. Nền tảng Site24x7 có khả năng tự động thu thập, phân tích và kết nối các tín hiệu cảnh báo rời rạc từ lớp ứng dụng, hạ tầng vật lý cho đến mạng lưới để tổng hợp thành một báo cáo sự cố duy nhất, giàu ngữ cảnh. Ông Srinivasa Raghavan, Giám đốc quản lý sản phẩm tại ManageEngine, nhấn mạnh rằng hệ thống AI không chỉ đơn thuần thông báo lỗi mà còn có khả năng chỉ ra chính xác nguyên nhân gốc rễ và đánh giá mức độ ảnh hưởng của các thành phần liên quan, giúp đội ngũ kỹ thuật nhanh chóng khoanh vùng vấn đề.
Tự động hóa có kiểm soát với AI Agent và nền tảng MCP
Điểm nhấn kỹ thuật đáng chú ý nhất trong đợt cập nhật này là việc đưa Autonomous AI vào môi trường vận hành thực tế thông qua các tác tử trí tuệ nhân tạo (AI Agent) có khả năng tùy chỉnh. Thay vì chỉ đưa ra các phân tích, các AI Agent này được giao nhiệm vụ thực thi các hành động khắc phục lỗi tự động. Tuy nhiên, để ngăn ngừa rủi ro từ việc AI tự đưa ra các quyết định ngoài tầm kiểm soát, ManageEngine đã thiết lập nền tảng MCP đóng vai trò là lớp quản trị và kiểm soát trung tâm.
Nền tảng MCP thiết lập các ranh giới bảo mật nghiêm ngặt, chuẩn hóa cách thức các AI Agent truy cập dữ liệu quản trị và buộc chúng phải tuân thủ các tài liệu giải pháp (solution documents) do con người phê duyệt trước. Hỗ trợ cho quá trình này là hệ thống điều phối Qntrl của Zoho. Qntrl đóng vai trò phối hợp các hành động khắc phục sự cố thông qua một quy trình công việc có cấu trúc rõ ràng, tích hợp sẵn các bước chờ phê duyệt từ quản trị viên và đảm bảo khả năng truy xuất nguồn gốc kiểm toán cho mọi thao tác mà AI thực hiện.
Đánh giá về tính ứng dụng thực tiễn của bộ công cụ mới, ông Pravir Kumar Sinha, lãnh đạo mảng CNTT tại công ty dịch vụ toàn cầu Synechron, xác nhận rằng việc ứng dụng Site24x7 AIOps đã giúp hệ thống của họ lọc bỏ gần 90% lượng cảnh báo nhiễu. Điều này giúp đẩy nhanh tốc độ phân loại và giải quyết sự cố trong môi trường hạ tầng đám mây lai phức tạp. Theo thông báo từ nhà phát hành, toàn bộ các tính năng AIOps này hiện đã được mở khóa và cung cấp sẵn cho cộng đồng người dùng đang sử dụng gói dịch vụ Professional và Enterprise của Site24x7.