AI của Anthropic có ý nghĩa gì với tương lai an ninh mạng?

Hoàng Đức · 29/04/2026

Hai tuần trước, Anthropic công bố mô hình mới Claude Mythos Preview có khả năng tự động tìm kiếm và khai thác lỗ hổng phần mềm, biến chúng thành các công cụ tấn công hoạt động được mà không cần chuyên gia hướng dẫn. Đây là những lỗ hổng trong phần mềm quan trọng như hệ điều hành và hạ tầng internet mà hàng nghìn lập trình viên đã không phát hiện ra. Khả năng này sẽ có tác động an ninh lớn, ảnh hưởng đến các thiết bị và dịch vụ chúng ta dùng hàng ngày. Vì vậy Anthropic không phát hành rộng rãi mà chỉ giới hạn cho một số công ty nhất định.

Thông báo này gây chấn động cộng đồng bảo mật internet. Nhiều người bất bình vì thiếu chi tiết. Một số suy đoán Anthropic không đủ GPU để vận hành mô hình và lấy lý do an ninh mạng để hạn chế phát hành. Số khác cho rằng Anthropic đang giữ vững sứ mệnh an toàn AI. Có cả hype lẫn phản hype, thực tế lẫn marketing, rất khó phân biệt dù với chuyên gia.

Chúng tôi xem Mythos là bước tiến thực sự nhưng mang tính tăng dần, nằm trong chuỗi dài các bước tương tự. Song ngay cả những bước tăng dần cũng có thể quan trọng khi nhìn vào bức tranh toàn cảnh.

AI đang thay đổi an ninh mạng như thế nào

Chúng tôi từng viết về "hội chứng thay đổi đường cơ sở", hiện tượng khiến cả công chúng lẫn chuyên gia bỏ qua những thay đổi lớn dài hạn ẩn trong các bước nhỏ. Điều này đã xảy ra với quyền riêng tư trực tuyến và đang xảy ra với AI. Dù các lỗ hổng mà Mythos tìm thấy có thể đã được phát hiện bằng mô hình AI từ tháng trước hay năm ngoái, chúng chắc chắn không thể được tìm bởi AI của năm năm trước.

Thông báo về Mythos nhắc chúng ta rằng AI đã tiến rất xa chỉ trong vài năm, đường cơ sở thực sự đã dịch chuyển. Tìm lỗ hổng trong mã nguồn là loại nhiệm vụ mà các mô hình ngôn ngữ lớn ngày nay làm rất tốt. Dù xảy ra năm ngoái hay năm sau, đã rõ từ lâu rằng năng lực này sẽ sớm đến. Câu hỏi là chúng ta thích nghi như thế nào.

Chúng tôi không tin rằng AI có thể tự tấn công sẽ tạo ra bất đối xứng vĩnh viễn giữa tấn công và phòng thủ, thực tế sẽ phức tạp hơn thế. Một số lỗ hổng có thể được tìm, xác minh và vá tự động. Một số khác khó tìm nhưng dễ xác minh và vá, chẳng hạn các ứng dụng web chạy trên đám mây với phần mềm chuẩn, nơi cập nhật có thể triển khai nhanh. Số khác lại dễ tìm dù không cần AI mạnh nhưng khó hoặc không thể vá, như thiết bị IoT và thiết bị công nghiệp ít được cập nhật.

Rồi còn các hệ thống mà lỗ hổng dễ tìm trong mã nguồn nhưng khó xác minh trong thực tế. Ví dụ, các hệ thống phân tán phức tạp và nền tảng đám mây có thể gồm hàng nghìn dịch vụ tương tác song song, khiến việc phân biệt lỗ hổng thật với cảnh báo sai và tái hiện chúng đáng tin cậy trở nên rất khó.

Vì vậy cần phân biệt hệ thống có thể vá với không thể vá, dễ xác minh với khó xác minh. Phân loại này cũng chỉ ra hướng bảo vệ trong thời đại AI tìm lỗ hổng mạnh mẽ.

Các hệ thống không thể vá hoặc khó xác minh cần được bảo vệ bằng cách bọc thêm các lớp kiểm soát chặt chẽ hơn. Tủ lạnh, máy điều nhiệt hay hệ thống điều khiển công nghiệp nên được đặt sau tường lửa nghiêm ngặt và liên tục cập nhật, không nên kết nối tự do với internet.

Các hệ thống phân tán kết nối căn bản cần có khả năng truy vết và tuân theo nguyên tắc đặc quyền tối thiểu, mỗi thành phần chỉ có quyền truy cập cần thiết. Đây là các nguyên tắc bảo mật cơ bản mà ta có thể bị cám dỗ bỏ qua trong kỷ nguyên AI, nhưng chúng vẫn quan trọng như trước.

Nhìn lại thực hành bảo mật phần mềm

Điều này cũng làm nổi bật tầm quan trọng của thực hành tốt trong kỹ thuật phần mềm. Kiểm thử tự động, toàn diện và liên tục vốn đã quan trọng. Nay có thể tiến thêm bước nữa bằng cách dùng các tác nhân AI phòng thủ để kiểm thử khai thác trên hệ thống thực, lặp đi lặp lại cho đến khi loại bỏ cảnh báo sai và xác nhận được lỗ hổng thật cùng cách khắc phục. Loại hình VulnOps này có thể sẽ trở thành phần tiêu chuẩn của quy trình phát triển phần mềm.

Tài liệu hóa trở nên có giá trị hơn vì nó có thể hướng dẫn tác nhân AI tìm lỗi giống như hướng dẫn lập trình viên. Tuân theo thực hành chuẩn và dùng công cụ, thư viện chuẩn giúp cả AI lẫn kỹ sư nhận ra các mẫu hiệu quả hơn, kể cả trong thế giới phần mềm tức thời và nhất thời, tức mã được tạo và triển khai theo yêu cầu.

Điều này sẽ nghiêng về phía tấn công hay phòng thủ? Cuối cùng có lẽ là phòng thủ, đặc biệt với các hệ thống dễ vá và xác minh. May thay, điều đó bao gồm điện thoại, trình duyệt và các dịch vụ internet lớn. Nhưng ô tô, máy biến áp, tủ lạnh và đèn đường ngày nay đều kết nối internet. Các hệ thống ngân hàng và hàng không cũ cũng được kết nối mạng.

Không phải tất cả sẽ được vá kịp thời và chúng ta có thể chứng kiến vài năm tấn công liên tục cho đến khi đạt trạng thái bình thường mới, nơi xác minh là tối quan trọng và phần mềm được vá liên tục. [HASH=80085]#ClaudeMythos[/HASH]

Nguồn: Barath Raghavan và Scheider - IEEE Spectrum.

AI của Anthropic có ý nghĩa gì với tương lai an ninh mạng?

Hoàng Đức✔

Writer

Thành viên mới đăng

Xiaomi làm SUV hybrid sạc điện Skynomad: Ghế xoay 180 độ, chạy hơn 500km không cần tốn xăng

Amazon chơi lớn: Rót trọn 50 tỷ USD vào OpenAI, chính thức sở hữu 5% cổ phần trước thềm IPO

Pin điện thoại tụt nhanh? 5 ứng dụng Google này có thể là nguyên nhân

Lời biện minh cho hành động cài đặt phần mềm quảng cáo trên Windows 11 cho thấy LG đã "hết thuốc chữa"

Chủ quán lẩu gà từng van xin khách đừng đến dự thi đầu bếp, ngay vòng đầu tiên giám khảo nói câu bất ngờ

iPhone 18 Pro có thể đắt hơn tới 300 USD

Châu Âu nóng trên 40 độ C, điều hoà Trung Quốc lên tàu hoả lũ lượt đi "giải cứu"

iPhone Air 2 dự kiến ra mắt đầu năm sau với 5 tính năng mới

Đánh giá nổi bật