404 Not Found
Writer
Một lỗ hổng nghiêm trọng từ đối tác thứ ba đã giúp một nhóm người dùng không xác định tiếp cận được Claude Mythos Preview, công cụ AI siêu cấp mà Anthropic từng tuyên bố là quá nguy hiểm để phát hành rộng rãi. Sự cố này đang làm dấy lên nỗi lo ngại về một kỷ nguyên tấn công mạng tự động hóa hoàn toàn do trí tuệ nhân tạo dẫn dắt.
Claude Mythos không phải là một chatbot thông thường. Được công bố vào đầu tháng 4/ 2026 trong dự án Project Glasswing, Mythos là mô hình AI chuyên dụng có khả năng tự tìm kiếm lỗ hổng Zero-day trên các hệ điều hành và trình duyệt lớn. Đáng sợ hơn, nó có thể tự xâu chuỗi các lỗi phần mềm đơn lẻ thành một quy trình khai thác đa tầng phức tạp, điều mà trước đây chỉ những hacker trình độ cao nhất thế giới mới có thể thực hiện thủ công.
Sự nguy hiểm của Mythos đã được chính Anthropic cảnh báo qua các bài kiểm tra thực tế. Trong một đánh giá gây sốc, Mythos đã tự mình thoát khỏi môi trường sandbox bảo mật, tự thiết kế quy trình tấn công để chiếm quyền truy cập internet và thậm chí tự gửi email cho một nhà nghiên cứu mà không hề có chỉ dẫn từ con người. Chính vì khả năng tấn công quá khủng khiếp, Anthropic chỉ giới hạn quyền truy cập cho một nhóm liên minh gồm hơn 40 tập đoàn công nghệ lớn nhất thế giới như Apple, Microsoft, Google và Nvidia nhằm phục vụ mục đích kiểm thử bảo mật.
Tuy nhiên, theo báo cáo từ Bloomberg, vào ngày 21/4/2026, một nhóm người dùng không được cấp quyền đã bất ngờ truy cập được vào hệ thống này. Điều đáng nói là họ không phá vỡ trực tiếp hệ thống lõi, mà lợi dụng môi trường truy cập từ bên thứ ba – cụ thể là một đối tác kỹ thuật đang làm việc với Anthropic.
Nguồn tin cho biết nhóm này đã suy đoán ra vị trí hệ thống dựa trên cách đặt URL quen thuộc của các mô hình Anthropic, sau đó khai thác việc chia sẻ tài khoản và API key của các kỹ sư thuộc bên thứ ba. Nói cách khác, “cửa chính” không bị phá, nhưng “chìa khóa phụ” lại bị sử dụng sai cách.
Sau khi truy cập thành công, nhóm này được cho là đã sử dụng Mythos trong thời gian dài, thậm chí cung cấp bằng chứng cho báo chí dưới dạng ảnh chụp màn hình và trình diễn trực tiếp. Tuy nhiên, họ mô tả mục đích chỉ là “tò mò và thử nghiệm”, không có ý định gây hại.
Trong thông báo mới nhất, Anthropic xác nhận đã nắm được tình hình và đang tiến hành điều tra. Công ty tuyên bố chưa có bằng chứng cho thấy hệ thống cốt lõi bị ảnh hưởng, nhưng thừa nhận việc truy cập trái phép diễn ra thông qua môi trường của đối tác thứ ba. Sự cố của Claude Mythos là lời cảnh tỉnh về việc quản lý các thực thể AI siêu trí tuệ, khi ranh giới giữa an ninh và thảm họa chỉ còn là một sợi chỉ mong manh.
Claude Mythos không phải là một chatbot thông thường. Được công bố vào đầu tháng 4/ 2026 trong dự án Project Glasswing, Mythos là mô hình AI chuyên dụng có khả năng tự tìm kiếm lỗ hổng Zero-day trên các hệ điều hành và trình duyệt lớn. Đáng sợ hơn, nó có thể tự xâu chuỗi các lỗi phần mềm đơn lẻ thành một quy trình khai thác đa tầng phức tạp, điều mà trước đây chỉ những hacker trình độ cao nhất thế giới mới có thể thực hiện thủ công.
Sự nguy hiểm của Mythos đã được chính Anthropic cảnh báo qua các bài kiểm tra thực tế. Trong một đánh giá gây sốc, Mythos đã tự mình thoát khỏi môi trường sandbox bảo mật, tự thiết kế quy trình tấn công để chiếm quyền truy cập internet và thậm chí tự gửi email cho một nhà nghiên cứu mà không hề có chỉ dẫn từ con người. Chính vì khả năng tấn công quá khủng khiếp, Anthropic chỉ giới hạn quyền truy cập cho một nhóm liên minh gồm hơn 40 tập đoàn công nghệ lớn nhất thế giới như Apple, Microsoft, Google và Nvidia nhằm phục vụ mục đích kiểm thử bảo mật.
Tuy nhiên, theo báo cáo từ Bloomberg, vào ngày 21/4/2026, một nhóm người dùng không được cấp quyền đã bất ngờ truy cập được vào hệ thống này. Điều đáng nói là họ không phá vỡ trực tiếp hệ thống lõi, mà lợi dụng môi trường truy cập từ bên thứ ba – cụ thể là một đối tác kỹ thuật đang làm việc với Anthropic.
Nguồn tin cho biết nhóm này đã suy đoán ra vị trí hệ thống dựa trên cách đặt URL quen thuộc của các mô hình Anthropic, sau đó khai thác việc chia sẻ tài khoản và API key của các kỹ sư thuộc bên thứ ba. Nói cách khác, “cửa chính” không bị phá, nhưng “chìa khóa phụ” lại bị sử dụng sai cách.
Sau khi truy cập thành công, nhóm này được cho là đã sử dụng Mythos trong thời gian dài, thậm chí cung cấp bằng chứng cho báo chí dưới dạng ảnh chụp màn hình và trình diễn trực tiếp. Tuy nhiên, họ mô tả mục đích chỉ là “tò mò và thử nghiệm”, không có ý định gây hại.
Trong thông báo mới nhất, Anthropic xác nhận đã nắm được tình hình và đang tiến hành điều tra. Công ty tuyên bố chưa có bằng chứng cho thấy hệ thống cốt lõi bị ảnh hưởng, nhưng thừa nhận việc truy cập trái phép diễn ra thông qua môi trường của đối tác thứ ba. Sự cố của Claude Mythos là lời cảnh tỉnh về việc quản lý các thực thể AI siêu trí tuệ, khi ranh giới giữa an ninh và thảm họa chỉ còn là một sợi chỉ mong manh.
Được phối hợp thực hiện bởi các chuyên gia của Bkav,
cộng đồng An ninh mạng Việt Nam WhiteHat
và cộng đồng Khoa học công nghệ VnReview