ChatGPT thử nghiệm 'Lockdown Mode' ngăn rò rỉ dữ liệu AI và lạm dụng công cụ

Kaya · 08:20

OpenAI đang triển khai một cơ chế bảo vệ mới cho ChatGPT mang tên “Lockdown Mode”, nhằm hạn chế quyền truy cập của AI vào các công cụ và dữ liệu nhạy cảm trong những tình huống có nguy cơ bị lạm dụng hoặc tấn công.

Theo các báo cáo gần đây của giới chuyên gia, tính năng này được thiết kế để giảm thiểu rủi ro khi chatbot AI bị khai thác thông qua prompt độc hại, jailbreak hoặc các cuộc tấn công thao túng hành vi mô hình.

ChatGPT có thể tự giới hạn công cụ khi phát hiện rủi ro

Theo thông tin được công bố, Lockdown Mode sẽ cho phép ChatGPT tự động hạn chế hoặc vô hiệu hóa một số khả năng như:

Truy cập công cụ bên ngoài
Gọi plugin hoặc API
Truy cập bộ nhớ cuộc trò chuyện
Thực hiện tác vụ có nguy cơ cao
Xử lý dữ liệu nhạy cảm

Cơ chế này được xem như một “chế độ an toàn” dành cho AI agent, đặc biệt trong bối cảnh các mô hình AI ngày càng được tích hợp sâu với email, tài liệu doanh nghiệp, trình duyệt và hệ thống nội bộ.

AI agent đang trở thành mục tiêu mới của tấn công mạng

Giới an ninh mạng thời gian gần đây liên tục cảnh báo về nguy cơ AI agent bị lợi dụng để đánh cắp dữ liệu, gửi lệnh trái phép hoặc thao túng quy trình tự động. Nhiều chuyên gia cho rằng khi AI được trao thêm quyền hành động thay vì chỉ trả lời văn bản, các mô hình này sẽ trở thành “điểm tấn công mới” tương tự máy chủ hay tài khoản quản trị truyền thống.

Trên mạng xã hội, không ít ý kiến tranh luận rằng việc phải bổ sung “Lockdown Mode” cho thấy chính các công ty AI cũng đang lo ngại về khả năng mô hình bị khai thác ngoài kiểm soát. Một số người dùng đặt câu hỏi liệu AI agent trong tương lai có cần được quản lý như một tài khoản đặc quyền trong hệ thống doanh nghiệp hay không.

Lockdown Mode được xem là lớp phòng thủ mới cho AI

Theo The Hacker News, Lockdown Mode không phải tính năng dành cho người dùng phổ thông mà hướng tới các môi trường cần mức bảo mật cao hơn như doanh nghiệp hoặc tổ chức xử lý dữ liệu nhạy cảm.

Cơ chế này có thể giúp AI tự giảm quyền hoạt động nếu phát hiện prompt bất thường, hành vi đáng ngờ hoặc yêu cầu vượt quá phạm vi cho phép.
Một số chuyên gia đánh giá đây là hướng đi tương tự mô hình “least privilege” trong an ninh mạng, tức chỉ cấp đúng quyền cần thiết để giảm thiểu thiệt hại nếu hệ thống bị xâm nhập.

Cuộc đua bảo mật AI ngày càng nóng

Việc OpenAI triển khai Lockdown Mode diễn ra trong bối cảnh ngày càng xuất hiện nhiều nghiên cứu về prompt injection, jailbreak và các kỹ thuật tấn công AI agent.

Các nhà nghiên cứu bảo mật cảnh báo rằng AI có khả năng truy cập email, tài liệu hoặc hệ thống nội bộ nếu bị điều khiển sai cách có thể trở thành rủi ro lớn với doanh nghiệp. Nhiều ý kiến cho rằng tương lai của AI không chỉ là cuộc đua mô hình mạnh hơn, mà còn là cuộc đua xây dựng cơ chế kiểm soát và phòng thủ đủ an toàn để AI không trở thành “cửa hậu” mới trong hạ tầng số.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

ChatGPT thử nghiệm 'Lockdown Mode' ngăn rò rỉ dữ liệu AI và lạm dụng công cụ

Kaya

Writer

Kaya

ChatGPT có thể tự giới hạn công cụ khi phát hiện rủi ro

AI agent đang trở thành mục tiêu mới của tấn công mạng

Lockdown Mode được xem là lớp phòng thủ mới cho AI

Cuộc đua bảo mật AI ngày càng nóng

Tin tặc đột nhập hệ thống viện trợ Gaza, dữ liệu của 600.000 hộ dân bị lộ lọt

Chỉ 21 giây để cắm chốt trong hệ thống: Mối đe dọa mới từ các công cụ hợp pháp

Điều gì đang xảy ra với website Toshiba và Muji?

Ai lại ác mồm đi đồn Microsoft âm mưu khiến người dùng nghiện AI Scout?

Nếu 1 ngày không có AI?

Microsoft cảnh báo kiểu tấn công AI mới có thể vượt qua mọi phê duyệt mà không cần một cú nhấp chuột

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Sony ra mắt 1000X The ColleXion ở Việt Nam: tai nghe không dây sang chảnh nhất của “đại đế”

Đánh giá nổi bật

Chủ đề hot

Có thể bạn quan tâm

ChatGPT thử nghiệm 'Lockdown Mode' ngăn rò rỉ dữ liệu AI và lạm dụng công cụ

Writer

ChatGPT có thể tự giới hạn công cụ khi phát hiện rủi ro​

AI agent đang trở thành mục tiêu mới của tấn công mạng​

Lockdown Mode được xem là lớp phòng thủ mới cho AI​

Cuộc đua bảo mật AI ngày càng nóng​

Tin tặc đột nhập hệ thống viện trợ Gaza, dữ liệu của 600.000 hộ dân bị lộ lọt

Chỉ 21 giây để cắm chốt trong hệ thống: Mối đe dọa mới từ các công cụ hợp pháp

Điều gì đang xảy ra với website Toshiba và Muji?

Ai lại ác mồm đi đồn Microsoft âm mưu khiến người dùng nghiện AI Scout?

Nếu 1 ngày không có AI?

Microsoft cảnh báo kiểu tấn công AI mới có thể vượt qua mọi phê duyệt mà không cần một cú nhấp chuột

ChatGPT có thể tự giới hạn công cụ khi phát hiện rủi ro

AI agent đang trở thành mục tiêu mới của tấn công mạng

Lockdown Mode được xem là lớp phòng thủ mới cho AI

Cuộc đua bảo mật AI ngày càng nóng