ChatGPT thử nghiệm 'Lockdown Mode' ngăn rò rỉ dữ liệu AI và lạm dụng công cụ

K
Kaya
Phản hồi: 0

Kaya

Writer
OpenAI đang triển khai một cơ chế bảo vệ mới cho ChatGPT mang tên “Lockdown Mode”, nhằm hạn chế quyền truy cập của AI vào các công cụ và dữ liệu nhạy cảm trong những tình huống có nguy cơ bị lạm dụng hoặc tấn công.

Theo các báo cáo gần đây của giới chuyên gia, tính năng này được thiết kế để giảm thiểu rủi ro khi chatbot AI bị khai thác thông qua prompt độc hại, jailbreak hoặc các cuộc tấn công thao túng hành vi mô hình.​

ChatGPT có thể tự giới hạn công cụ khi phát hiện rủi ro​

Theo thông tin được công bố, Lockdown Mode sẽ cho phép ChatGPT tự động hạn chế hoặc vô hiệu hóa một số khả năng như:​
  • Truy cập công cụ bên ngoài​
  • Gọi plugin hoặc API​
  • Truy cập bộ nhớ cuộc trò chuyện​
  • Thực hiện tác vụ có nguy cơ cao​
  • Xử lý dữ liệu nhạy cảm​
Cơ chế này được xem như một “chế độ an toàn” dành cho AI agent, đặc biệt trong bối cảnh các mô hình AI ngày càng được tích hợp sâu với email, tài liệu doanh nghiệp, trình duyệt và hệ thống nội bộ.​

AI agent đang trở thành mục tiêu mới của tấn công mạng​

Giới an ninh mạng thời gian gần đây liên tục cảnh báo về nguy cơ AI agent bị lợi dụng để đánh cắp dữ liệu, gửi lệnh trái phép hoặc thao túng quy trình tự động. Nhiều chuyên gia cho rằng khi AI được trao thêm quyền hành động thay vì chỉ trả lời văn bản, các mô hình này sẽ trở thành “điểm tấn công mới” tương tự máy chủ hay tài khoản quản trị truyền thống.
d826912d-5c92-4803-9e5e-2bee562dc2b5.png

Trên mạng xã hội, không ít ý kiến tranh luận rằng việc phải bổ sung “Lockdown Mode” cho thấy chính các công ty AI cũng đang lo ngại về khả năng mô hình bị khai thác ngoài kiểm soát. Một số người dùng đặt câu hỏi liệu AI agent trong tương lai có cần được quản lý như một tài khoản đặc quyền trong hệ thống doanh nghiệp hay không.​

Lockdown Mode được xem là lớp phòng thủ mới cho AI​

Theo The Hacker News, Lockdown Mode không phải tính năng dành cho người dùng phổ thông mà hướng tới các môi trường cần mức bảo mật cao hơn như doanh nghiệp hoặc tổ chức xử lý dữ liệu nhạy cảm.

Cơ chế này có thể giúp AI tự giảm quyền hoạt động nếu phát hiện prompt bất thường, hành vi đáng ngờ hoặc yêu cầu vượt quá phạm vi cho phép.
Một số chuyên gia đánh giá đây là hướng đi tương tự mô hình “least privilege” trong an ninh mạng, tức chỉ cấp đúng quyền cần thiết để giảm thiểu thiệt hại nếu hệ thống bị xâm nhập.​

Cuộc đua bảo mật AI ngày càng nóng​

Việc OpenAI triển khai Lockdown Mode diễn ra trong bối cảnh ngày càng xuất hiện nhiều nghiên cứu về prompt injection, jailbreak và các kỹ thuật tấn công AI agent.

Các nhà nghiên cứu bảo mật cảnh báo rằng AI có khả năng truy cập email, tài liệu hoặc hệ thống nội bộ nếu bị điều khiển sai cách có thể trở thành rủi ro lớn với doanh nghiệp. Nhiều ý kiến cho rằng tương lai của AI không chỉ là cuộc đua mô hình mạnh hơn, mà còn là cuộc đua xây dựng cơ chế kiểm soát và phòng thủ đủ an toàn để AI không trở thành “cửa hậu” mới trong hạ tầng số.​
 
Được phối hợp thực hiện bởi các chuyên gia của Bkav, cộng đồng An ninh mạng Việt Nam WhiteHat và cộng đồng Khoa học công nghệ VnReview


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL2NoYXRncHQtdGh1LW5naGllbS1sb2NrZG93bi1tb2RlLW5nYW4tcm8tcmktZHUtbGlldS1haS12YS1sYW0tZHVuZy1jb25nLWN1Ljg0NDkxLw==
Top