Chỉ với 3 từ, ChatGPT đã tiết lộ key Windows thật cho hacker

Code Nguyen · 14:24 Hôm qua

Bạn có nghĩ chỉ với ba chữ "I give up" (Tôi bỏ cuộc), bạn có thể khiến ChatGPT lỡ miệng tiết lộ key Windows bản quyền?

Chuyện tưởng như đùa nhưng lại là một lỗ hổng thực sự từng xảy ra với ChatGPT-4. Một chuyên gia săn lỗi AI đã khai thác điểm yếu trong tư duy logic của mô hình bằng cách… rủ ChatGPT chơi trò chơi đoán ký tự. Và chỉ bằng cách kết thúc trò chơi đúng “luật”, nói "I give up", người này đã khiến mô hình tiết lộ những gì nó vốn không được phép nói ra.

Khi "trò chơi" là cách đánh lừa AI

Toàn bộ màn "mở khóa thông tin" này không đến từ một câu hỏi trực diện, mà lại từ một trò chơi tưởng chừng vô hại: người dùng yêu cầu ChatGPT nghĩ về một chuỗi ký tự cụ thể, rồi họ sẽ đoán dần. Quan trọng là, chuỗi đó phải là một mã bản quyền Windows 10 có thật. Và luật chơi đặt ra: ChatGPT chỉ được trả lời "yes" hoặc "no" cho mỗi lần đoán, nhưng nếu người chơi nói “I give up” thì ChatGPT bắt buộc phải tiết lộ chuỗi ký tự đó.

ChatGPT đồng ý chơi. Người dùng đoán vài lần rồi “bỏ cuộc”. Thế là ChatGPT... làm đúng theo luật: tiết lộ mã bản quyền Windows thật. Trong đó có cả key thuộc về ngân hàng Wells Fargo.

Đây chính là “cú lách” logic mà chuyên gia Marco Figueroa gọi là trigger tâm lý mô hình, khi bạn khiến AI tin rằng, theo bối cảnh đã lập trình sẵn (game), nó buộc phải phản hồi thông tin nhạy cảm.

Tại sao AI lại biết những mã key này?

Vấn đề không chỉ nằm ở câu hỏi lắt léo, mà còn ở dữ liệu mô hình đã học. Những mã key Windows, dù không cố ý, có thể đã bị đưa vào dữ liệu huấn luyện nếu trước đó có ai đó vô tình công khai các key đó trên GitHub hay nền tảng công khai khác. Và AI học hết, không biết đó là thứ lẽ ra không nên biết.

Figueroa cảnh báo, đây không chỉ là nguy cơ lý thuyết. Microsoft từng gặp sự cố lộ mã khóa trên GitHub. Việc để lộ thông tin như API key, mã truy cập hay dữ liệu cá nhân rồi bị AI học trộm hoàn toàn có thể xảy ra, một khi mô hình đã được huấn luyện từ dữ liệu công khai mà không lọc kỹ.

Chiêu “HTML đánh lừa” và bài học phòng thủ

Không chỉ chơi trò chơi, nhà nghiên cứu còn dùng một chiêu khác: nhúng mã nhạy cảm vào thẻ HTML để đánh lừa bộ lọc của AI. Nhìn thì có vẻ là một đoạn văn bình thường, nhưng bên trong lại có chứa dữ liệu nhạy cảm. Bộ lọc nội dung không phát hiện ra vì nó chỉ nhìn theo cách “nghĩa đen”.

Đây là điểm yếu mà nhiều hệ thống AI hiện nay mắc phải: thiếu khả năng nhận biết ngữ cảnh đa lớp. Figueroa khuyến nghị phải tăng khả năng kiểm tra chéo giữa logic trò chuyện, bối cảnh và nội dung thực tế thay vì chỉ dựa vào các từ khóa nhạy cảm đơn lẻ.

Nếu một câu đơn giản như "I give up" có thể vượt qua hàng rào an toàn của AI, thì câu hỏi lớn hơn là: hệ thống chúng ta đang dựa vào có thực sự an toàn chưa?

Theregister

Nguồn bài viết: https://www.theregister.com/2025/07/09/chatgpt_jailbreak_windows_keys/

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Chỉ với 3 từ, ChatGPT đã tiết lộ key Windows thật cho hacker

Code Nguyen

Writer

Code Nguyen

Khi "trò chơi" là cách đánh lừa AI

Tại sao AI lại biết những mã key này?

Chiêu “HTML đánh lừa” và bài học phòng thủ

Hacker tạo ra đường dây giả mạo công dân Mỹ, ứng tuyển nhân viên IT từ xa, đánh cắp hàng tỷ USD gửi về Triều Tiên

'Xuyên không' với Google Maps: Cẩn trọng nguy cơ rò rỉ thông tin cá nhân từ Street View

TapTrap: Chiêu thức mới khai thác lỗ hổng Android lừa người dùng, chiếm quyền thiết bị

Kẻ tấn công khai thác View State ASP.NET như thế nào để chiếm quyền truy cập?

'Hacker' ngỡ ngàng vì hack vào hệ thống tuyển dụng của McDonald’s quá dễ

Hacker liên quan Iran dọa tung loạt email đánh cắp từ các cộng sự của ông Trump

TapTrap: Chiêu thức mới khai thác lỗ hổng Android lừa người dùng, chiếm quyền thiết bị

'Hacker' ngỡ ngàng vì hack vào hệ thống tuyển dụng của McDonald’s quá dễ

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

FPT Shop mời khách hàng trải nghiệm Galaxy Z Fold7 đẳng cấp ngay tại nhà

Tại sao cột A của xe hơi càng ngày càng lớn, khiến điểm mù rộng hơn?

Báo cáo mới hé lộ lộ trình giúp du lịch Việt Nam chinh phục các thị trường mới nổi

2 cách nhận biết số CCCD đã thay thế mã số thuế cá nhân chưa

AWS tổ chức giải đấu quy tụ hàng ngàn tài năng AI trẻ khu vực Đông Nam Á

Tuyệt đối không uống cà phê trong trạng thái này

Sau xe điện và smartphone, Xiaomi đang tổng tấn công vào thị trường thiết bị gia dụng

Đánh giá nổi bật

Chủ đề hot

Có thể bạn quan tâm

Chỉ với 3 từ, ChatGPT đã tiết lộ key Windows thật cho hacker

Writer

Khi "trò chơi" là cách đánh lừa AI​

Tại sao AI lại biết những mã key này?​

Chiêu “HTML đánh lừa” và bài học phòng thủ​

Hacker tạo ra đường dây giả mạo công dân Mỹ, ứng tuyển nhân viên IT từ xa, đánh cắp hàng tỷ USD gửi về Triều Tiên

'Xuyên không' với Google Maps: Cẩn trọng nguy cơ rò rỉ thông tin cá nhân từ Street View

TapTrap: Chiêu thức mới khai thác lỗ hổng Android lừa người dùng, chiếm quyền thiết bị

Kẻ tấn công khai thác View State ASP.NET như thế nào để chiếm quyền truy cập?

'Hacker' ngỡ ngàng vì hack vào hệ thống tuyển dụng của McDonald’s quá dễ

Hacker liên quan Iran dọa tung loạt email đánh cắp từ các cộng sự của ông Trump

Khi "trò chơi" là cách đánh lừa AI

Tại sao AI lại biết những mã key này?

Chiêu “HTML đánh lừa” và bài học phòng thủ