Sóng AI
Writer

Gần 12.000 khóa API và mật khẩu hợp lệ được phát hiện trong bộ dữ liệu Common Crawl, được sử dụng để huấn luyện nhiều mô hình AI.
Common Crawl là tổ chức phi lợi nhuận duy trì kho lưu trữ dữ liệu web nguồn mở khổng lồ từ năm 2008, được nhiều dự án AI sử dụng.
Các nhà nghiên cứu tại Truffle Security đã kiểm tra 400 terabyte dữ liệu từ 2,67 tỷ trang web trong kho lưu trữ Common Crawl tháng 12/2024.
Phát hiện 11.908 bí mật xác thực thành công, bao gồm khóa gốc AWS và khóa API MailChimp.
219 loại bí mật riêng biệt được xác định, phổ biến nhất là khóa API MailChimp.
Gần 1.500 khóa API MailChimp độc nhất bị mã hóa cứng trong HTML và JavaScript phía máy khách.
63% các bí mật được tìm thấy trên nhiều trang web khác nhau.
Một khóa API WalkScore xuất hiện 57.029 lần trên 1.871 tên miền phụ.
Phát hiện một trang web chứa 17 webhook Slack hoạt động độc nhất.
Truffle Security đã liên hệ với các nhà cung cấp bị ảnh hưởng và giúp họ thu hồi hàng nghìn khóa.
Kết quả nghiên cứu cảnh báo về việc thực hành mã hóa không an toàn có thể ảnh hưởng đến hành vi của các mô hình ngôn ngữ lớn.

Nguồn: Songai.vn