Gần 12.000 khóa API và mật khẩu trong bộ dữ liệu huấn luyện AI

Sóng AI
Sóng AI
Phản hồi: 0

Sóng AI

Writer
toR0l0xcntwk9y2qNj44.webp


  • Gần 12.000 khóa API và mật khẩu hợp lệ được phát hiện trong bộ dữ liệu Common Crawl, được sử dụng để huấn luyện nhiều mô hình AI.


  • Common Crawl là tổ chức phi lợi nhuận duy trì kho lưu trữ dữ liệu web nguồn mở khổng lồ từ năm 2008, được nhiều dự án AI sử dụng.


  • Các nhà nghiên cứu tại Truffle Security đã kiểm tra 400 terabyte dữ liệu từ 2,67 tỷ trang web trong kho lưu trữ Common Crawl tháng 12/2024.


  • Phát hiện 11.908 bí mật xác thực thành công, bao gồm khóa gốc AWS và khóa API MailChimp.


  • 219 loại bí mật riêng biệt được xác định, phổ biến nhất là khóa API MailChimp.


  • Gần 1.500 khóa API MailChimp độc nhất bị mã hóa cứng trong HTML và JavaScript phía máy khách.


  • 63% các bí mật được tìm thấy trên nhiều trang web khác nhau.


  • Một khóa API WalkScore xuất hiện 57.029 lần trên 1.871 tên miền phụ.


  • Phát hiện một trang web chứa 17 webhook Slack hoạt động độc nhất.


  • Truffle Security đã liên hệ với các nhà cung cấp bị ảnh hưởng và giúp họ thu hồi hàng nghìn khóa.


  • Kết quả nghiên cứu cảnh báo về việc thực hành mã hóa không an toàn có thể ảnh hưởng đến hành vi của các mô hình ngôn ngữ lớn.

📌 Phát hiện gần 12.000 khóa API và mật khẩu hợp lệ trong dữ liệu huấn luyện AI từ Common Crawl. Nhiều thông tin nhạy cảm bị mã hóa cứng trong HTML và JavaScript. 63% bí mật xuất hiện trên nhiều trang, một khóa API xuất hiện trên 57.029 trang. Cảnh báo về nguy cơ bảo mật nghiêm trọng cho các mô hình AI.

Nguồn: Songai.vn
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top