Nhóm MIT chống lại việc thao túng hình ảnh AI độc hại trên một vài pixel cùng một lúc

Chỉnh sửa hình ảnh AI đang gia tăng, nhưng kỹ thuật mới này có thể giúp ngăn chặn điều đó.
Nhóm MIT chống lại việc thao túng hình ảnh AI độc hại trên một vài pixel cùng một lúc
Screenshot by Artie Beaty/ZDNET
Khi việc tạo và chỉnh sửa hình ảnh bằng AI trở nên phổ biến hơn, một mối lo ngại mới về quyền riêng tư kỹ thuật số đã nảy sinh -- việc chỉnh sửa trái phép tác phẩm nghệ thuật hoặc ảnh của ai đó bằng AI. Cho đến nay, không có gì ngăn cản ai đó chụp ảnh trực tuyến, tải nó lên một chương trình AI và thao túng nó cho mọi mục đích.
Nhưng một kỹ thuật mới của một nhóm tại MIT có thể thay đổi điều đó.
Được gọi đơn giản là "PhotoGuard", phương pháp này đòi hỏi sự hiểu biết sâu sắc về các thuật toán mà AI vận hành. Với hiểu biết đó, nhóm đã phát triển các cách để thay đổi hình ảnh một cách rất tinh vi, phá vỡ cách AI diễn giải hình ảnh đó. Và nếu AI không thể hiểu một hình ảnh, thì nó không thể chỉnh sửa nó.
"Cốt lõi trong cách tiếp cận của chúng tôi," nhóm MIT giải thích trong một bài báo về dự án của họ, "là ý tưởng về miễn dịch hóa hình ảnh - nghĩa là làm cho một hình ảnh cụ thể chống lại thao tác do AI cung cấp bằng cách thêm một hình ảnh được chế tạo cẩn thận (không thể nhận thấy) nhiễu loạn cho nó."
PhotoGuard hoạt động bằng cách thay đổi một số pixel được chọn trong mỗi hình ảnh theo cách mà AI nhìn thấy những thứ không có ở đó. Những thay đổi này không thể nhìn thấy bằng mắt người, nhưng chúng rất sáng đối với AI. Khi AI nhìn thấy các pixel đã chỉnh sửa, nó sẽ đánh giá quá cao tầm quan trọng của chúng và chỉnh sửa hình ảnh thành các pixel đó thay vì phần còn lại của hình ảnh.
Để kiểm tra kết quả của họ, nhóm MIT đã chụp 60 hình ảnh và tạo các chỉnh sửa AI bằng nhiều lời nhắc khác nhau -- cả trên các phiên bản được tiêm chủng và không được tiêm chủng của cùng một hình ảnh. Khi hình ảnh mới được tạo, họ đã sử dụng một số chỉ số để xác định mức độ giống nhau của các chỉnh sửa. Kết quả cuối cùng? Trong một thử nghiệm với 60 hình ảnh, nhóm đã phát hiện ra rằng các bản chỉnh sửa của hình ảnh được tiêm chủng "khác biệt đáng kể so với những hình ảnh không được tiêm chủng".
Tất nhiên, phương pháp này không phải là hoàn hảo. Nếu ai đó đủ muốn, họ vẫn có thể chỉnh sửa ảnh một cách ác ý -- có thể bằng cách cắt xén ảnh cho đến khi họ cắt bỏ pixel gây rắc rối hoặc chỉ đơn giản là áp dụng bộ lọc cho ảnh. Tuy nhiên, điều này đưa ra một trở ngại đáng kể có thể ngăn cản rất nhiều người.
Và mặc dù phương pháp này có hiệu quả đối với thế hệ AI này, nhưng điều đó không nhất thiết có nghĩa là nó sẽ tồn tại trong tương lai. Đó là lý do tại sao những người sáng tạo PhotoGuard khuyến khích sự phát triển trong lĩnh vực này không chỉ thông qua các phương pháp kỹ thuật mà còn thông qua "sự hợp tác giữa các tổ chức phát triển các mô hình phổ biến lớn, người dùng cuối, cũng như các nền tảng lưu trữ và phổ biến dữ liệu."
Ngay bây giờ, PhotoGuard chỉ đơn giản là một kỹ thuật. Không có phần mềm nào có sẵn cho công chúng và người sáng tạo thừa nhận rằng còn rất nhiều việc phải làm để phần mềm này trở nên thiết thực và có sẵn cho công chúng. Tuy nhiên, đây là một bước tiến để bảo vệ chống lại các mối đe dọa mới từ AI, nhóm MIT cho biết và là dấu hiệu cho thấy các công ty cần đầu tư vào cuộc chiến.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top