Thông tin sai lệch (hallucination) và nội dung vô nghĩa trong nội dung AI tạo ra khác nhau thế nào?

C
Con voi còi
Phản hồi: 0
Nhiều người khi dùng AI hay gom chung mọi lỗi trả lời sai vào một rọ, nhưng trong giới làm công nghệ thì thông tin sai lệch (hay thường gọi là ảo giác AI) và nội dung vô nghĩa là hai hiện tượng rất khác nhau về bản chất, mức độ nguy hiểm cũng không giống nhau.

Ảo giác AI là trường hợp AI đưa ra thông tin sai hoặc không có thật, nhưng cách trình bày lại cực kỳ trôi chảy, mạch lạc và nghe rất có lý. Câu chữ đúng ngữ pháp, lập luận có đầu có đuôi, thậm chí còn kèm theo tên người, mốc thời gian, tài liệu tham khảo nghe rất “chuyên nghiệp”. Vấn đề nằm ở chỗ tất cả những thứ đó có thể hoàn toàn do AI tự dựng lên. Nguyên nhân là vì mô hình ngôn ngữ hoạt động bằng cách dự đoán từ tiếp theo dựa trên xác suất. Khi thiếu dữ liệu hoặc gặp câu hỏi ngoài vùng hiểu biết, nó vẫn cố “lấp chỗ trống” sao cho câu trả lời xuôi tai nhất, chứ không biết dừng lại đúng lúc. Vì vậy ảo giác rất nguy hiểm, bởi người đọc dễ tin sái cổ rằng mình đang nhận được thông tin chính xác.
1768544921447.png

Ngược lại, nội dung vô nghĩa là dạng lỗi thô hơn và dễ nhận ra hơn rất nhiều. Khi xảy ra hiện tượng này, AI tạo ra những chuỗi chữ rời rạc, lặp từ, sai ngữ pháp, hoặc hoàn toàn không có ý nghĩa, chúng ta hay gọi là nói nhảm chính là nó! Người đọc nhìn vào là biết ngay câu trả lời không thể sử dụng được. Bản chất của lỗi này thường không phải do “suy đoán sai kiến thức”, mà do hệ thống gặp trục trặc trong quá trình xử lý ngôn ngữ, chẳng hạn lỗi mã hóa, giải mã hoặc mô hình bị vỡ cấu trúc câu. Nói cách khác, AI lúc này không còn giữ được khả năng nói chuyện bình thường.

Điểm mấu chốt để phân biệt nằm ở cảm giác khi đọc. Nếu câu trả lời nghe rất hợp lý, rất trơn tru nhưng kiểm tra lại thì thấy sai hoặc không có nguồn thật, đó là ảo giác. Nếu câu trả lời lộn xộn, vô nghĩa, đọc không hiểu gì ngay từ đầu, đó là nội dung vô nghĩa. Chính vì ảo giác khoác lên mình vẻ ngoài “có học” nên nó mới là thứ đáng cảnh giác nhất khi dùng AI, còn nội dung vô nghĩa thì thường chỉ là dấu hiệu cho thấy hệ thống đang gặp lỗi rõ ràng.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL3Rob25nLXRpbi1zYWktbGVjaC1oYWxsdWNpbmF0aW9uLXZhLW5vaS1kdW5nLXZvLW5naGlhLXRyb25nLW5vaS1kdW5nLWFpLXRhby1yYS1raGFjLW5oYXUtdGhlLW5hby43NzUyMC8=
Top