Wikipedia bị "khủng bố" bởi hàng tấn các bài viết sai lệch do công cụ AI tạo ra

Homelander The Seven

I will laser every f****** one of you!
Wikipedia đang phải đối mặt với một "cơn đau đầu" mới: nội dung giả mạo do trí tuệ nhân tạo (AI) tạo ra. WikiProject AI Cleanup là một nhóm tình nguyện viên hiện đang rà soát các bài viết trên Wikipedia, chỉnh sửa hoặc xóa thông tin sai lệch có vẻ như đã được đăng bởi những người sử dụng AI tạo sinh.

Ilyas Lebleu, một thành viên sáng lập của nhóm dọn dẹp, cho biết với 404 Media rằng cuộc khủng hoảng bắt đầu khi các biên tập viên và người dùng Wikipedia bắt đầu nhìn thấy những đoạn văn bản rõ ràng được viết bởi một loại chatbot nào đó. Nhóm này đã xác nhận giả thuyết bằng cách tái tạo một số đoạn văn bằng cách sử dụng ChatGPT.

"Một số người trong chúng tôi đã nhận thấy sự phổ biến của văn bản không tự nhiên cho thấy dấu hiệu rõ ràng là do AI tạo ra và chúng tôi đã thành công trong việc tái tạo các 'phong cách' tương tự bằng cách sử dụng ChatGPT", Lebleu nói. "Việc khám phá ra một số cụm từ AI phổ biến cho phép chúng tôi nhanh chóng phát hiện ra một số ví dụ rõ ràng nhất về các bài viết được tạo ra, mà chúng tôi nhanh chóng muốn chính thức hóa thành một dự án có tổ chức để tổng hợp phát hiện và kỹ thuật của chúng tôi."

1728631113812.png


Ví dụ, có một bài viết về một pháo đài Ottoman được xây dựng vào những năm 1400 có tên là "Amberlisihar". Bài viết 2.000 từ này mô tả chi tiết vị trí và cấu trúc của địa danh. Thật không may, Amberlisihar không tồn tại và tất cả thông tin về nó là hoàn toàn ảo giác được thêm vào đủ thông tin thực tế để khiến nó có vẻ đáng tin cậy.

Hành vi phá hoại không chỉ giới hạn ở tài liệu mới được đăng tải. Những kẻ xấu đang chèn thông tin giả mạo do AI tạo ra vào các bài viết hiện có mà các biên tập viên tình nguyện viên đã kiểm duyệt. Trong một ví dụ, ai đó đã chèn một phần được trích dẫn chính xác về một loài cua cụ thể vào một bài viết về một loài bọ không liên quan.
Lebleu và các đồng nghiệp của ông cho biết họ không biết tại sao mọi người lại làm điều này, nhưng chúng ta đều biết điều này đang xảy ra vì hai lý do chính. Đầu tiên là vấn đề cố hữu với mô hình của Wikipedia - bất cứ ai cũng có thể là biên tập viên trên nền tảng. Nhiều trường đại học không chấp nhận sinh viên nộp bài báo trích dẫn Wikipedia chính vì lý do này.

1728631138166.png


Lý do thứ hai đơn giản là internet làm hỏng mọi thứ. Chúng ta đã thấy điều này nhiều lần, đặc biệt là với các ứng dụng AI. Bạn còn nhớ Tay, con bot Twitter của Microsoft đã bị gỡ bỏ trong vòng chưa đầy 24 giờ khi nó bắt đầu đăng các tweet thô tục và phân biệt chủng tộc chứ? Các ứng dụng AI hiện đại cũng dễ bị lạm dụng như chúng ta đã thấy với deepfake, sách shovelware vô lý do AI tạo ra trên Kindle và những trò lố bịch khác.

Bất cứ khi nào công chúng được phép truy cập gần như không giới hạn vào thứ gì đó, bạn có thể mong đợi một tỷ lệ nhỏ người dùng sẽ lạm dụng nó. Khi chúng ta đang nói về 100 người, nó có thể không phải là vấn đề lớn, nhưng khi nó là hàng triệu, bạn sẽ gặp phải vấn đề. Đôi khi, đó là vì lợi ích bất hợp pháp. Những lần khác, đó chỉ là vì họ có thể. Đó là trường hợp với tình trạng khó khăn hiện tại của Wikipedia.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top