Wikipedia bị "khủng bố" bởi hàng tấn các bài viết sai lệch do công cụ AI tạo ra

Homelander The Seven · 11/10/2024

Wikipedia đang phải đối mặt với một "cơn đau đầu" mới: nội dung giả mạo do trí tuệ nhân tạo (AI) tạo ra. WikiProject AI Cleanup là một nhóm tình nguyện viên hiện đang rà soát các bài viết trên Wikipedia, chỉnh sửa hoặc xóa thông tin sai lệch có vẻ như đã được đăng bởi những người sử dụng AI tạo sinh.

Ilyas Lebleu, một thành viên sáng lập của nhóm dọn dẹp, cho biết với 404 Media rằng cuộc khủng hoảng bắt đầu khi các biên tập viên và người dùng Wikipedia bắt đầu nhìn thấy những đoạn văn bản rõ ràng được viết bởi một loại chatbot nào đó. Nhóm này đã xác nhận giả thuyết bằng cách tái tạo một số đoạn văn bằng cách sử dụng ChatGPT.

"Một số người trong chúng tôi đã nhận thấy sự phổ biến của văn bản không tự nhiên cho thấy dấu hiệu rõ ràng là do AI tạo ra và chúng tôi đã thành công trong việc tái tạo các 'phong cách' tương tự bằng cách sử dụng ChatGPT", Lebleu nói. "Việc khám phá ra một số cụm từ AI phổ biến cho phép chúng tôi nhanh chóng phát hiện ra một số ví dụ rõ ràng nhất về các bài viết được tạo ra, mà chúng tôi nhanh chóng muốn chính thức hóa thành một dự án có tổ chức để tổng hợp phát hiện và kỹ thuật của chúng tôi."

Ví dụ, có một bài viết về một pháo đài Ottoman được xây dựng vào những năm 1400 có tên là "Amberlisihar". Bài viết 2.000 từ này mô tả chi tiết vị trí và cấu trúc của địa danh. Thật không may, Amberlisihar không tồn tại và tất cả thông tin về nó là hoàn toàn ảo giác được thêm vào đủ thông tin thực tế để khiến nó có vẻ đáng tin cậy.

Hành vi phá hoại không chỉ giới hạn ở tài liệu mới được đăng tải. Những kẻ xấu đang chèn thông tin giả mạo do AI tạo ra vào các bài viết hiện có mà các biên tập viên tình nguyện viên đã kiểm duyệt. Trong một ví dụ, ai đó đã chèn một phần được trích dẫn chính xác về một loài cua cụ thể vào một bài viết về một loài bọ không liên quan.
Lebleu và các đồng nghiệp của ông cho biết họ không biết tại sao mọi người lại làm điều này, nhưng chúng ta đều biết điều này đang xảy ra vì hai lý do chính. Đầu tiên là vấn đề cố hữu với mô hình của Wikipedia - bất cứ ai cũng có thể là biên tập viên trên nền tảng. Nhiều trường đại học không chấp nhận sinh viên nộp bài báo trích dẫn Wikipedia chính vì lý do này.

Lý do thứ hai đơn giản là internet làm hỏng mọi thứ. Chúng ta đã thấy điều này nhiều lần, đặc biệt là với các ứng dụng AI. Bạn còn nhớ Tay, con bot Twitter của Microsoft đã bị gỡ bỏ trong vòng chưa đầy 24 giờ khi nó bắt đầu đăng các tweet thô tục và phân biệt chủng tộc chứ? Các ứng dụng AI hiện đại cũng dễ bị lạm dụng như chúng ta đã thấy với deepfake, sách shovelware vô lý do AI tạo ra trên Kindle và những trò lố bịch khác.

Bất cứ khi nào công chúng được phép truy cập gần như không giới hạn vào thứ gì đó, bạn có thể mong đợi một tỷ lệ nhỏ người dùng sẽ lạm dụng nó. Khi chúng ta đang nói về 100 người, nó có thể không phải là vấn đề lớn, nhưng khi nó là hàng triệu, bạn sẽ gặp phải vấn đề. Đôi khi, đó là vì lợi ích bất hợp pháp. Những lần khác, đó chỉ là vì họ có thể. Đó là trường hợp với tình trạng khó khăn hiện tại của Wikipedia.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Wikipedia bị "khủng bố" bởi hàng tấn các bài viết sai lệch do công cụ AI tạo ra

Homelander The Seven

I will laser every f****** one of you!

Homelander The Seven

Dùng AI tạo ra nữ quân nhân Mỹ sát cánh cùng ông Trump, CR7, Messi, "lừa" được tới hơn 1 triệu người theo dõi

300.000 doanh nghiệp nhỏ tại Việt Nam sắp được chính phủ hỗ trợ để ứng dụng AI

Tim Cook thăm Bắc Kinh, gọi AI là "khuếch đại con người chứ không thay thế con người"

Netanyahu và sự thật trớ trêu thời AI: khi con người phải chứng minh mình còn sống, nhưng vẫn không ai tin

Tại sao dữ liệu giao dịch lại có thể “thay thế danh tính” trong AI tài chính?

Google Stitch, công cụ thiết kế UI bằng AI “vibe design” đáng gờm, Figma cẩn thận!

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Điều gì xảy ra khi không lấy cao răng?

Đánh giá nổi bật