ChatGPT gây tranh cãi khi sử dụng dữ liệu từ Grokipedia của Elon Musk: Lo ngại về vòng lặp thông tin sai lệch

Dũng Đỗ
Dũng Đỗ
Phản hồi: 0
Một phát hiện mới đây từ tờ The Guardian đã dấy lên những lo ngại nghiêm trọng trong cộng đồng công nghệ khi mô hình ngôn ngữ mới nhất của OpenAI là GPT-5.2 bị phát hiện đang sử dụng Grokipedia làm nguồn tham khảo. Grokipedia là nền tảng thông tin được vận hành bởi chatbot Grok của công ty xAI do Elon Musk sáng lập. Việc một mô hình AI hàng đầu trích dẫn dữ liệu từ một AI khác đang đặt ra những câu hỏi lớn về tính xác thực của thông tin và nguy cơ tạo ra các vòng lặp sai lệch trong hệ sinh thái trí tuệ nhân tạo.

1769434390818.png

Tần suất trích dẫn đáng báo động trong các chủ đề ngách

Trong loạt bài kiểm tra thực nghiệm do The Guardian tiến hành, ChatGPT phiên bản GPT-5.2 đã trích dẫn nguồn từ Grokipedia tới chín lần trong hơn 10 câu hỏi khác nhau. Điều đáng chú ý là các trích dẫn này thường xuất hiện khi người dùng truy vấn về những chủ đề ít phổ biến hoặc mang tính chuyên sâu, thay vì các kiến thức đại chúng. Cụ thể, chatbot này đã dựa vào Grokipedia để trả lời các câu hỏi phức tạp về cấu trúc chính trị tại Iran, bao gồm mức lương của lực lượng bán quân sự Basij hay quyền sở hữu của quỹ Mostazafan. Ngoài ra, tiểu sử của nhà sử học người Anh Richard Evans cũng là một nội dung được lấy từ nguồn này.

Ngược lại, khi được hỏi về các sự kiện hoặc nhân vật nổi tiếng mà dữ liệu đã được xác lập rộng rãi, ChatGPT lại không sử dụng Grokipedia. Điều này cho thấy thuật toán của OpenAI dường như đang tìm đến nền tảng của Elon Musk như một giải pháp lấp đầy khoảng trống dữ liệu đối với các thông tin ngách (long-tail information), nơi mà các nguồn thống tin truyền thống có thể chưa cập nhật hoặc thiếu chi tiết.

1769434403165.png

Grokipedia và cơ chế xác thực gây tranh cãi

Được ra mắt vào tháng 10 năm ngoái, Grokipedia được Elon Musk định vị là đối thủ trực tiếp của Wikipedia. Tuy nhiên, theo NBC News, cơ chế hoạt động của nền tảng này có sự khác biệt căn bản. Nếu như Wikipedia dựa vào cộng đồng tình nguyện viên khổng lồ để biên soạn, chỉnh sửa và đối chiếu nguồn, thì Grokipedia lại hoạt động theo cơ chế "hộp đen". Nền tảng này khẳng định các bài viết được chính chatbot Grok kiểm chứng mà không nêu rõ tác giả cụ thể. Người dùng truy cập chỉ có quyền xem và đề xuất chỉnh sửa thông qua biểu mẫu báo cáo sai sót chứ không thể can thiệp trực tiếp vào nội dung.

Mặc dù Elon Musk từng hứa hẹn Grokipedia là một bước cải tiến vượt bậc về độ chính xác, nhiều phân tích chỉ ra rằng một số lượng lớn bài viết trên nền tảng này thực chất vẫn được lấy lại từ Wikipedia hoặc tổng hợp từ các nguồn tin trên mạng xã hội X. Sự thiếu minh bạch trong quy trình biên tập và sự phụ thuộc vào thuật toán AI để tự kiểm chứng AI đang tạo ra một vùng xám về độ tin cậy.

Rủi ro từ việc AI học lại từ AI

Việc ChatGPT sử dụng dữ liệu từ Grokipedia khiến các chuyên gia về an toàn thông tin đặc biệt lo ngại. Bà Nina Jankowicz, một nhà nghiên cứu uy tín về thông tin sai lệch, nhận định rằng nhiều nội dung trên Grokipedia dường như dựa trên các nguồn không đáng tin cậy, thậm chí chứa đựng các thông tin sai lệch có chủ đích. Theo bà, khi một mô hình AI uy tín như ChatGPT trích dẫn lại các thông tin này, nó sẽ vô tình hợp thức hóa các sai sót đó, khiến người dùng khó lòng phân biệt được đâu là sự thật.

Vấn đề này được giới chuyên môn gọi là hiện tượng "vòng lặp ảo giác" (hallucination loop), nơi các AI trích dẫn lẫn nhau, khuếch đại các thông tin sai lệch và khiến chúng trở nên cực kỳ khó loại bỏ khỏi hệ thống tri thức số. Bà Jankowicz nhấn mạnh rằng hầu hết người dùng phổ thông sẽ không bỏ công sức để kiểm chứng lại nguồn gốc sâu xa của thông tin, do đó thiệt hại tiềm tàng là rất lớn.

1769434422193.png

Phản hồi từ OpenAI và sự tham gia của Anthropic

Trước các bằng chứng từ The Guardian, OpenAI đã đưa ra phản hồi chính thức. Công ty cho biết ChatGPT thu thập thông tin từ nhiều nguồn dữ liệu và quan điểm công khai khác nhau, đồng thời khẳng định hệ thống luôn áp dụng các bộ lọc an toàn để giảm thiểu nội dung gây hại hoặc có độ tin cậy thấp. Tuy nhiên, đại diện OpenAI không giải thích cụ thể lý do tại sao thuật toán của họ lại đánh giá Grokipedia là một nguồn tin đủ uy tín để trích dẫn.

Đáng chú ý, cuộc kiểm tra cũng phát hiện ra rằng ChatGPT không phải là chatbot duy nhất rơi vào tình trạng này. Claude, mô hình AI của Anthropic – một đối thủ lớn khác trong ngành, cũng được ghi nhận đã tham khảo Grokipedia cho các chủ đề về sản xuất dầu mỏ và bia Scotland. Hiện tại, Anthropic vẫn chưa đưa ra bình luận về vấn đề này, cho thấy xu hướng các mô hình ngôn ngữ lớn "học" lẫn nhau đang diễn ra phổ biến hơn so với hình dung của công chúng.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL2NoYXRncHQtZ2F5LXRyYW5oLWNhaS1raGktc3UtZHVuZy1kdS1saWV1LXR1LWdyb2tpcGVkaWEtY3VhLWVsb24tbXVzay1sby1uZ2FpLXZlLXZvbmctbGFwLXRob25nLXRpbi1zYWktbGVjaC43ODEyNy8=
Top