"Bão" kiện tụng AI: Reddit "tố" kỳ lân AI Anthropic "trộm" dữ liệu huấn luyện Claude hơn 100.000 lần, đòi bồi thường tỷ đô!

Khôi Nguyên
Khôi Nguyên
Phản hồi: 0
Mạng xã hội Reddit cáo buộc Anthropic, công ty AI được Amazon hậu thuẫn, đã "lén lút" thu thập dữ liệu người dùng để đào tạo mô hình Claude, bất chấp tuyên bố trước đó rằng đã chặn bot.1 Reddit đòi bồi thường thiệt hại có thể lên tới hàng tỷ USD và gọi đây là hành vi "trộm cắp".

20250604-Reddit-sues-Anthropic-for-allegedly-not-paying-for-training-data_webp_75.jpg

Reddit "tuyên chiến" với Anthropic vì cáo buộc trộm cắp dữ liệu

Mạng xã hội Reddit vào thứ Tư (ngày 4 tháng 6, theo giờ Mỹ) đã chính thức đệ đơn kiện công ty khởi nghiệp Trí tuệ Nhân tạo (AI) Anthropic lên tòa án thượng thẩm San Francisco.2 Đơn kiện cáo buộc rằng Anthropic, một đối thủ cạnh tranh đáng gờm của OpenAI, đã truy cập trái phép vào nền tảng của Reddit hơn 100.000 lần kể từ tháng 7 năm 2024.3 Điều đáng nói là, theo Reddit, hành vi này diễn ra sau khi Anthropic vào tháng 5 năm 2024 đã tuyên bố rằng họ đã chặn các bot của mình thu thập dữ liệu từ Reddit.

Trong hồ sơ khởi kiện, Reddit không ngần ngại gọi Anthropic là một "công ty trí tuệ nhân tạo 'nở muộn' tự cho mình là hiệp sĩ áo trắng của ngành AI," nhưng cáo buộc rằng "thực tế lại hoàn toàn trái ngược."

2025-06-04t193749z_2_lynxnpel5312k_rtroptp_3_anthropic-reddit_webp_75.jpg

Đơn kiện viết: "Vụ kiện này nói về hai bộ mặt của Anthropic: bộ mặt công khai cố gắng lấy lòng người tiêu dùng bằng những tuyên bố về sự chính trực, tôn trọng ranh giới và pháp luật; và bộ mặt riêng tư phớt lờ mọi quy tắc cản trở nỗ lực làm đầy túi tiền của họ."

Hiện tại, Anthropic chưa đưa ra bình luận ngay lập tức về vụ kiện này khi được The Verge liên hệ. Tuy nhiên, theo các nguồn tin khác như ReutersThe Economic Times, một phát ngôn viên của Anthropic đã cho biết công ty không đồng tình với các tuyên bố của Reddit và sẽ "bảo vệ mình một cách mạnh mẽ."

Thiệt hại hàng tỷ USD và giá trị của "tính nhân văn" trên Reddit

Ông Ben Lee, Giám đốc pháp lý của Reddit, cho biết trong một tuyên bố gửi qua email tới The Verge rằng việc Anthropic "khai thác thương mại" nội dung của Reddit có thể trị giá hàng tỷ đô la.

"Tính nhân văn của Reddit là vô giá một cách độc đáo trong một thế giới đang bị AI làm cho phẳng lặng," ông Lee nói. "Giờ đây hơn bao giờ hết, mọi người đang tìm kiếm những cuộc trò chuyện chân thực giữa người với người. Reddit lưu trữ gần 20 năm các cuộc thảo luận phong phú, mang tính nhân văn về hầu hết mọi chủ đề có thể tưởng tượng được. Những cuộc trò chuyện này không xảy ra ở bất kỳ nơi nào khác – và chúng là trung tâm để huấn luyện các mô hình ngôn ngữ như Claude (chatbot của Anthropic)."

reddit-ipo-v2_jpg_75.jpg

Một số nguồn tin từ Binance NewsSiliconAngle cho biết, Giám đốc Pháp lý của Reddit cũng tiết lộ rằng công ty đã cố gắng đàm phán một thỏa thuận cấp phép sử dụng dữ liệu với Anthropic, và đơn kiện được coi là biện pháp cuối cùng để đưa công ty này trở lại bàn đàm phán. Điều này cho thấy Reddit sẵn sàng cấp phép dữ liệu của mình cho các công ty AI, nhưng phải tuân theo các điều khoản và giới hạn rõ ràng.

Trước đó, vào tháng 2 năm 2024, Reddit đã ký một thỏa thuận với Google để cung cấp dữ liệu huấn luyện AI cho công ty này. Bloomberg vào thời điểm đó đưa tin rằng Reddit cũng đã ký một thỏa thuận với một công ty giấu tên (có thể là Google hoặc OpenAI) trị giá khoảng 60 triệu USD mỗi năm.

Anthropic và "lịch sử" các vụ kiện vi phạm bản quyền

Đây không phải là lần đầu tiên startup AI được Amazon hậu thuẫn này, vốn đứng sau chatbot nổi tiếng Claude, bị kiện vì cáo buộc vi phạm bản quyền.
  • Tháng 8 năm 2023, ba tác giả đã đệ đơn kiện tập thể lên tòa án liên bang California chống lại Anthropic, cáo buộc trong hồ sơ rằng công ty đã "xây dựng một doanh nghiệp trị giá hàng tỷ đô la bằng cách đánh cắp hàng trăm nghìn cuốn sách có bản quyền."
  • Tháng 10 năm 2023, Universal Music đã kiện Anthropic tại tòa án liên bang Tennessee về việc "vi phạm có hệ thống và trên diện rộng lời bài hát có bản quyền của họ."
Xu hướng kiện tụng các công ty AI ngày càng gia tăng

Vụ kiện của Reddit là một phần của xu hướng ngày càng tăng, trong đó các nhà xuất bản và người tạo nội dung khởi kiện các công ty AI vì cáo buộc vi phạm bản quyền và thu thập dữ liệu trái phép.
  • OpenAI, nhà sáng tạo ChatGPT, là một tâm điểm của cuộc tranh luận này, đối mặt với các vụ kiện đình đám từ The New York Times, một nhóm tác giả bao gồm cả George R.R. Martin, và các nhà xuất bản báo chí như The New York Daily NewsThe Chicago Tribune.4

  • Một nhóm các nhà xuất bản bao gồm Condé Nast và Vox Media (công ty mẹ của The Verge) cũng đã kiện công ty AI Cohere vì vi phạm bản quyền.
Những vụ kiện này đang đặt ra những câu hỏi pháp lý phức tạp về việc liệu việc sử dụng dữ liệu công khai trên internet để huấn luyện các mô hình AI có cấu thành hành vi vi phạm bản quyền hay không, và liệu các công ty AI có cần phải xin phép và trả tiền cho việc sử dụng nguồn dữ liệu này. Kết quả của các vụ kiện này có thể sẽ định hình lại tương lai của ngành công nghiệp AI và mối quan hệ giữa các nhà phát triển AI và những người tạo ra nội dung gốc.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL2Jhby1raWVuLXR1bmctYWktcmVkZGl0LXRvLWt5LWxhbi1haS1hbnRocm9waWMtdHJvbS1kdS1saWV1LWh1YW4tbHV5ZW4tY2xhdWRlLWhvbi0xMDAtMDAwLWxhbi1kb2ktYm9pLXRodW9uZy10eS1kby42MjQ1OC8=
Top