Hàng nghìn tác giả ký thư kêu gọi các nhà sản xuất AI ngừng "ăn cắp" sách

Thoại Viết Hoàng · 19/07/2023

Nếu bạn yêu cầu GPT-4 thực hiện một đoạn văn theo phong cách của Carmen Machado hoặc Margaret Atwood hoặc Alexander Chee, thì nó sẽ hoàn thành xuất sắc nhiệm vụ đó và vì lý do chính đáng: Nó có thể đã tiếp thu tất cả các tác phẩm của họ trong quá trình đào tạo và bây giờ sử dụng sự khéo léo của họ cho riêng mình. Nhưng những tác giả này, và hàng ngàn tác giả khác, không hài lòng với thực tế này.

AI là một mối quan tâm của các nhà văn và cũng là mối lo ngại hơn nhiều của các diễn viên

Hàng nghìn tác giả ký thư kêu gọi các nhà sản xuất AI ngừng ăn cắp sách

Trong một bức thư ngỏ có chữ ký của hơn 8.500 tác giả tiểu thuyết, phi hư cấu và thơ ca, các công ty công nghệ đứng sau các mô hình ngôn ngữ lớn như ChatGPT, Bard, LLaMa, v.v. bị buộc tội sử dụng bài viết của họ mà không được phép hoặc bồi thường.
“Những công nghệ này bắt chước và lặp lại ngôn ngữ, câu chuyện, phong cách và ý tưởng của chúng ta. Hàng triệu cuốn sách, bài báo, tiểu luận và thơ ca có bản quyền cung cấp 'thức ăn' cho các hệ thống AI, những bữa ăn vô tận mà không có hóa đơn,” bức thư viết.
Mặc dù các hệ thống của họ chứng tỏ có khả năng trích dẫn và bắt chước các tác giả được đề cập, nhưng các nhà phát triển AI đã không giải quyết được nguồn gốc của những tác phẩm này một cách đáng kể. Họ có được đào tạo về các mẫu lấy từ hiệu sách và các bài đánh giá không? Họ đã mượn mọi cuốn sách từ thư viện? Hoặc có lẽ họ chỉ tải xuống một trong nhiều kho lưu trữ bất hợp pháp, như Libgen?
Có một điều chắc chắn: Họ đã không đến gặp các nhà xuất bản và cấp phép cho họ - chắc chắn đây là phương pháp được ưa chuộng và được cho là phương pháp duy nhất hợp pháp và hợp đạo đức. Như các tác giả viết:
Quyết định gần đây của Tòa án Tối cao trong vụ Warhol kiện Goldsmith không chỉ làm rõ rằng tính thương mại cao của việc sử dụng của bạn chống lại việc sử dụng hợp lý, mà không tòa án nào có thể bào chữa cho việc sao chép các tác phẩm có nguồn gốc bất hợp pháp là sử dụng hợp lý. Kết quả của việc nhúng các bài viết của chúng tôi vào hệ thống của bạn, AI tạo ra có nguy cơ làm hỏng nghề nghiệp của chúng tôi bằng cách tràn ngập thị trường với những cuốn sách, câu chuyện và báo chí tầm thường, được viết bằng máy dựa trên công việc của chúng tôi.
Thật vậy, chúng tôi đã thấy điều này xảy ra. Gần đây, một số tác phẩm do AI tạo ra có chất lượng rất thấp đã lọt vào danh sách bán chạy nhất của YA tại Amazon; các nhà xuất bản tràn ngập các tác phẩm được tạo ra; và mỗi ngày, chính trang web này (và ngay sau đó là bài đăng này) được thu thập nội dung để đưa vào chum cho SEO.
Những tác nhân độc hại này đang sử dụng các công cụ, API và tác nhân được phát triển bởi OpenAI và Meta, bản thân chúng có thể được coi là những tác nhân độc hại trong bối cảnh này. Rốt cuộc, còn ai khác cố tình đánh cắp hàng triệu tác phẩm để cung cấp năng lượng cho một sản phẩm thương mại mới? (Tất nhiên, Google - nhưng lập chỉ mục tìm kiếm khác biệt đáng kể so với việc nhập AI và Google Sách ít nhất có lý do rằng nó được coi là một chỉ mục chuyên dụng.)
Với việc ngày càng ít tác giả có thể kiếm sống bằng văn bản do sự phức tạp và biên độ hẹp của việc xuất bản quy mô lớn, bức thư ngỏ cảnh báo rằng đây là một tình huống không thể giải quyết được đối với họ, đặc biệt là các tác giả mới hơn, “đặc biệt là các nhà văn trẻ và tiếng nói từ các cộng đồng ít được đại diện. .”
Bức thư yêu cầu các công ty làm như sau:
1. Xin phép sử dụng tài liệu có bản quyền của chúng tôi trong các chương trình AI tổng quát của bạn.
2. Đền bù công bằng cho những người viết về việc sử dụng các tác phẩm của chúng tôi trong quá khứ và liên tục trong các chương trình AI sáng tạo của bạn.
3. Đền bù công bằng cho người viết về việc sử dụng các tác phẩm của chúng tôi trong đầu ra AI, cho dù đầu ra đó có vi phạm luật hiện hành hay không.
Không có mối đe dọa pháp lý nào được đưa ra — như Giám đốc điều hành của Hiệp hội Tác giả (và người ký kết) Mary Rasenberger nói với NPR, “Các vụ kiện là một số tiền rất lớn. Họ mất rất nhiều thời gian.” Và AI đang làm hại các tác giả.
Công ty nào sẽ là người đầu tiên nói “vâng, chúng tôi đã xây dựng AI của mình trên các sản phẩm bị đánh cắp và chúng tôi xin lỗi, và chúng tôi sẽ trả tiền cho việc đó”? Đó là phỏng đoán của bất kỳ ai, nhưng dường như có rất ít động lực để làm như vậy. Hầu hết mọi người không biết hoặc lo ngại rằng các LLM được tạo ra thông qua số lượng phương tiện bất hợp pháp và trên thực tế, chúng có thể chứa và phát tán lại các tác phẩm có bản quyền. Sẽ dễ dàng nhận ra vấn đề (rất giống nhau) hơn khi đó là một hình ảnh được tạo ra tái tạo phong cách đặc biệt của một nghệ sĩ và có một số phản hồi ở đó.
Nhưng tác hại tinh vi hơn của việc sử dụng tất cả các cuốn sách của George Saunders hoặc Diana Gabaldon làm “thức ăn” cho AI của một người có thể không thúc đẩy nhiều người hành động - mặc dù nhiều tác giả sẵn sàng chiến đấu.
Tham khảo bài viết gốc tại đây