Homelander The Seven
I will laser every f****** one of you!
Vụ kiện bản quyền giữa The New York Times và OpenAI cùng Microsoft đang ngày càng trở nên gay gắt. Tuần này, tờ Times cáo buộc các kỹ sư của OpenAI đã vô tình xóa dữ liệu mà đội ngũ của họ đã dành hơn 150 giờ để trích xuất làm bằng chứng tiềm năng.
Mặc dù OpenAI đã khôi phục được phần lớn dữ liệu, nhưng đội ngũ pháp lý của Times cho biết họ vẫn thiếu tên tệp gốc và cấu trúc thư mục. Theo một tuyên bố gửi lên tòa án hôm thứ Tư bởi Jennifer B. Maisel, luật sư của tờ báo, điều này đồng nghĩa với việc thông tin "không thể được sử dụng để xác định vị trí các bài báo sao chép của nguyên đơn" có thể đã được tích hợp vào các mô hình trí tuệ nhân tạo của OpenAI. "Chúng tôi không đồng ý với những đặc điểm được đưa ra và sẽ sớm nộp phản hồi của mình", Jason Deutrom, người phát ngôn của OpenAI, nói với WIRED trong một tuyên bố. The New York Times từ chối bình luận.
Năm ngoái, tờ Times đã đệ đơn kiện bản quyền chống lại OpenAI và Microsoft, cáo buộc các công ty này đã sử dụng trái phép các bài báo của mình để đào tạo các công cụ trí tuệ nhân tạo như ChatGPT. Vụ kiện này là một trong nhiều cuộc chiến pháp lý đang diễn ra giữa các công ty AI và các nhà xuất bản, bao gồm một vụ kiện tương tự do Daily News đệ trình, được xử lý bởi một số luật sư tương tự.
Vụ kiện của Times hiện đang trong giai đoạn khám phá, nghĩa là cả hai bên đang chuyển giao các tài liệu và thông tin được yêu cầu có thể trở thành bằng chứng. Trong quá trình này, OpenAI được tòa án yêu cầu cho Times xem dữ liệu đào tạo của mình, một vấn đề lớn vì OpenAI chưa bao giờ tiết lộ công khai chính xác thông tin nào đã được sử dụng để xây dựng các mô hình AI của mình. Để tiết lộ điều này, OpenAI đã tạo ra thứ mà tòa án gọi là "hộp cát" gồm hai "máy ảo" mà các luật sư của Times có thể sàng lọc. Trong tuyên bố của mình, Maisel cho biết các kỹ sư của OpenAI đã "xóa" dữ liệu do nhóm của Times sắp xếp trên một trong những máy này.
Theo hồ sơ của Maisel, OpenAI thừa nhận thông tin đã bị xóa và đã cố gắng giải quyết sự cố ngay sau khi được cảnh báo vào đầu tháng này. Tuy nhiên, khi các luật sư của tờ báo xem xét dữ liệu "đã được khôi phục", nó quá lộn xộn, buộc họ "phải làm lại công việc của mình từ đầu, tốn rất nhiều giờ làm việc của con người và thời gian xử lý máy tính", một số luật sư khác của Times cho biết trong một lá thư gửi thẩm phán cùng ngày với tuyên bố của Maisel. Các luật sư lưu ý rằng họ "không có lý do gì để tin" rằng việc xóa dữ liệu là "cố ý". Trong email được gửi kèm theo thư của Maisel, luật sư của OpenAI, Tom Gorman, gọi việc xóa dữ liệu là một "trục trặc".
Đây không phải là tranh chấp đầu tiên thuộc loại này trong vụ kiện. Trong năm qua, Times và các công ty công nghệ đã tranh cãi về việc bên nào chịu trách nhiệm phân loại dữ liệu đào tạo. Trong lá thư gần đây nhất, các luật sư của tờ báo một lần nữa khẳng định rằng OpenAI ở vị thế tốt hơn để làm điều đó. "Quá trình này không diễn ra suôn sẻ", Steven Lieberman, một luật sư khác của Times, đã viết trong một hồ sơ đầu tháng này, trong đó ông tuyên bố rằng "các vấn đề kỹ thuật nghiêm trọng và lặp lại đã khiến việc tìm kiếm hiệu quả và hiệu suất trên các bộ dữ liệu đào tạo của OpenAI trở nên bất khả thi để xác định toàn bộ phạm vi vi phạm của OpenAI."
Times cũng gần đây đã thúc ép OpenAI và Microsoft cung cấp tin nhắn Slack, tin nhắn văn bản và các cuộc trò chuyện trên mạng xã hội giữa một số nhân vật chủ chốt của OpenAI, bao gồm cả cựu nhân viên như Ilya Slutskever và các giám đốc điều hành hiện tại như Brad Lightstone. Tuần trước, The New York Times đã đệ trình một lá thư khác yêu cầu tòa án buộc Microsoft và OpenAI chia sẻ thêm tài liệu. Một bằng chứng cho thấy các email cho thấy cựu giám đốc công nghệ của OpenAI, Mira Murati, đã từ chối "cung cấp quyền truy cập" vào điện thoại di động cá nhân của cô.
Trong khi đó, Microsoft đã yêu cầu The New York Times giao nộp bất kỳ tài liệu nào liên quan đến việc sử dụng AI tạo sinh của chính họ. Trong một hồ sơ, họ đặc biệt trích dẫn chuyên mục công nghệ nổi tiếng Kevin Roose (được gọi là "Kevin Rouse" trong hồ sơ tòa án). Microsoft lập luận rằng thông tin về cách Times sử dụng các công cụ AI có thể liên quan đến biện hộ của họ theo nhiều cách, bao gồm cả việc chứng minh rằng chúng có tác động tích cực đến tờ báo. Roose từ chối bình luận.
Khi vụ án này và các vụ án tương tự đang được xử lý tại tòa án, OpenAI đang theo đuổi các thỏa thuận cấp phép nội dung với các nhà xuất bản khác, bao gồm The Atlantic, Axel Springer, Vox Media và công ty mẹ của WIRED là Condé Nast. Không có sự đồng thuận trong giới truyền thông và pháp lý về việc các trường hợp này sẽ diễn ra như thế nào. Nhưng dù bằng cách nào, chúng sẽ tạo ra một tiền lệ quan trọng cho cách thức hoạt động của ngành công nghiệp AI tại Hoa Kỳ.
Mặc dù OpenAI đã khôi phục được phần lớn dữ liệu, nhưng đội ngũ pháp lý của Times cho biết họ vẫn thiếu tên tệp gốc và cấu trúc thư mục. Theo một tuyên bố gửi lên tòa án hôm thứ Tư bởi Jennifer B. Maisel, luật sư của tờ báo, điều này đồng nghĩa với việc thông tin "không thể được sử dụng để xác định vị trí các bài báo sao chép của nguyên đơn" có thể đã được tích hợp vào các mô hình trí tuệ nhân tạo của OpenAI. "Chúng tôi không đồng ý với những đặc điểm được đưa ra và sẽ sớm nộp phản hồi của mình", Jason Deutrom, người phát ngôn của OpenAI, nói với WIRED trong một tuyên bố. The New York Times từ chối bình luận.
Năm ngoái, tờ Times đã đệ đơn kiện bản quyền chống lại OpenAI và Microsoft, cáo buộc các công ty này đã sử dụng trái phép các bài báo của mình để đào tạo các công cụ trí tuệ nhân tạo như ChatGPT. Vụ kiện này là một trong nhiều cuộc chiến pháp lý đang diễn ra giữa các công ty AI và các nhà xuất bản, bao gồm một vụ kiện tương tự do Daily News đệ trình, được xử lý bởi một số luật sư tương tự.
Vụ kiện của Times hiện đang trong giai đoạn khám phá, nghĩa là cả hai bên đang chuyển giao các tài liệu và thông tin được yêu cầu có thể trở thành bằng chứng. Trong quá trình này, OpenAI được tòa án yêu cầu cho Times xem dữ liệu đào tạo của mình, một vấn đề lớn vì OpenAI chưa bao giờ tiết lộ công khai chính xác thông tin nào đã được sử dụng để xây dựng các mô hình AI của mình. Để tiết lộ điều này, OpenAI đã tạo ra thứ mà tòa án gọi là "hộp cát" gồm hai "máy ảo" mà các luật sư của Times có thể sàng lọc. Trong tuyên bố của mình, Maisel cho biết các kỹ sư của OpenAI đã "xóa" dữ liệu do nhóm của Times sắp xếp trên một trong những máy này.
Theo hồ sơ của Maisel, OpenAI thừa nhận thông tin đã bị xóa và đã cố gắng giải quyết sự cố ngay sau khi được cảnh báo vào đầu tháng này. Tuy nhiên, khi các luật sư của tờ báo xem xét dữ liệu "đã được khôi phục", nó quá lộn xộn, buộc họ "phải làm lại công việc của mình từ đầu, tốn rất nhiều giờ làm việc của con người và thời gian xử lý máy tính", một số luật sư khác của Times cho biết trong một lá thư gửi thẩm phán cùng ngày với tuyên bố của Maisel. Các luật sư lưu ý rằng họ "không có lý do gì để tin" rằng việc xóa dữ liệu là "cố ý". Trong email được gửi kèm theo thư của Maisel, luật sư của OpenAI, Tom Gorman, gọi việc xóa dữ liệu là một "trục trặc".
Đây không phải là tranh chấp đầu tiên thuộc loại này trong vụ kiện. Trong năm qua, Times và các công ty công nghệ đã tranh cãi về việc bên nào chịu trách nhiệm phân loại dữ liệu đào tạo. Trong lá thư gần đây nhất, các luật sư của tờ báo một lần nữa khẳng định rằng OpenAI ở vị thế tốt hơn để làm điều đó. "Quá trình này không diễn ra suôn sẻ", Steven Lieberman, một luật sư khác của Times, đã viết trong một hồ sơ đầu tháng này, trong đó ông tuyên bố rằng "các vấn đề kỹ thuật nghiêm trọng và lặp lại đã khiến việc tìm kiếm hiệu quả và hiệu suất trên các bộ dữ liệu đào tạo của OpenAI trở nên bất khả thi để xác định toàn bộ phạm vi vi phạm của OpenAI."
Times cũng gần đây đã thúc ép OpenAI và Microsoft cung cấp tin nhắn Slack, tin nhắn văn bản và các cuộc trò chuyện trên mạng xã hội giữa một số nhân vật chủ chốt của OpenAI, bao gồm cả cựu nhân viên như Ilya Slutskever và các giám đốc điều hành hiện tại như Brad Lightstone. Tuần trước, The New York Times đã đệ trình một lá thư khác yêu cầu tòa án buộc Microsoft và OpenAI chia sẻ thêm tài liệu. Một bằng chứng cho thấy các email cho thấy cựu giám đốc công nghệ của OpenAI, Mira Murati, đã từ chối "cung cấp quyền truy cập" vào điện thoại di động cá nhân của cô.
Trong khi đó, Microsoft đã yêu cầu The New York Times giao nộp bất kỳ tài liệu nào liên quan đến việc sử dụng AI tạo sinh của chính họ. Trong một hồ sơ, họ đặc biệt trích dẫn chuyên mục công nghệ nổi tiếng Kevin Roose (được gọi là "Kevin Rouse" trong hồ sơ tòa án). Microsoft lập luận rằng thông tin về cách Times sử dụng các công cụ AI có thể liên quan đến biện hộ của họ theo nhiều cách, bao gồm cả việc chứng minh rằng chúng có tác động tích cực đến tờ báo. Roose từ chối bình luận.
Khi vụ án này và các vụ án tương tự đang được xử lý tại tòa án, OpenAI đang theo đuổi các thỏa thuận cấp phép nội dung với các nhà xuất bản khác, bao gồm The Atlantic, Axel Springer, Vox Media và công ty mẹ của WIRED là Condé Nast. Không có sự đồng thuận trong giới truyền thông và pháp lý về việc các trường hợp này sẽ diễn ra như thế nào. Nhưng dù bằng cách nào, chúng sẽ tạo ra một tiền lệ quan trọng cho cách thức hoạt động của ngành công nghiệp AI tại Hoa Kỳ.