AI sáng tạo đáp ứng bản quyền

Thoại Viết Hoàng · 14/07/2023

Các vụ kiện đang diễn ra có thể ảnh hưởng đến tất cả những người sử dụng AI tổng quát.

ChatGPT đang thay đổi cách các ngành kinh doanh như thế nào?

Trí tuệ nhân tạo sáng tạo (AI) là một công nghệ đột phá được công chúng nói chung cũng như các nhà khoa học và nhà công nghệ nhiệt tình về tiềm năng thúc đẩy nghiên cứu trong nhiều lĩnh vực áp dụng rộng rãi.

Nhưng một số nghệ sĩ, nhà văn và lập trình viên chuyên nghiệp phản đối quyết liệt việc sử dụng các sáng tạo của họ làm dữ liệu đào tạo cho các hệ thống AI tổng quát và các kết quả đầu ra có thể cạnh tranh hoặc thay thế các tác phẩm của họ (1, 2). Thiếu ghi công và bồi thường cho việc sử dụng các sáng tạo ban đầu của họ là những nguồn khác làm trầm trọng thêm những người chỉ trích AI sáng tạo. Các vụ kiện bản quyền hiện đang được tiến hành ở Hoa Kỳ có ý nghĩa quan trọng đối với tương lai của các hệ thống AI sáng tạo. Nếu các nguyên đơn thắng thế, các hệ thống AI tổng quát duy nhất có thể hợp pháp ở Hoa Kỳ sẽ là những hệ thống được đào tạo trên các tác phẩm thuộc phạm vi công cộng hoặc theo giấy phép, điều này sẽ ảnh hưởng đến tất cả những người triển khai AI tổng quát, tích hợp nó vào các sản phẩm của họ và sử dụng nó cho mục đích khoa học. nghiên cứu.
Xung đột giữa những người tạo ra các tác phẩm có bản quyền và các nhà phát triển công nghệ cho phép sử dụng những sáng tạo đó theo những cách sáng tạo và bất ngờ không có gì mới. Vào đầu thế kỷ 20, công nghệ đột phá thời đó là đàn piano chơi. Chủ sở hữu bản quyền âm nhạc đã kiện các nhà sản xuất cuộn piano, cho rằng các cuộn sáng tác âm nhạc của họ là vi phạm. Các công nghệ phá vỡ bản quyền sau đó bao gồm truyền hình cáp, máy photocopy, máy ghi băng video và máy nghe nhạc MP3, mỗi công nghệ này (ngoại trừ máy photocopy) đều gây ra những thách thức trong ngành bản quyền (tất cả đều thất bại trước tòa, mặc dù Quốc hội đôi khi sau đó đã mở rộng các biện pháp bảo vệ sau sự kiện kiện tụng thất bại).
Khi các công nghệ mới đặt ra những câu hỏi mới về bản quyền mà Quốc hội không lường trước được, các tòa án thường xem xét kết quả nào phù hợp nhất với các mục đích hiến định về bản quyền. Hiến pháp trao cho Quốc hội quyền “thúc đẩy sự tiến bộ của Khoa học và Nghệ thuật hữu ích”, nghĩa là thúc đẩy việc tạo ra và phổ biến tri thức vì lợi ích chung. Điều này đòi hỏi phải cân bằng lợi ích hợp pháp của chủ sở hữu bản quyền để ngăn chặn việc chiếm đoạt tác phẩm của họ làm suy yếu động cơ sáng tạo với lợi ích hợp pháp của các nhà phát triển công nghệ đổi mới và những người sáng tạo tiếp theo, những người cần một không gian thở để họ cũng có thể đổi mới.
Điều gì làm cho AI sáng tạo trở nên đột phá hơn các công nghệ trước đây? Một yếu tố chắc chắn là tốc độ đặc biệt nhanh chóng mà các công nghệ AI thế hệ mới đã được tung ra, áp dụng và điều chỉnh. Ngược lại, sự phát triển trong các lĩnh vực luật pháp và chính sách lại chậm hơn nhiều. Hơn nữa, không dễ để đánh giá cách hiệu chỉnh sự cân bằng giữa các lợi ích bản quyền cạnh tranh trong giai đoạn đầu của quá trình phát triển công nghệ mới. AI sáng tạo dường như sẵn sàng có tác động đáng kể đến sự nghiệp của các nhà văn và nghệ sĩ chuyên nghiệp. Ví dụ, trong cuộc đình công của Hiệp hội Nhà văn Hoa Kỳ năm 2023, việc sử dụng AI tổng quát là một trọng tâm của các cuộc đàm phán. Có thể hiểu được rằng các nhà biên kịch lo lắng rằng những công nghệ này sẽ thay thế họ hoặc làm giảm đi sự đền bù của họ.
Ổn định AI đang bảo vệ hai vụ kiện vi phạm bản quyền ở Hoa Kỳ tập trung vào Khuếch tán ổn định, một trình tạo hình ảnh được sử dụng rộng rãi. Getty Images là nguyên đơn trong một trong những vụ kiện này. Trường hợp còn lại là một vụ kiện tập thể thay mặt cho các nghệ sĩ thị giác có những hình ảnh mà Stable Diffusion đã được đào tạo. Cả hai khiếu nại đều khẳng định rằng Stability AI đã tạo các bản sao bất hợp pháp hình ảnh của nguyên đơn khi nhập chúng làm đầu vào để đào tạo mô hình của Stable Diffusion và các hình ảnh đầu ra do Stable Diffusion tạo ra để đáp ứng lời nhắc của người dùng là sản phẩm phái sinh vi phạm.
Một vụ kiện AI thế hệ thứ ba (Doe v. Github, Inc.) thách thức sự phát triển Codex của OpenAI, một mô hình ngôn ngữ lớn (LLM) được đào tạo dựa trên hàng tỷ dòng mã phần mềm nguồn mở. Một thách thức nữa là sự hợp tác phát triển Copilot của GitHub và OpenAI, một công cụ trợ lý mã hóa dựa trên Codex LLM để đề xuất các dòng mã cho các chức năng cụ thể theo lời nhắc của người dùng. (Microsoft, công ty sở hữu GitHub và đã đầu tư rất nhiều vào OpenAI, cũng là một bị cáo.)
Các phán quyết có lợi cho nguyên đơn có thể kích hoạt “sự chênh lệch đổi mới”, khiến các nhà phát triển hệ thống AI sáng tạo chuyển cơ sở hoạt động của họ sang các quốc gia coi việc nhập các tác phẩm có bản quyền làm dữ liệu đào tạo là sử dụng hợp lý, giống như Bộ Tư pháp của Israel đã làm vào đầu năm 2023. Các quốc gia khác muốn thu hút sự đổi mới của AI có thể làm theo. Nếu các tòa án ủng hộ các yêu cầu của nguyên đơn về Ổn định AI, GPT4 của OpenAI và BARD của Google cũng có thể gặp nguy hiểm. Các nhà phát triển của họ sẽ là mục tiêu rất hấp dẫn của các vụ kiện tiếp theo.
Nhập dữ liệu đào tạo
Ổn định AI vẫn chưa nói rõ biện pháp bảo vệ chính của mình trước các khoản phí bản quyền. Trong phạm vi các khiếu nại cáo buộc rằng Khuếch tán ổn định chứa các bản sao của hình ảnh có bản quyền được sử dụng làm dữ liệu đào tạo, các khiếu nại đó là không chính xác về mặt thực tế và kỹ thuật. Khuếch tán ổn định chứa một số lượng cực lớn các tham số biểu thị bằng toán học các khái niệm được thể hiện trong dữ liệu huấn luyện, nhưng các hình ảnh như vậy không được thể hiện trong mô hình của nó.
Đào tạo một mô hình bắt đầu bằng cách mã hóa nội dung của các tác phẩm được nhập dưới dạng dữ liệu đào tạo thành các phần tử thành phần. Mô hình sử dụng các mã thông báo này để phân biệt các mối tương quan thống kê—thường ở quy mô lớn đáng kinh ngạc—giữa các tính năng của nội dung mà mô hình đang được đào tạo. Về bản chất, mô hình đang trích xuất và phân tích các sự kiện chính xác về và mối tương quan giữa các yếu tố rời rạc của tác phẩm để xác định xem các yếu tố rời rạc nào khác tuân theo hoặc không tuân theo hoặc gần với các yếu tố này và tần suất mà các mối tương quan đó thực hiện hoặc thực hiện. không tồn tại trong các bối cảnh khác nhau.
Các khiếu nại chống lại AI ổn định bỏ qua bản chất có chủ ý xốp của bản quyền. Những gì luật bản quyền bảo vệ chỉ là cách thể hiện ban đầu mà các tác giả đóng góp (chẳng hạn như chuỗi từ trong một bài thơ hoặc giai điệu của âm nhạc). Phạm vi của bản quyền không bao giờ mở rộng đến bất kỳ ý tưởng, sự kiện hoặc phương pháp nào được thể hiện trong các tác phẩm cũng như các yếu tố phổ biến trong các tác phẩm thuộc loại đó (theo học thuyết “scenes a faire” của bản quyền), các yếu tố có thể được thể hiện theo rất ít cách (theo “sự hợp nhất” học thuyết), hoặc các chủ đề cơ bản được mô tả trong các tác phẩm được bảo vệ. Chẳng hạn, ảnh chụp mèo không trao cho nhiếp ảnh gia độc quyền đối với các đặc điểm đặc trưng của mèo, chẳng hạn như mũi hoặc nét mặt của chúng. Phạm vi của bản quyền cũng không mở rộng đến những suy luận mà người đọc có thể rút ra từ việc xem xét tác phẩm của tác giả, chẳng hạn như hiểu biết sâu sắc về các mẫu kết nối giữa các khái niệm hoặc cách thức các tác phẩm thuộc loại đó được xây dựng.
Ngoài ra, AI ổn định không chuẩn bị tập dữ liệu để đào tạo mô hình Khuếch tán ổn định. Điều này được thực hiện bởi một tổ chức nghiên cứu phi lợi nhuận của Đức có tên là LAION (Mạng mở trí tuệ nhân tạo quy mô lớn). LAION ban đầu đã phát triển LAION-5B, một bộ dữ liệu bao gồm 5,85 tỷ siêu liên kết ghép các hình ảnh và mô tả văn bản từ Internet mở. LAION cung cấp bộ dữ liệu này miễn phí cho công chúng để sử dụng làm dữ liệu huấn luyện cho những người muốn sử dụng nó để xây dựng các mô hình tổng quát. LAION cũng đã phát triển một tập hợp con của LAION-5B, được gọi là LAION- Aesthetics, bao gồm các siêu liên kết đến 600 triệu hình ảnh do một số người thử nghiệm là con người lựa chọn để thu hút thị giác và bằng phân tích học máy về xếp hạng thẩm mỹ của con người. Mô hình khuếch tán ổn định đã được đào tạo trên bộ dữ liệu LAION-Aesthetics.
Việc LAION tạo ra bộ dữ liệu này rất có thể là hợp pháp vì Liên minh Châu Âu (EU) đã áp dụng quy định miễn trừ cho phép các tổ chức nghiên cứu phi lợi nhuận tạo bản sao của các tác phẩm không có bản quyền cho mục đích khai thác văn bản và dữ liệu (TDM). EU đã tạo ra ngoại lệ này để công nhận giá trị xã hội của TDM như một phương tiện mà các nhà nghiên cứu có thể tạo ra kiến thức mới. Miễn trừ này không thể bị ghi đè bởi hợp đồng. (Quyền miễn trừ thứ hai của EU cho phép các chủ thể thương mại tham gia vào TDM, mặc dù chủ sở hữu bản quyền có thể chọn không tham gia miễn trừ này, như một số người đã làm.)
Trí tuệ nhân tạo ổn định giúp khuếch tán ổn định có sẵn trên cơ sở mã nguồn mở. Tuy nhiên, nó cũng cung cấp dịch vụ đăng ký để những người thiếu tài nguyên hoặc không muốn lưu trữ phiên bản nguồn mở có thể truy cập vào Khuếch tán ổn định để tạo hình ảnh theo lời nhắc bằng văn bản. Tuy nhiên, trong chừng mực việc nhập các hình ảnh có bản quyền để đào tạo một mô hình tổng quát yêu cầu tạo ít nhất các bản sao tạm thời hoặc ngẫu nhiên của chúng, Stability AI có thể lập luận rằng đây là cách sử dụng hợp lý theo luật bản quyền của Hoa Kỳ.
Sử dụng hợp pháp
Theo luật Hoa Kỳ, việc sử dụng hợp lý các tác phẩm có bản quyền không vi phạm bản quyền. Các tòa án xem xét bốn yếu tố khi đánh giá các biện pháp bảo vệ sử dụng hợp lý: (i) mục đích của việc sử dụng bị thách thức, (ii) bản chất của các tác phẩm có bản quyền, (iii) số lượng và tính thực chất của việc sử dụng và (iv) tác động của việc bị thách thức sử dụng trên thị trường hoặc giá trị của tác phẩm có bản quyền. Các yếu tố mục đích và tác động thị trường nói chung là những yếu tố quyết định quan trọng nhất trong các trường hợp sử dụng hợp lý, nhưng cả bốn yếu tố này phải được cân nhắc cùng nhau trong một phân tích tổng thể.
Nghiên cứu, học thuật và giảng dạy là một trong những mục đích sử dụng hợp lý được ưu tiên, cũng như phê bình, bình luận và đưa tin. Sử dụng phi thương mại thường được ưa chuộng hơn sử dụng thương mại. Kể từ năm 1994, khi Tòa án Tối cao xem xét tính công bằng của đoạn rap nhại lại một bài hát nổi tiếng của Roy Orbison trong vụ Campbell kiện Acuff-Rose Music, Inc. .” Tòa án đã định nghĩa thuật ngữ này là cách sử dụng mà “thêm [] một cái gì đó mới, với mục đích xa hơn hoặc đặc điểm khác, thay đổi mục đích đầu tiên bằng cách diễn đạt, ý nghĩa hoặc thông điệp mới” [(3), tr. 579]. Việc sử dụng biến đổi cũng ít có khả năng gây hại cho thị trường đối với tác phẩm đầu tiên hơn so với việc sử dụng không biến đổi. Chẳng hạn, mọi người sẽ không mua bản nhại của 2 Live Crew nếu họ muốn nghe bản trình diễn của Roy Orbison.
Các nguyên đơn của Stability AI có thể sẽ lập luận rằng việc nhập các tác phẩm của họ dưới dạng dữ liệu đào tạo là không biến đổi và mang tính thương mại. Cả hai cân nhắc, nếu được chấp nhận, sẽ chống lại việc sử dụng hợp pháp. Tuy nhiên, một số phán quyết của tòa án đã phán quyết rằng việc sử dụng kỹ thuật số tương tự các tác phẩm có bản quyền đủ điều kiện là sử dụng hợp lý mang tính chuyển hóa.
Ví dụ: trong vụ Authors Guild kiện Google, Inc., một tòa án đã phán quyết rằng việc Google số hóa hàng triệu cuốn sách từ các bộ sưu tập thư viện nghiên cứu để lập chỉ mục nội dung của chúng và phân phát một vài đoạn nội dung sách để đáp ứng các truy vấn tìm kiếm của người dùng là một “hành động có tính biến đổi cao”. ” sử dụng hợp lý. Mặc dù mục đích của Google là thương mại, nhưng nó rất khác với mục đích mà sách được bán trên thị trường. Việc sử dụng Google đã tạo điều kiện cho công chúng tiếp cận kiến thức nhiều hơn cũng như cho phép nghiên cứu TDM và tạo ra các công cụ nghiên cứu mới. Trong vụ Field kiện Google, Inc., một tòa án đã phát hiện ra rằng việc Google sao chép nội dung từ trang web của Field vào bộ nhớ cache là một hình thức sử dụng hợp lý mang tính chuyển đổi.
Yếu tố bản chất công việc thường ít quan trọng trong các trường hợp sử dụng hợp lý. Các nguyên đơn của Ổn định AI có thể lập luận rằng vì các tác phẩm nghệ thuật thị giác nằm ở cốt lõi của bản quyền, nên việc sử dụng hợp pháp đối với những tác phẩm này nên ít hơn so với sách thư viện cũ có vấn đề trong vụ Hiệp hội tác giả. Một cân nhắc đối kháng là các nghệ sĩ thị giác có tác phẩm được đào tạo về Khuếch tán ổn định đã cung cấp các tác phẩm của họ trên internet mở, cũng như trường hợp của Field trong Google, Inc.
Mục đích chuyển đổi có xu hướng tác động lan tỏa đến các yếu tố sử dụng hợp lý khác, đặc biệt là yếu tố số lượng. Như trong vụ Authors Guild, các nguyên đơn của Stability AI có thể nhấn mạnh rằng bị đơn đã tạo ra các bản sao chính xác của toàn bộ hàng triệu tác phẩm mà không được phép hoặc bồi thường. Tuy nhiên, các tòa án thường hỏi liệu việc sao chép như vậy có cần thiết để đạt được mục đích biến đổi hay không. Trong trường hợp của Hiệp hội tác giả, tòa án đã nhận ra rằng Google không thể lập chỉ mục nội dung sách và cung cấp các đoạn trích để phản hồi các truy vấn tìm kiếm trừ khi nó sao chép nội dung của sách. AI ổn định có thể sẽ đưa ra một lập luận cần thiết tương tự về việc sử dụng hình ảnh trong dữ liệu huấn luyện.
Tác động thị trường của việc sử dụng bị thách thức đôi khi được cho là yếu tố sử dụng hợp lý quan trọng nhất. Khiếu nại của Getty chống lại Stablity AI nhấn mạnh rằng nó đã thiết lập một thị trường cấp phép để sử dụng các bức ảnh cao cấp của mình làm dữ liệu đào tạo cho AI tổng quát. Điều đó củng cố lập luận của Getty rằng việc Stability AI chiếm đoạt 12 triệu hình ảnh từ các trang web của Getty đã gây hại cho thị trường cấp phép. Khiếu nại tập thể chống lại AI ổn định yếu hơn vì AI ổn định không thể nhận được giấy phép từ lớp nghệ sĩ thị giác có tác phẩm được sử dụng để xây dựng mô hình Khuếch tán ổn định.
Tuy nhiên, sự tồn tại của một thị trường cấp phép (hoặc ý định thiết lập một thị trường) không phải là sự cân nhắc mà bản thân nó có thể giải quyết tranh chấp trong các trường hợp sử dụng hợp lý mang tính chuyển đổi. Trong quyết định năm 2021 của Google LLC kiện Oracle America, Inc., Tòa án Tối cao đã bác bỏ lập luận của Oracle rằng việc Google sử dụng các phần của giao diện lập trình ứng dụng Java (API) đã tước đi doanh thu từ giấy phép của Oracle mà hãng này đã tuyên bố được hưởng. Tòa án tuyên bố rằng các tòa án nên xem xét lợi ích công cộng của việc sử dụng bị thách thức cũng như doanh thu bị mất tiềm năng và mức độ sáng tạo mà việc sử dụng bị thách thức đã kích hoạt và cân bằng điều này với những tổn thất tiềm ẩn.
Việc xem xét này rất phù hợp trong trường hợp của Oracle. Nền tảng điện thoại thông minh Android của Google, trong đó Java API được sử dụng, không chỉ là một sản phẩm phần mềm mới có tính sáng tạo cao mà còn cho phép hàng triệu lập trình viên sử dụng sự quen thuộc của họ với API Java để tạo ra hàng triệu chương trình. Tòa án cho rằng việc sử dụng này phù hợp với mục tiêu hiến định của bản quyền để thúc đẩy tiến bộ sáng tạo. Công chúng được hưởng lợi rất nhiều từ sự tồn tại của Android và sự sẵn có của một số lượng lớn ứng dụng chạy trên nền tảng đó.
AI ổn định gần như chắc chắn sẽ đưa ra các tuyên bố về tác động sáng tạo và lợi ích công cộng trong quyết định của Oracle và chỉ ra sự sáng tạo đặc biệt thể hiện trong Khuếch tán ổn định cũng như hàng trăm triệu cách sử dụng sáng tạo của hệ thống AI tổng hợp này, bao gồm cả những cách sử dụng của các nghệ sĩ đồ họa những người sử dụng nó để tạo ra ý tưởng hoặc tinh chỉnh sáng tạo.
Các nguyên đơn của Stability AI có thể sẽ phản bác lập luận này bằng phán quyết năm 2023 của Tòa án Tối cao trong vụ Andy Warhol Foundation for the Visual Arts, Inc. kiện Goldsmith, phán quyết này phần nào thu hẹp quan niệm về các mục đích biến đổi. Nó không còn đủ cho các tác phẩm thách thức để có một ý nghĩa hoặc thông điệp mới. Điều quan trọng hơn bây giờ là liệu việc sử dụng bị thách thức có mục đích khác với tác phẩm đầu tiên hay không và mức độ sử dụng mang tính thương mại. AI ổn định sẽ lập luận rằng việc nhập các tài liệu có bản quyền làm dữ liệu đào tạo có mục đích rất khác so với các tác phẩm được xuất bản lần đầu.
Điều có thể vượt qua quy mô chống lại sự bảo vệ sử dụng hợp lý của Stability AI là liệu các hình ảnh do Stable Diffusion tạo ra có vi phạm quyền tác phẩm phái sinh của các tác giả của các hình ảnh mà LLM của nó được đào tạo hay không. Một tiền lệ có liên quan là Sega Enterprises Ltd. v. Accolade, Inc., trong đó một tòa phúc thẩm đã quyết định rằng Accolade đã sử dụng hợp pháp phần mềm Sega khi tạo các bản sao được thiết kế ngược cho mục đích hợp pháp là trích xuất thông tin về cách làm cho trò chơi điện tử của họ tương thích với nền tảng Sega. Nếu Accolade được thiết kế ngược lại cho một mục đích bất hợp pháp, chẳng hạn như để chiếm đoạt cách diễn đạt từ các trò chơi Sega, thì khả năng bảo vệ sử dụng hợp lý của nó sẽ bị ảnh hưởng. Các trò chơi của Accolade đã cạnh tranh với các trò chơi của Sega, nhưng tòa án cho rằng đây là kiểu cạnh tranh giữa các tác phẩm không vi phạm bản quyền mà lẽ ra phải khuyến khích.
Kết quả là Vi phạm
Khiếu nại tập thể chống lại Stability AI khẳng định rằng tất cả hình ảnh do Stable Diffusion tạo ra đều là tác phẩm phái sinh vi phạm vì tất cả đều được lấy từ hình ảnh mà mô hình của nó đã đào tạo. Nó mô tả Stable Diffusion như một “công cụ ghép ảnh” mà kết quả đầu ra của nó cạnh tranh với tác phẩm của chính các nghệ sĩ và do đó gây hại cho thị trường của họ. Ngoài ra, người dùng của Khuếch tán ổn định có thể gửi lời nhắc yêu cầu tạo hình ảnh của một chủ đề cụ thể “theo phong cách” của một nghệ sĩ có tên cụ thể.
Tuy nhiên, các tòa án từ lâu đã cho rằng để vi phạm quyền đối với tác phẩm phái sinh của bản quyền, việc chứng minh rằng tác phẩm thứ hai “dựa trên” một tác phẩm trước đó hoặc một số yếu tố của tác phẩm đó là chưa đủ. Tác phẩm thứ hai phải chiếm đoạt một lượng đáng kể biểu hiện ban đầu của tác phẩm đầu tiên. Vì vậy, trừ khi một tòa án quyết định hủy bỏ các tiền lệ hàng thập kỷ diễn giải quyền tác phẩm phái sinh và mở rộng nó một cách đáng kể, nếu không khiếu nại vi phạm đầu ra của vụ kiện tập thể có khả năng thất bại.
Khiếu nại về vụ kiện tập thể thừa nhận rằng “nói chung, không có hình ảnh đầu ra Khuếch tán ổn định nào được cung cấp để phản hồi một Lời nhắc văn bản cụ thể có khả năng khớp với bất kỳ hình ảnh cụ thể nào trong dữ liệu huấn luyện” [(4), P. 23]. Ngay cả các xác nhận quyền sở hữu "theo phong cách" cũng có vẻ yếu vì luật bản quyền không bảo vệ các phong cách như vậy. Hành vi vi phạm chỉ có thể được tìm thấy nếu có sự tương đồng chặt chẽ giữa các yếu tố biểu cảm của một tác phẩm tương tự về mặt phong cách và cách biểu đạt nguyên bản trong các tác phẩm cụ thể của nghệ sĩ đó.
Lý do khiến các đầu ra Khuếch tán ổn định rất khó có khả năng tương tự đáng kể với các hình ảnh cụ thể mà mô hình của nó được đào tạo là do cách Khuếch tán ổn định lắp ráp chúng. Xây dựng mô hình cho AI tạo hình ảnh yêu cầu xử lý lượng dữ liệu đầu vào khổng lồ để tạo ra các biểu diễn trừu tượng của các thành phần hình ảnh (chẳng hạn như mèo chơi với quả bóng trên sàn vải sơn). Khuếch tán thêm nhiễu vào các phần tử hình ảnh khi mã hóa chúng. Việc ghép nối các mô tả bằng văn bản và hình ảnh cho phép mô hình nhóm các biểu tượng trừu tượng sao cho các biểu tượng tương tự sẽ ở gần nhau (biểu tượng của mèo ở gần biểu tượng mèo khác). Khi người dùng nhập lời nhắc hướng dẫn phần mềm tạo một loại đầu ra cụ thể, hệ thống AI tổng quát sẽ sử dụng các phép tính thống kê phức tạp để tập hợp một đầu ra mà hệ thống dự đoán sẽ khớp với những gì người dùng yêu cầu.
Tuy nhiên, các đầu ra AI tổng quát có thể vi phạm bản quyền. Nếu cùng một hình ảnh đầu vào (ví dụ, của chuột Mickey) xuất hiện trong nhiều tác phẩm mà mô hình đã được đào tạo và nhà phát triển của nó không tuân theo các phương pháp hay nhất trong ngành bằng cách loại bỏ các bản sao và sử dụng bộ lọc đầu ra để ngăn vi phạm, thì lời nhắc của người dùng có thể dẫn đến các đầu ra vi phạm (mặc dù người dùng này, không phải nhà phát triển hệ thống AI chung, có thể là người vi phạm). Trớ trêu thay, tập dữ liệu mà một mô hình tổng quát được đào tạo càng lớn và càng đa dạng thì các kết quả đầu ra vi phạm càng ít có khả năng xảy ra.
Khiếu nại của Getty đối với Stability AI khiêm tốn hơn trong các khiếu nại đầu ra vi phạm. Tuy nhiên, Getty cũng có thể thấy khó chứng minh rằng các đầu ra Khuếch tán ổn định cụ thể về cơ bản giống với các bức ảnh cụ thể mà nó sở hữu bản quyền. Nói chung, đầu ra Khuếch tán ổn định sẽ khác biệt rõ rệt so với hình ảnh mà mô hình được huấn luyện trên đó.
Các nguyên đơn của Stability AI có thể sẽ nhấn mạnh rằng hình ảnh do Stable Diffusion tạo ra cạnh tranh với các tác phẩm của họ trên thị trường. Họ có thể chỉ ra quyết định Thợ kim hoàn của Tòa án tối cao, trong đó coi việc sử dụng cạnh tranh là cân nhắc chống lại sự công bằng. Tuy nhiên, Goldsmith liên quan đến hai tác phẩm về cơ bản giống nhau về cách thể hiện - ảnh của Goldsmith về Hoàng tử và bản in của Warhol bắt nguồn từ ảnh của Goldsmith - đã cạnh tranh trong cùng một thị trường cấp phép cho các tạp chí. AI ổn định sẽ dựa vào sự khác biệt trong kết quả đầu ra của Stable Diffusion so với các tác phẩm của nguyên đơn để phân biệt bối cảnh vụ kiện của họ với bối cảnh của Goldsmith.
Suy nghĩ kết luận
Dựa trên các tiền lệ hiện có và sự hiểu biết về cách Stable Diffusion được đào tạo và cách nó tạo ra hình ảnh để đáp ứng với lời nhắc, Stability AI dường như có cơ hội hợp lý để thắng các khiếu nại bản quyền. (Cả Getty và các khiếu nại vụ kiện tập thể đều đưa ra các khiếu nại khác không thể giải quyết trong bài viết ngắn này.) Tuy nhiên, các vụ kiện đang ở giai đoạn rất sớm và có thể mất nhiều năm trước khi tòa án đưa ra quyết định.
Vào giữa tháng 5 năm 2023, Quốc hội đã tổ chức phiên điều trần đầu tiên về các vấn đề bản quyền và AI tổng quát, trong đó các nhân chứng bày tỏ quan điểm khác nhau. Văn phòng Bản quyền Hoa Kỳ nhận thức rõ về sự kinh hoàng mà AI sáng tạo đã gây ra trong các cộng đồng phụ thuộc vào bản quyền. Văn phòng đã tổ chức “các phiên lắng nghe” vào mùa xuân năm 2023 để tạo cơ hội cho các bên liên quan giải thích quan điểm của họ về hai câu hỏi chính được đặt ra trong các trường hợp AI về tính ổn định: Việc sử dụng các tác phẩm có bản quyền làm dữ liệu đào tạo cho các hệ thống AI tổng quát có phải là hành vi vi phạm bản quyền hay không ? Đầu ra của các hệ thống AI tổng quát có vi phạm các tác phẩm phái sinh không?
Trong mùa hè năm 2023, Văn phòng có kế hoạch cho phép các bên quan tâm gửi bình luận bằng văn bản bày tỏ quan điểm và phân tích của họ về những vấn đề này và các câu hỏi liên quan. Văn phòng dự định viết một báo cáo đưa ra các kết luận của mình, trong đó có thể bao gồm các khuyến nghị lập pháp. Các nhà khoa học quan tâm đến tương lai của AI nhân tạo sẽ được khuyên nên gửi bình luận.
Tham khảo bài viết gốc tại đây: