Google dính kiện cáo cáo buộc đánh cắp dữ liệu của hàng triệu người dùng trải nghiệm các công cụ AI của mình

Thoại Viết Hoàng
Thoại Viết Hoàng
Phản hồi: 0
Google đã gặp phải một vụ kiện trên diện rộng vào thứ Ba cáo buộc gã khổng lồ công nghệ này đã thu thập dữ liệu từ hàng triệu người dùng mà không có sự đồng ý của họ và vi phạm luật bản quyền để đào tạo và phát triển các sản phẩm trí tuệ nhân tạo của mình.

Google dính kiện cáo cáo buộc đánh cắp dữ liệu của hàng triệu người dùng trải nghiệm các công cụ AI của mình
Vụ kiện tập thể được đề xuất chống lại Google, công ty mẹ của nó là Alphabet và công ty con AI của Google là DeepMind đã được đệ trình lên tòa án liên bang ở California vào thứ Ba và do Công ty Luật Clarkson đệ trình. Công ty trước đây đã đệ đơn kiện tương tự chống lại OpenAI, nhà sản xuất ChatGPT vào tháng trước. (OpenAI trước đây đã không trả lời yêu cầu bình luận về vụ kiện.)
Khiếu nại cáo buộc rằng Google “đã bí mật đánh cắp mọi thứ từng được hàng trăm triệu người Mỹ tạo ra và chia sẻ trên internet” và sử dụng dữ liệu này để đào tạo các sản phẩm AI của mình, chẳng hạn như chatbot Bard. Đơn khiếu nại cũng tuyên bố Google đã sử dụng “gần như toàn bộ dấu ấn kỹ thuật số của chúng tôi”, bao gồm “các tác phẩm sáng tạo và viết quảng cáo” để xây dựng các sản phẩm AI của mình.
Đại diện của Google, Bảng chữ cái và DeepMind đã không trả lời ngay lập tức yêu cầu bình luận.
Khiếu nại chỉ ra một bản cập nhật gần đây cho chính sách quyền riêng tư của Google, trong đó nêu rõ rằng công ty có thể sử dụng thông tin có thể truy cập công khai để đào tạo các mô hình và công cụ AI của mình, chẳng hạn như Bard.
Trả lời một báo cáo trước đó của Verge về bản cập nhật, công ty cho biết chính sách của họ “từ lâu đã minh bạch rằng Google sử dụng thông tin có sẵn công khai từ web mở để đào tạo các mô hình ngôn ngữ cho các dịch vụ như Google Dịch. Bản cập nhật mới nhất này chỉ đơn giản là làm rõ rằng các dịch vụ mới hơn như Bard cũng được bao gồm.”
Vụ kiện diễn ra khi một loạt công cụ AI mới đã thu hút được sự chú ý lớn trong những tháng gần đây nhờ khả năng tạo ra tác phẩm và hình ảnh bằng văn bản để đáp ứng lời nhắc của người dùng. Các mô hình ngôn ngữ lớn làm nền tảng cho công nghệ mới này có thể thực hiện điều này bằng cách đào tạo trên các kho dữ liệu trực tuyến khổng lồ.
Tuy nhiên, trong quá trình này, các công ty cũng đang phải chịu sự giám sát pháp lý ngày càng chặt chẽ đối với các vấn đề bản quyền đối với các tác phẩm được đưa vào các tập dữ liệu này, cũng như việc họ sử dụng rõ ràng dữ liệu cá nhân và có thể nhạy cảm từ người dùng hàng ngày, bao gồm cả dữ liệu từ trẻ em, theo Google. kiện tụng.
“Google cần hiểu rằng ‘có sẵn công khai’ không bao giờ có nghĩa là sử dụng miễn phí cho bất kỳ mục đích nào,” Tim Giordano, một trong những luật sư tại Clarkson khởi kiện Google, nói với CNN trong một cuộc phỏng vấn. “Thông tin cá nhân và dữ liệu của chúng tôi là tài sản của chúng tôi và nó có giá trị và không ai có quyền lấy và sử dụng nó cho bất kỳ mục đích nào.”
Vụ kiện đang tìm kiếm sự cứu trợ theo lệnh dưới hình thức tạm thời đóng băng quyền truy cập thương mại và phát triển thương mại các công cụ AI tổng quát của Google như Bard. Nó cũng đang tìm kiếm những thiệt hại và khoản thanh toán không xác định dưới dạng bồi thường tài chính cho những người có dữ liệu bị cáo buộc là chiếm đoạt bởi Google. Công ty cho biết họ đã xếp hàng tám nguyên đơn, bao gồm cả một trẻ vị thành niên.
Giordano đã đối chiếu những lợi ích và tác hại bị cáo buộc về cách Google thường lập chỉ mục dữ liệu trực tuyến để hỗ trợ công cụ tìm kiếm cốt lõi của mình với những cáo buộc mới về việc Google thu thập dữ liệu để đào tạo các công cụ AI.
Anh ấy nói, với công cụ tìm kiếm của mình, Google có thể “cung cấp một liên kết được gán cho tác phẩm của bạn mà thực sự có thể thúc đẩy ai đó mua hoặc tương tác với nó.” Tuy nhiên, việc thu thập dữ liệu để đào tạo các công cụ AI đang tạo ra “một phiên bản thay thế của tác phẩm làm thay đổi hoàn toàn động cơ khuyến khích bất kỳ ai cần mua tác phẩm,” Giordano nói thêm.
Mặc dù một số người dùng internet có thể đã quen với việc dữ liệu kỹ thuật số của họ được thu thập và sử dụng cho kết quả tìm kiếm hoặc quảng cáo được nhắm mục tiêu, nhưng điều này có thể không đúng đối với đào tạo AI. “Mọi người không thể tưởng tượng được thông tin của họ sẽ được sử dụng theo cách này,” Giordano nói.
Ryan Clarkson, một đối tác tại công ty luật, cho biết Google cần “tạo cơ hội cho mọi người từ chối” sử dụng dữ liệu của họ để đào tạo AI trong khi vẫn duy trì khả năng sử dụng Internet cho nhu cầu hàng ngày của họ.
Tham khảo bài viết gốc tại đây:
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top