ByteDance phản hồi gì về cáo buộc đang bí mật sử dụng công nghệ OpenAI để phát triển mô hình ngôn ngữ lớn của riêng mình?

Đoàn Thúy Hà

Editor
Thành viên BQT
Mấy hôm nay, báo chí Mỹ rầm rộ loan tin ByteDance, công ty mẹ của Tiktok, Capcut... đang bí mật sử dụng công nghệ OpenAI để phát triển mô hình ngôn ngữ lớn của riêng mình, điều này vi phạm điều khoản dịch vụ của OpenAI. Hiện tại, tài khoản của ByteDance đã bị OpenAI đình chỉ.
Ngày 17/12, ByteDance trả lời phóng viên Times Weekly về vấn đề này như sau: Khi sử dụng các dịch vụ liên quan đến OpenAI, công ty nhấn mạnh phải tuân thủ các điều khoản sử dụng. Chúng tôi cũng đang liên hệ với OpenAI để làm rõ những hiểu lầm có thể xảy ra do các báo cáo bên ngoài gây ra.
ByteDance phản hồi gì về cáo buộc đang bí mật sử dụng công nghệ OpenAI để phát triển mô hình ngôn ngữ lớn của riêng mình?
Theo ByteDance, khi nhóm công nghệ Byte lần đầu tiên bắt đầu khám phá các mô hình lớn vào đầu năm nay, một số kỹ sư đã áp dụng dịch vụ API của GPT để nghiên cứu dự án thử nghiệm trên các mô hình nhỏ hơn. Mô hình này chỉ để thử nghiệm, chưa có kế hoạch đưa lên mạng và chưa bao giờ được sử dụng bên ngoài. Hoạt động này đã ngừng hoạt động vào tháng 4 năm nay sau khi công ty giới thiệu tính năng kiểm tra thông số lệnh gọi GPT API. Ngay từ tháng 4 năm nay, nhóm Byte Big Model đã đưa ra các yêu cầu nội bộ rõ ràng là không thêm dữ liệu do mô hình GPT tạo ra vào tập dữ liệu đào tạo Byte Big Model và đào tạo nhóm kỹ thuật tuân thủ các điều khoản dịch vụ khi sử dụng GPT. Vào tháng 9, công ty đã tiến hành một đợt kiểm tra nội bộ khác và thực hiện các biện pháp để đảm bảo hơn nữa rằng lệnh gọi API tới GPT tuân thủ các yêu cầu quy định. Ví dụ: lấy mẫu hàng loạt kiểm tra sự giống nhau giữa dữ liệu đào tạo mô hình và GPT để ngăn người chú thích dữ liệu sử dụng GPT một cách riêng tư.
Ngoài ra, ByteDance cho biết: "Trong vài ngày tới, chúng tôi sẽ tiến hành kiểm tra toàn diện một lần nữa để đảm bảo tuân thủ nghiêm ngặt các điều khoản sử dụng các dịch vụ liên quan".
Theo Ifeng, các tài liệu nội bộ của ByteDance mà truyền thông Mỹ thu được xác nhận rằng ByteDance dựa vào giao diện lập trình ứng dụng (API) của Open AI ở hầu hết mọi giai đoạn phát triển mô hình ngôn ngữ lớn có tên mã là “Dự án hạt giống” rộng rãi đến mức các nhân viên trong "Dự án hạt giống" thường đạt đến giới hạn truy cập tối đa của API OpenAI.
Báo cáo cũng đề cập: "Bytedance đang sử dụng công nghệ của OpenAI nhiều hơn trong giai đoạn đầu của "kế hoạch hạt giống". Vài tháng trước, công ty đã ra lệnh cho nhóm ngừng sử dụng văn bản do GPT tạo ra "ở bất kỳ giai đoạn phát triển mô hình nào".
Đầu năm nay, do sự xuất hiện của ChatGPT, các công ty Internet lớn bắt đầu triển khai mô hình quy mô lớn, đến giữa năm nay, mỗi công ty cơ bản đã đạt được thành công. Đánh giá theo dòng thời gian, các nút thời gian được truyền thông Mỹ mô tả tương đối gần với tình huống trong phản hồi của ByteDance rằng “hãng đã được sử dụng để nghiên cứu thử nghiệm trên các mô hình nhỏ hơn vào đầu năm và hoạt động này đã bị dừng vào tháng 4”.
Cho đến nay, nhiều công ty Internet hàng đầu Trung Quốc như Baidu, Alibaba, Tencent đã cho ra đời những mô hình lớn tự phát triển và trải qua nhiều vòng lặp. Đồng thời, sự đồng thuận trong ngành đã bước vào giai đoạn tích cực khám phá ứng dụng của các mô hình lớn. Ví dụ, chiếc xe thông minh Jiyue do Geely và Baidu cùng chế tạo được trang bị mô hình ngôn ngữ lớn "Wen Xin Yi Yan" của Baidu. Năm nay, Alibaba cũng tung ra sản phẩm chuyên về nội dung âm thanh và video, sản phẩm AI Tongyi Listen Comprehension.
Vào ngày 28 tháng 6 năm nay, Byte đã phát hành “Volcano Ark”. Tuy nhiên, "Volcano Ark" không phải là một mô hình lớn tự phát triển mà là một nền tảng dịch vụ mô hình lớn. Byte cho biết nền tảng này tích hợp các mô hình lớn từ bảy công ty công nghệ AI và viện nghiên cứu khoa học, bao gồm Zhipu AI, MiniMax và Baichuan Intelligence, và cung cấp dịch vụ cho thế giới bên ngoài. Vào thời điểm đó, ByteDance nói với phóng viên của Times Weekly rằng “mô hình lớn tự phát triển đang được khám phá và chưa có thời gian phát hành dự kiến”.
Theo phóng viên, mẫu ngôn ngữ lớn do ByteDance tự phát triển có tên mã là “Skylark”. Tin tức mới nhất là vào ngày 19 tháng 9, Volcano Engine, một công ty con của ByteDance, đã công bố tại Hội nghị thượng đỉnh công nghệ rằng nền tảng trí tuệ kỹ thuật số Volcano Engine VeDI đã ra mắt “Trợ lý AI”. Theo Luo Xuân, người phụ trách nền tảng dữ liệu của ByteDance, ông nói với giới truyền thông vào thời điểm đó rằng mô hình lớn mà trợ lý AI chủ yếu dựa vào là “Skylark” tự phát triển. Không có tin tức mới nào về ngày phát hành của "Skylark".
 


Đăng nhập một lần thảo luận tẹt ga

Gợi ý cộng đồng

Top