Sóng AI
Writer

Nghiên cứu do Copyleaks thực hiện đã phát hiện 74,2% văn bản của DeepSeek có phong cách tương tự với ChatGPT. Điều này làm dấy lên nghi vấn về việc DeepSeek có thể đã sử dụng outputs từ OpenAI mà không được phép.
Copyleaks đã sử dụng công nghệ phân loại thuật toán và phương pháp bình chọn nhất trí để giảm sai sót và đảm bảo độ chính xác cao trong việc xác định "dấu vân tay phong cách" của các mô hình ngôn ngữ AI. DeepSeek có sự tương đồng phong cách nổi bật với OpenAI nhưng không với các mô hình khác như Claude, Gemini hay Llama.
Shai Nisan, trưởng nhóm khoa học dữ liệu của Copyleaks, cho biết việc phát hiện này không khẳng định DeepSeek là dẫn xuất của OpenAI nhưng đặt câu hỏi về cấu trúc và quy trình phát triển của DeepSeek.
Nếu DeepSeek đã sử dụng văn bản của OpenAI để huấn luyện mô hình mà không có sự cho phép, điều này có thể vi phạm quyền sở hữu trí tuệ của OpenAI và gây ảnh hưởng tài chính lớn. Nvidia cũng đã chịu thiệt hại giá trị thị trường sau thông báo đột phá của DeepSeek hồi tháng 1.
Nghiên cứu của Copyleaks gợi ý việc cần thiết áp dụng khung pháp lý minh bạch về dữ liệu đào tạo AI, đồng thời mở ra các vấn đề liên quan đến tranh chấp quyền sở hữu trí tuệ giữa các mô hình AI.
Mặc dù có thể có lập luận rằng AI có thể hội tụ phong cách khi sử dụng cùng một nguồn dữ liệu, nhưng phương pháp của Copyleaks chỉ ra rằng sự tương đồng giữa DeepSeek và OpenAI vượt xa sự trùng lặp dữ liệu thông thường.

Nguồn: Songai.vn