"Chiêu trò" tinh ranh của DeepSeek: tận dụng chính nguồn dữ liệu từ OpenAI để "thăng cấp" bản thân

A-Train The Seven
A-Train The Seven
Phản hồi: 0

A-Train The Seven

...'cause for once, I didn't hate myself.
DeepSeek R1 đã tạo nên cơn sốt trong giới AI khi ra mắt vào tuần trước. Nhà phát triển Trung Quốc DeepSeek tự hào giới thiệu đây là một mô hình suy luận mô phỏng miễn phí, có hiệu suất sánh ngang với o1 của OpenAI nhưng với chi phí đào tạo thấp hơn đáng kể. Trong khi OpenAI định giá mô hình o1 của mình ở mức 60 đô la cho mỗi triệu token đầu ra, DeepSeek niêm yết R1 chỉ với 2,19 đô la cho mỗi triệu token - một sự tương phản đáng chú ý đã khiến cổ phiếu của các công ty liên quan đến AI như Nvidia lao dốc.

Quyết định của Microsoft về việc lưu trữ R1 trên Azure thoạt nhìn không có gì quá bất thường. Gã khổng lồ công nghệ này đã cung cấp hơn 1.800 mô hình AI thông qua Azure AI Foundry, cho phép các nhà phát triển truy cập vào nhiều hệ thống AI khác nhau để thử nghiệm và tích hợp.

Microsoft không phân biệt đối xử vì họ thu lợi nhuận từ bất kỳ nền tảng AI nào hoạt động trên cơ sở hạ tầng đám mây của mình. Tuy nhiên, quyết định này dường như có phần mỉa mai vì OpenAI (một công ty mà Microsoft đã đầu tư và hợp tác) đã dành cả tuần qua để chỉ trích gay gắt mô hình này vì sao chép đầu ra của ChatGPT.

1738307254615.png


OpenAI cáo buộc startup AI này vi phạm các điều khoản dịch vụ của mình bằng cách sử dụng "distillation" (chưng cất), theo Fox News đưa tin. "Distillation" là khi các nhà phát triển đào tạo một mô hình AI bằng cách sử dụng đầu ra từ một hệ thống tiên tiến hơn. Nghi ngờ nảy sinh sau khi người dùng phát hiện ra rằng một mô hình trước đó, DeepSeek V3, đôi khi tự nhận mình là "ChatGPT", cho thấy DeepSeek đã sử dụng dữ liệu do OpenAI tạo ra để tinh chỉnh hệ thống của mình.

Động thái này cũng có vẻ hơi đạo đức giả, khi các nhà nghiên cứu bảo mật của Microsoft được cho là đã khởi động một cuộc điều tra về đạo đức đối với DeepSeek vào thứ Tư. Các nguồn tin ẩn danh tuyên bố rằng cuộc điều tra tập trung vào việc liệu DeepSeek có trích xuất một lượng đáng kể dữ liệu thông qua API của OpenAI trong mùa thu năm 2024 hay không.

Bất chấp sự thất vọng với DeepSeek, CEO của OpenAI, Sam Altman, đã công khai hoan nghênh sự cạnh tranh. Trong một bài đăng trên Twitter vào thứ Hai, Altman thừa nhận hiệu quả chi phí của R1, gọi đó là "một mô hình ấn tượng" nhưng cam đoan rằng OpenAI sẽ sớm mang lại "kết quả tốt hơn nhiều". Các nhà phân tích dự đoán công ty có thể phát hành một mô hình mới, o3-mini, sớm nhất là ngay hôm nay.

1738307279963.png


Sự phản đối mạnh mẽ của OpenAI về các hoạt động dữ liệu của DeepSeek rất đáng chú ý khi xét đến lịch sử bị cáo buộc lạm dụng dữ liệu của chính họ. Tờ New York Times đã đệ đơn kiện OpenAI và Microsoft, cáo buộc họ sử dụng báo chí có bản quyền mà không được phép. OpenAI cũng đã đạt được thỏa thuận với các nhà xuất bản và cộng đồng trực tuyến - chẳng hạn như Associated Press và những tổ chức khác - để truy cập dữ liệu do người dùng tạo ra cho việc đào tạo.

Toàn bộ tình huống này phơi bày mối quan hệ đạo đức giả của ngành công nghiệp AI với quyền sở hữu dữ liệu. Công ty đầu tư Andreessen Horowitz, một nhà đầu tư khác của OpenAI, đã lập luận trong một hồ sơ pháp lý năm 2023 rằng việc đào tạo các mô hình AI không nên được coi là vi phạm bản quyền, vì chúng chỉ đơn giản là "trích xuất thông tin" từ các tác phẩm hiện có. Nếu OpenAI thực sự tin vào nguyên tắc đó, thì DeepSeek chỉ đang chơi theo luật chơi tương tự.

Bức tranh toàn cảnh hiện tại của ngành công nghiệp AI ít nhiều là một cuộc cạnh tranh tự do. Chúng ta không có luật nào được ban hành để quản lý trực tiếp AI, và những luật ảnh hưởng đến nó một cách gián tiếp, như luật bản quyền và luật thương mại, đang bị các công ty AI bẻ cong theo hướng có lợi cho họ, những người đang vi phạm chúng.

#DeepSeek
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top