Sự thật đằng sau những con số ảo về chi phí phát triển của DeepSeek

Huyền Trang
Huyền Trang
Phản hồi: 0
DeepSeek một công ty khởi nghiệp trong lĩnh vực trí tuệ nhân tạo (AI), đã nhanh chóng thu hút sự chú ý của giới công nghệ và Phố Wall với tuyên bố chi phí phát triển mô hình AI chỉ chưa đến 6 triệu USD. Tuy nhiên, một báo cáo mới đây từ công ty nghiên cứu và tư vấn về chất bán dẫn SemiAnalysis đã đặt ra nghi vấn lớn về tính chính xác của con số này, cho thấy chi phí thực tế có thể cao hơn rất nhiều.
1738587339873.png

Theo DeepSeek, chi phí đào tạo mô hình AI của họ lên tới 5,576 triệu USD, chủ yếu là chi phí thuê các đơn vị xử lý đồ họa (GPU) của Nvidia. Tuy nhiên, công ty cũng thừa nhận con số này chỉ phản ánh đào tạo chính thức và không bao gồm các chi phí liên quan đến nghiên cứu, thử nghiệm kiến trúc, thuật toán và dữ liệu. Tuyên bố này đã gây chấn động thị trường, khiến cổ phiếu các công ty công nghệ toàn cầu giảm mạnh bốc hơi 1.000 tỷ USD chỉ trong một ngày.
SemiAnalysis cho rằng việc tạo ra dữ liệu tổng hợp cho mô hình đào tạo đòi hỏi lượng tính toán đáng kể, cùng với các chi phí khác như thử nghiệm, phát triển kiến trúc mới, thu thập và làm sạch dữ liệu, cũng như trả lương cho nhân viên. Theo ước tính của SemiAnalysis, DeepSeek có thể đã vận hành một hệ thống điện toán quy mô lớn gồm khoảng 50.000 GPU Hopper, bao gồm 10.000 GPU H800, 10.000 GPU H100 mạnh hơn và các GPU H20 bổ sung. Con số này trái ngược hoàn toàn với tuyên bố trước đó của DeepSeek chỉ sử dụng 2.048 GPU Nvidia. SemiAnalysis ước tính tổng chi phí vốn cho máy chủ lên tới 1,6 tỷ USD và chi phí hoạt động khoảng 944 triệu USD.
DeepSeek được thành lập vào năm 2023 bởi Lương Văn Phong, đồng sáng lập của High-Flyer, một quỹ đầu cơ tập trung vào AI tại Trung Quốc. Công ty đã phát triển từ đơn vị nghiên cứu AI của quỹ, với mục tiêu phát triển các mô hình ngôn ngữ lớn và đạt được trí tuệ nhân tạo tổng quát (AGI). DeepSeek nhận được sự quan tâm lớn khi phát hành R1, một mô hình lý luận cạnh tranh với o1 của OpenAI, nhưng được cung cấp dưới dạng mã nguồn mở, cho phép các nhà phát triển AI sử dụng.
#DeepSeek
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top