Yu Ki San
Writer
Công ty khởi nghiệp AI Trung Quốc DeepSeek đang vướng vào nghi vấn "mập mờ" về chi phí phát triển các mô hình AI của mình. Theo phân tích mới đây, con số thực tế có thể cao hơn nhiều lần so với những gì công ty đã công bố.
DeepSeek, công ty khởi nghiệp AI do quỹ đầu tư High-Flyersở hữu, từng gây xôn xao dư luận khi tuyên bố chỉ tốn vỏn vẹn 5,6 triệuUSD để phát triển các mô hình AI tiên tiến, trong đó có DeepSeek R1 -được cho là có khả năng cạnh tranh với các mô hình hàng đầu thế giới.Tuy nhiên, SemiAnalysis, một công ty chuyên nghiên cứu và tư vấn thịtrường bán dẫn và AI, đã đưa ra những phân tích cho thấy con số thực tếcó thể lên tới 1,6 tỷ USD.
Theo SemiAnalysis, chi phí phần cứng của DeepSeek đã "cao hơn 500 triệu USD". Việc tạo dữ liệu tổng hợp để huấn luyện mô hình AI đòi hỏi "lượng tính toán đáng kể", kéo theo chi phí vận hành hệ thống máy chủ khổng lồ. Ước tính, tổng chi phí vốn máy chủ có thể lên tới 1,6 tỷ USD, trong đó 944 triệu USD liên quan đến vận hành.
"Con số 5,6 triệu USD mà DeepSeek công bố chỉ bao gồm chi phí đào tạo, chưa tính đến chi phí nghiên cứu, phát triển, chuẩn bị dữ liệu, bảo trì phần cứng và nhiều vấn đề khác", SemiAnalysis cho biết.
Ngoài ra, DeepSeek được cho là đã tiếp cận khoảng 10.000 GPU Nvidia H800 (phiên bản hiệu năng thấp tuân thủ lệnh cấm vận của Mỹ) và 10.000 GPU H100. Thậm chí, công ty có thể đang sử dụng cả phiên bản H20 để đào tạo mô hình. Những GPU này được chia sẻ với quỹ đầu tư High-Flyer và được sử dụng cho nhiều mục đích khác nhau như giao dịch, suy luận, đào tạo và nghiên cứu.
Mặc dù vậy, SemiAnalysis vẫn đánh giá cao những thành tựucủa DeepSeek. "DeepSeek R1 là một mô hình rất tốt, việc họ bắt kịpranh giới lý luận AI toàn cầu nhanh chóng như vậy là điều thực sự ấntượng", công ty này nhận định.
Trước những nghi vấn này, DeepSeek vẫn chưa đưa ra bất kỳ bình luận nào.
Một số chuyên gia trong lĩnh vực AI cũng từng bày tỏ sự hoài nghi về chi phí phát triển "siêu rẻ" của DeepSeek. Yann LeCun, Giám đốc AI của Meta, cho rằng có sự "hiểu lầm lớn" khi so sánh chi phí đầu tư AI của các công ty Mỹ với DeepSeek, bởi phần lớn chi phí đến từ việc vận hành hệ thống để "suy luận", chứ không phải để đào tạo.
Alexandr Wang, CEO của Scale AI, tiết lộ ông có thông tin DeepSeek đang sở hữu 50.000 chip Nvidia H100 nhưng không thể công khai do các biện pháp kiểm soát xuất khẩu của Mỹ. Elon Musk cũng đồng tình với quan điểm này.
Ngoài ra, DeepSeek còn bị nghi ngờ sử dụng kỹ thuật "chưng cất" để đạt hiệu suất tốt hơn trên các mô hình nhỏ với chi phí thấp hơn.
Vụ việc này một lần nữa cho thấy bức tranh toàn cảnh về chi phí phát triển AI còn nhiều "ẩn số" và cần được nhìn nhận một cách đa chiều.
#DeepSeek
DeepSeek, công ty khởi nghiệp AI do quỹ đầu tư High-Flyersở hữu, từng gây xôn xao dư luận khi tuyên bố chỉ tốn vỏn vẹn 5,6 triệuUSD để phát triển các mô hình AI tiên tiến, trong đó có DeepSeek R1 -được cho là có khả năng cạnh tranh với các mô hình hàng đầu thế giới.Tuy nhiên, SemiAnalysis, một công ty chuyên nghiên cứu và tư vấn thịtrường bán dẫn và AI, đã đưa ra những phân tích cho thấy con số thực tếcó thể lên tới 1,6 tỷ USD.
Theo SemiAnalysis, chi phí phần cứng của DeepSeek đã "cao hơn 500 triệu USD". Việc tạo dữ liệu tổng hợp để huấn luyện mô hình AI đòi hỏi "lượng tính toán đáng kể", kéo theo chi phí vận hành hệ thống máy chủ khổng lồ. Ước tính, tổng chi phí vốn máy chủ có thể lên tới 1,6 tỷ USD, trong đó 944 triệu USD liên quan đến vận hành.
"Con số 5,6 triệu USD mà DeepSeek công bố chỉ bao gồm chi phí đào tạo, chưa tính đến chi phí nghiên cứu, phát triển, chuẩn bị dữ liệu, bảo trì phần cứng và nhiều vấn đề khác", SemiAnalysis cho biết.
Ngoài ra, DeepSeek được cho là đã tiếp cận khoảng 10.000 GPU Nvidia H800 (phiên bản hiệu năng thấp tuân thủ lệnh cấm vận của Mỹ) và 10.000 GPU H100. Thậm chí, công ty có thể đang sử dụng cả phiên bản H20 để đào tạo mô hình. Những GPU này được chia sẻ với quỹ đầu tư High-Flyer và được sử dụng cho nhiều mục đích khác nhau như giao dịch, suy luận, đào tạo và nghiên cứu.
Mặc dù vậy, SemiAnalysis vẫn đánh giá cao những thành tựucủa DeepSeek. "DeepSeek R1 là một mô hình rất tốt, việc họ bắt kịpranh giới lý luận AI toàn cầu nhanh chóng như vậy là điều thực sự ấntượng", công ty này nhận định.
Trước những nghi vấn này, DeepSeek vẫn chưa đưa ra bất kỳ bình luận nào.
Một số chuyên gia trong lĩnh vực AI cũng từng bày tỏ sự hoài nghi về chi phí phát triển "siêu rẻ" của DeepSeek. Yann LeCun, Giám đốc AI của Meta, cho rằng có sự "hiểu lầm lớn" khi so sánh chi phí đầu tư AI của các công ty Mỹ với DeepSeek, bởi phần lớn chi phí đến từ việc vận hành hệ thống để "suy luận", chứ không phải để đào tạo.
Alexandr Wang, CEO của Scale AI, tiết lộ ông có thông tin DeepSeek đang sở hữu 50.000 chip Nvidia H100 nhưng không thể công khai do các biện pháp kiểm soát xuất khẩu của Mỹ. Elon Musk cũng đồng tình với quan điểm này.
Ngoài ra, DeepSeek còn bị nghi ngờ sử dụng kỹ thuật "chưng cất" để đạt hiệu suất tốt hơn trên các mô hình nhỏ với chi phí thấp hơn.
Vụ việc này một lần nữa cho thấy bức tranh toàn cảnh về chi phí phát triển AI còn nhiều "ẩn số" và cần được nhìn nhận một cách đa chiều.
#DeepSeek