Chi phí phần cứng của DeepSeek có thể lên tới 500 triệu USD

Sasha
Sasha
Phản hồi: 0

Sasha

Writer
DeepSeek của Trung Quốc đã trở thành chủ đề lớn nhất trong lĩnh vực công nghệ tuần này. Nhiều người trong ngành và giới tài chính tập trung vào một con số duy nhất: 6 triệu USD.

1738465692708.png

Trong bài báo của DeepSeek về mô hình trí tuệ nhân tạo mới nhất của mình, công ty này cho biết tổng chi phí đào tạo của họ lên tới 5,576 triệu USD, dựa trên giá thuê các đơn vị xử lý đồ họa của Nvidia. DeepSeek đã đưa ra một cảnh báo rõ ràng, nói rằng con số này chỉ bao gồm "đào tạo chính thức" của mô hình và không bao gồm các chi phí liên quan đến "nghiên cứu trước đó và các thí nghiệm cắt bỏ về kiến trúc, thuật toán hoặc dữ liệu".

Đầu tuần, trợ lý AI của DeepSeek đã giành vị trí đáng thèm muốn cho ứng dụng miễn phí được tải xuống nhiều nhất tại Mỹ trên kho ứng dụng App Store của Apple, soán ngôi ChatGPT của OpenAI. Cổ phiếu công nghệ toàn cầu đã bán tháo, các nhà sản xuất chip Nvidia và Broadcom đã mất tổng cộng 800 tỷ đô la vốn hóa thị trường vào ngày 27/1.

Theo hãng tin CNBC, một báo cáo mới từ SemiAnalysis, công ty nghiên cứu và tư vấn về chất bán dẫn, đã cung cấp thêm bối cảnh cho chi phí của DeepSeek. Công ty ước tính rằng chi tiêu cho phần cứng của DeepSeek có thể cao hơn 500 triệu USD, đồng thời cho biết thêm rằng chi phí R&D và tổng chi phí sở hữu là đáng kể. SemiAnalysis đã viết rằng việc tạo ra "dữ liệu tổng hợp" để mô hình đào tạo sẽ đòi hỏi "lượng tính toán đáng kể".

Báo cáo cho biết Claude 3.5 Sonnet từ Anthropic mất "hàng chục triệu USD để đào tạo", nhưng lưu ý rằng Anthropic đã huy động hàng tỷ USD từ Amazon và Google, một dấu hiệu cho thấy cần thêm bao nhiêu tiền để vận hành các mô hình và công ty.

"Đó là vì họ phải thử nghiệm, đưa ra các kiến trúc mới, thu thập và làm sạch dữ liệu, trả lương cho nhân viên và nhiều thứ khác nữa", SemiAnalysis cho biết.

Bài báo của riêng DeepSeek không bao gồm ước tính về chi phí tính toán của công ty.

“Cần phải nói rõ, DeepSeek độc đáo ở chỗ họ đạt được mức chi phí và khả năng này đầu tiên”, SemiAnalysts viết. Công ty này nói thêm rằng R1 của DeepSeek “là một mô hình rất tốt” và “việc bắt kịp với lý luận nhanh như vậy là điều thực sự ấn tượng”.

Các chuyên gia và nhà phân tích tuần này đã ca ngợi chất lượng mô hình của DeepSeek và lưu ý rằng mô hình này ấn tượng như thế nào khi xét đến việc Mỹ đã hạn chế xuất khẩu chip sang Trung Quốc ba lần trong ba năm. Điều đó dẫn đến lo ngại rằng Mỹ đang tụt hậu so với đối thủ chính của mình trong một thị trường được dự đoán sẽ đạt doanh thu 1 nghìn tỷ USD trong vòng một thập kỷ.

DeepSeek được thành lập vào năm 2023 bởi Liang Wenfeng, đồng sáng lập của High-Flyer, một quỹ đầu cơ định lượng tập trung vào AI. Theo báo cáo, công ty khởi nghiệp AI này đã phát triển từ đơn vị nghiên cứu AI của quỹ đầu cơ vào tháng 4 năm 2023 để tập trung vào các mô hình ngôn ngữ lớn và đạt được trí tuệ nhân tạo tổng quát hay AGI — một nhánh của AI ngang bằng hoặc vượt trội hơn trí tuệ con người trong nhiều nhiệm vụ khác nhau và OpenAI cùng các công ty khác đang theo đuổi.

Theo các nhà phân tích tại Jefferies, DeepSeek vẫn hoàn toàn thuộc sở hữu và được tài trợ bởi High-Flyer.

Tin đồn về DeepSeek bắt đầu lan rộng vào đầu tháng này, khi công ty khởi nghiệp này phát hành R1, mô hình lý luận của họ cạnh tranh với o1 của OpenAI. Đây là mô hình mã nguồn mở, nghĩa là bất kỳ nhà phát triển AI nào cũng có thể sử dụng.

Giống như các chatbot Trung Quốc khác, DeepSeek có những hạn chế về một số chủ đề nhất định: Ví dụ, khi được hỏi về một số chính sách của nhà lãnh đạo Trung Quốc Tập Cận Bình, DeepSeek được cho là đã hướng người dùng tránh xa những câu hỏi tương tự.

Tổng giám đốc điều hành OpenAI Sam Altman đã ca ngợi mô hình này trước công chúng, nhưng công ty cũng cho biết họ tin rằng có bằng chứng cho thấy DeepSeek đã thu thập dữ liệu OpenAI không đúng cách để xây dựng sản phẩm của mình.

Tại một sự kiện ở Washington do OpenAI tổ chức vào ngày 30/1, Altman cho biết DeepSeek "rõ ràng là một mô hình tuyệt vời".

"Đây là lời nhắc nhở về mức độ cạnh tranh và nhu cầu giành chiến thắng của nền dân chủ AI", ông nói. Ông cho biết điều này cũng chỉ ra "mức độ quan tâm đến lý luận, mức độ quan tâm đến mã nguồn mở".

>> Startup AI Trung Quốc làm đảo lộn chiến lược cấm vận chip của Mỹ

>> Đây là mô hình AI của Trung Quốc đang gây sự hoảng loạn ở thung lũng Silicon

>> Hàng loạt cổ phiếu công nghệ giảm mạnh do DeepSeek gieo rắc nghi ngờ về đầu tư cho AI

>> Nvidia vừa trải qua "ngày mất mát" lớn nhất lịch sử Mỹ

#DeepSeek
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top