Sóng AI
Writer

- Đầu năm 2025, phòng thí nghiệm AI Trung Quốc DeepSeek đã công bố mô hình mới gây chấn động ngành AI, khiến cổ phiếu Nvidia giảm 17% cùng với các cổ phiếu liên quan đến nhu cầu trung tâm dữ liệu AI.
- Phản ứng thị trường này được cho là xuất phát từ khả năng của DeepSeek trong việc cung cấp mô hình hiệu suất cao với chi phí thấp hơn nhiều so với đối thủ tại Mỹ, làm dấy lên cuộc thảo luận về tác động đối với trung tâm dữ liệu AI.
- Sự khan hiếm dữ liệu đào tạo bổ sung đang làm chậm quá trình cải thiện trong tiền đào tạo, vì các phòng thí nghiệm AI lớn đã đào tạo mô hình của họ trên phần lớn dữ liệu công khai có sẵn trên internet.
- Nhà cung cấp mô hình đang chuyển sang "test-time compute" (TTC) - nơi mô hình suy luận "suy nghĩ" trước khi phản hồi câu hỏi tại thời điểm suy luận, như phương pháp thay thế để cải thiện hiệu suất mô hình tổng thể.
- TTC có thể thể hiện cải tiến theo quy luật mở rộng tương tự như những gì từng thúc đẩy tiền đào tạo, tiềm năng cho phép làn sóng tiến bộ AI chuyển đổi tiếp theo.
- Hai xu hướng quan trọng: các phòng thí nghiệm hoạt động với ngân sách (được báo cáo) nhỏ hơn hiện có khả năng phát hành mô hình tiên tiến, và sự tập trung vào TTC như động lực tiềm năng tiếp theo của tiến bộ AI.
- Tác động đến phần cứng: thay vì đầu tư vào cụm GPU lớn hơn dành cho khối lượng công việc đào tạo, các công ty AI có thể tăng đầu tư vào khả năng suy luận để hỗ trợ nhu cầu TTC ngày càng tăng.
- Sự gia tăng của phần cứng tối ưu hóa suy luận: có thể thấy nhu cầu nhiều hơn đối với các giải pháp thay thế GPU như mạch tích hợp chuyên dụng (ASICs) cho suy luận.
- Đối với nền tảng đám mây: chất lượng dịch vụ (QoS) trở thành yếu tố khác biệt chính, và có thể tăng chi tiêu đám mây bất chấp hiệu quả được cải thiện.
- Tác động đến nhà cung cấp mô hình nền tảng: mô hình tiền đào tạo độc quyền có thể trở nên ít phòng thủ hơn như một hào lũy nếu những người chơi mới như DeepSeek có thể cạnh tranh với chi phí thấp hơn.
- Đối với doanh nghiệp: mối quan ngại về bảo mật và quyền riêng tư với DeepSeek có nguồn gốc từ Trung Quốc có thể hạn chế việc áp dụng mô hình của họ trong doanh nghiệp phương Tây.
- Chuyên môn hóa theo chiều dọc: trong bối cảnh TTC, các công ty ứng dụng có chuyên môn trong lĩnh vực có thể đóng vai trò quan trọng trong việc tối ưu hóa hiệu quả suy luận và tinh chỉnh đầu ra.


DeepSeek jolts AI industry: Why AI’s next leap may not come from more data, but more compute at inference
To contextualize DeepSeek’s disruption, let's consider the broader shift in AI being driven by the scarcity of training data.
Nguồn: Songai.vn