Yu Ki San
Writer
Theo nghiên cứu mới đây của DeepSeek, bộ xử lý HiSilicon Ascend 910C của Huawei, phiên bản nâng cấp của Ascend 910 ra mắt năm 2019, đã đạt được những bước tiến đáng kể về hiệu suất suy luận (inference), chạm ngưỡng 60% so với GPU H100 của NVIDIA. Dù chưa thể cạnh tranh trong mảng đào tạo AI, Ascend 910C vẫn cho thấy tiềm năng giúp Trung Quốc giảm bớt sự phụ thuộc vào GPU của NVIDIA, đặc biệt khi kết hợp với những cải tiến phần mềm từ DeepSeek.
Ascend 910C: Hiệu suất suy luận ấn tượng
Các thử nghiệm của DeepSeek cho thấy Ascend 910C vượt xa kỳ vọng về khả năng suy luận. Đáng chú ý, DeepSeek nhấn mạnh rằng nếu được tối ưu thủ công với các kernel CUNN, hiệu suất của Ascend 910C có thể còn được cải thiện hơn nữa. Nhờ sự hỗ trợ nguyên bản của DeepSeek dành cho bộ xử lý Ascend cùng kho lưu trữ PyTorch, việc chuyển đổi từ CUDA sang CUNN trở nên đơn giản, giúp tích hợp phần cứng của Huawei vào quy trình AI một cách dễ dàng.
Nỗ lực của Huawei bất chấp lệnh trừng phạt
Bất chấp các lệnh trừng phạt từ Mỹ và hạn chế trong việc tiếp cận công nghệ sản xuất chip tiên tiến của TSMC, Huawei vẫn đang có những bước tiến nhanh chóng trong lĩnh vực chip AI. SMIC, đối tác sản xuất của Huawei, đã bắt kịp trình độ của TSMC giai đoạn 2019-2020 và cho ra đời Ascend 910C, một con chip có khả năng cạnh tranh với NVIDIA A100 và H100 ở một số khía cạnh.
Điểm yếu trong đào tạo AI: "Gót chân Achilles" của Ascend 910C
Mặc dù đạt kết quả khả quan trong suy luận, Ascend 910C chưa phải là lựa chọn lý tưởng cho đào tạo AI - lĩnh vực mà NVIDIA vẫn đang thống trị. Ông Yuchen Jin, đại diện của DeepSeek, chỉ ra rằng tính ổn định khi đào tạo dài hạn là điểm yếu lớn nhất của các bộ xử lý AI Trung Quốc. Nguyên nhân chính là do NVIDIA đã phát triển hệ sinh thái phần cứng và phần mềm trong suốt hơn hai thập kỷ, tạo ra lợi thế vượt trội khó có thể san lấp trong thời gian ngắn.
Thiết kế và công nghệ sản xuất
Ascend 910C tiếp tục sử dụng thiết kế chiplet, với SoC tính toán chính chứa khoảng 53 tỷ bóng bán dẫn. Tuy nhiên, điểm khác biệt nằm ở việc Ascend 910C chuyển sang sử dụng tiến trình N+2 (thế hệ thứ hai của 7nm) của SMIC, thay vì chiplet tính toán do TSMC sản xuất trên tiến trình N7+ (7nm với EUV) như Ascend 910 đời đầu.
Tương lai của AI và cuộc đua giữa Huawei và NVIDIA
Một số chuyên gia dự đoán rằng khi các mô hình AI tiếp tục hội tụ vào kiến trúc Transformer, hệ sinh thái phần mềm của NVIDIA có thể mất đi phần nào lợi thế. Đồng thời, việc DeepSeek tập trung vào tối ưu hóa phần cứng và phần mềm có thể giúp giảm sự phụ thuộc vào GPU của NVIDIA, mang lại một lựa chọn tiết kiệm chi phí hơn, đặc biệt trong lĩnh vực suy luận AI.
Tuy nhiên, để có thể cạnh tranh trên quy mô toàn cầu, Trung Quốc cần giải quyết bài toán về độ ổn định khi đào tạo mô hình AI và tiếp tục nâng cấp cơ sở hạ tầng tính toán AI. Nếu vượt qua rào cản này, Huawei có thể trở thành một đối thủ đáng gờm trong lĩnh vực phần cứng AI, mở ra cơ hội thay thế GPU NVIDIA trong nhiều ứng dụng chiến lược.
Ascend 910C của Huawei, dù chưa thể so sánh với NVIDIA trong mảng đào tạo AI, nhưng với hiệu suất suy luận ấn tượng, đã cho thấy tiềm năng to lớn trong việc giúp Trung Quốc giảm bớt sự phụ thuộc vào GPU nước ngoài. Sự kết hợp giữa phần cứng Huawei và tối ưu hóa phần mềm từ DeepSeek đang tạo ra một làn gió mới trong cuộc đua AI toàn cầu.
#DeepSeek
Ascend 910C: Hiệu suất suy luận ấn tượng
Các thử nghiệm của DeepSeek cho thấy Ascend 910C vượt xa kỳ vọng về khả năng suy luận. Đáng chú ý, DeepSeek nhấn mạnh rằng nếu được tối ưu thủ công với các kernel CUNN, hiệu suất của Ascend 910C có thể còn được cải thiện hơn nữa. Nhờ sự hỗ trợ nguyên bản của DeepSeek dành cho bộ xử lý Ascend cùng kho lưu trữ PyTorch, việc chuyển đổi từ CUDA sang CUNN trở nên đơn giản, giúp tích hợp phần cứng của Huawei vào quy trình AI một cách dễ dàng.
Nỗ lực của Huawei bất chấp lệnh trừng phạt
Bất chấp các lệnh trừng phạt từ Mỹ và hạn chế trong việc tiếp cận công nghệ sản xuất chip tiên tiến của TSMC, Huawei vẫn đang có những bước tiến nhanh chóng trong lĩnh vực chip AI. SMIC, đối tác sản xuất của Huawei, đã bắt kịp trình độ của TSMC giai đoạn 2019-2020 và cho ra đời Ascend 910C, một con chip có khả năng cạnh tranh với NVIDIA A100 và H100 ở một số khía cạnh.
Điểm yếu trong đào tạo AI: "Gót chân Achilles" của Ascend 910C
Mặc dù đạt kết quả khả quan trong suy luận, Ascend 910C chưa phải là lựa chọn lý tưởng cho đào tạo AI - lĩnh vực mà NVIDIA vẫn đang thống trị. Ông Yuchen Jin, đại diện của DeepSeek, chỉ ra rằng tính ổn định khi đào tạo dài hạn là điểm yếu lớn nhất của các bộ xử lý AI Trung Quốc. Nguyên nhân chính là do NVIDIA đã phát triển hệ sinh thái phần cứng và phần mềm trong suốt hơn hai thập kỷ, tạo ra lợi thế vượt trội khó có thể san lấp trong thời gian ngắn.
Thiết kế và công nghệ sản xuất
Ascend 910C tiếp tục sử dụng thiết kế chiplet, với SoC tính toán chính chứa khoảng 53 tỷ bóng bán dẫn. Tuy nhiên, điểm khác biệt nằm ở việc Ascend 910C chuyển sang sử dụng tiến trình N+2 (thế hệ thứ hai của 7nm) của SMIC, thay vì chiplet tính toán do TSMC sản xuất trên tiến trình N7+ (7nm với EUV) như Ascend 910 đời đầu.
Tương lai của AI và cuộc đua giữa Huawei và NVIDIA
Một số chuyên gia dự đoán rằng khi các mô hình AI tiếp tục hội tụ vào kiến trúc Transformer, hệ sinh thái phần mềm của NVIDIA có thể mất đi phần nào lợi thế. Đồng thời, việc DeepSeek tập trung vào tối ưu hóa phần cứng và phần mềm có thể giúp giảm sự phụ thuộc vào GPU của NVIDIA, mang lại một lựa chọn tiết kiệm chi phí hơn, đặc biệt trong lĩnh vực suy luận AI.
Tuy nhiên, để có thể cạnh tranh trên quy mô toàn cầu, Trung Quốc cần giải quyết bài toán về độ ổn định khi đào tạo mô hình AI và tiếp tục nâng cấp cơ sở hạ tầng tính toán AI. Nếu vượt qua rào cản này, Huawei có thể trở thành một đối thủ đáng gờm trong lĩnh vực phần cứng AI, mở ra cơ hội thay thế GPU NVIDIA trong nhiều ứng dụng chiến lược.
Ascend 910C của Huawei, dù chưa thể so sánh với NVIDIA trong mảng đào tạo AI, nhưng với hiệu suất suy luận ấn tượng, đã cho thấy tiềm năng to lớn trong việc giúp Trung Quốc giảm bớt sự phụ thuộc vào GPU nước ngoài. Sự kết hợp giữa phần cứng Huawei và tối ưu hóa phần mềm từ DeepSeek đang tạo ra một làn gió mới trong cuộc đua AI toàn cầu.
#DeepSeek