Các "pháp sư Trung Hoa" liên tục tấn công Mỹ trên mặt trận AI, công nghệ mới ra mắt vượt mặt Nvidia

Linh Pham
Linh Pham
Phản hồi: 0

Linh Pham

Intern Writer
Gần đây, thông tin Mỹ sẽ không còn hạn chế xuất khẩu chip NVIDIA H20 sang Trung Quốc đã thu hút sự chú ý và một lần nữa cho thấy sự bất ổn trong nguồn cung cấp năng lực tính toán từ bên ngoài. Trên thực tế, với nhu cầu tính toán khổng lồ do các mô hình ngôn ngữ lớn tạo ra, việc các doanh nghiệp Trung Quốc phải mua chip NVIDIA “phiên bản giới hạn” với giá cao không phải là giải pháp lâu dài. Làm sao để có được nguồn tính toán ổn định, liên tục và đủ dùng đã trở thành yếu tố then chốt để đảm bảo tính liên tục trong vận hành kinh doanh.

1744341008738.png


Nỗi lo về hạ tầng công nghệ phụ thuộc của Trung Quốc​

Ngày 10/4, hai hội nghị quan trọng trong lĩnh vực điện toán đám mây tại Trung Quốc đã thu hút sự chú ý lớn của ngành.

Một trong số đó là Hội nghị Tính toán thông minh của China Mobile 2025. Chủ tịch China Mobile, ông Dương Kiệt, cho biết: Cuộc cách mạng công nghệ và chuyển đổi công nghiệp mới, lấy số hóa và trí tuệ hóa làm đặc trưng, đang phát triển mạnh mẽ. Dữ liệu trở thành yếu tố sản xuất mới, tính toán trở thành hạ tầng cơ bản và nguồn năng lượng cơ sở, trí tuệ nhân tạo trở thành công cụ sản xuất mới, thúc đẩy nền kinh tế - xã hội chuyển dịch nhanh chóng từ “Internet+”, “5G+” sang “AI+”, tạo ra cơ hội mới và đặt ra yêu cầu mới cho hạ tầng mạng-tính toán.

Ông dự báo, trong 3 năm tới, quy mô tính toán thông minh tại Trung Quốc sẽ tăng gấp hơn 2,5 lần, với tốc độ tăng trưởng kép hàng năm gần 40%. Nhu cầu tính toán suy luận sẽ vượt qua nhu cầu huấn luyện, với tốc độ tăng trưởng gấp gần 4 lần so với tính toán huấn luyện. Đến năm 2028, quy mô tính toán suy luận sẽ vượt qua huấn luyện. China Mobile sẽ xây dựng các “nhà máy tính toán” siêu quy mô, mở rộng trung tâm tính toán hàng nghìn, hàng vạn card, và thúc đẩy nghiên cứu trung tâm trí tuệ nhân tạo quy mô 100.000 card.

Từ trước đến nay, do hạn chế về công nghệ sản xuất chip, năng lực tính toán đơn card của chip trong nước không thể so với NVIDIA – đây chính là nguyên nhân gây ra "lo âu tính toán", dẫn đến việc các doanh nghiệp Trung Quốc tích trữ chip NVIDIA. Tuy nhiên, với tốc độ phát triển nhanh của mô hình lớn, hệ thống tính toán đang thay đổi về mặt cấu trúc – điều quan trọng không chỉ là năng lực tính toán của từng chip riêng lẻ, mà là hệ thống tính toán tổng thể. Những thay đổi này mở ra cơ hội để thông qua đổi mới kiến trúc, tạo ra con đường phát triển ngành tính toán bền vững và tự chủ.

Bước tiến mới của Huawei​

Cùng ngày, tại Hội nghị hệ sinh thái Huawei Cloud 2025, ông Trương Bình An – Giám đốc điều hành Huawei, CEO Huawei Cloud – đã công bố một bước đột phá trong kiến trúc hạ tầng AI: giới thiệu siêu nút CloudMatrix 384, hiện đã được triển khai quy mô tại trung tâm dữ liệu Vũ Hồ.

Theo tờ Observer, năm ngoái, hệ thống NVL72 của NVIDIA từng gây chú ý lớn khi tăng tốc độ suy luận thời gian thực cho các mô hình ngôn ngữ lớn tham số hàng ngàn tỷ gấp 30 lần. Thế nhưng, siêu nút CloudMatrix 384 của Huawei – sản phẩm thương mại hóa quy mô đầu tiên tại Trung Quốc – vượt trội hoàn toàn về quy mô, hiệu năng và độ tin cậy so với NVL72. Điều đặc biệt là nó đánh dấu sự chuyển đổi cung ứng tài nguyên AI từ cấp độ máy chủ sang cấp độ ma trận. Dựa trên CloudMatrix, dịch vụ AI Ascend Cloud của Huawei cho phép huấn luyện mô hình lớn liên tục suốt 40 ngày, với khả năng khôi phục băng thông khi gián đoạn chỉ trong vài giây.

Kiến trúc siêu nút của Huawei đặc biệt phù hợp với các mô hình chuyên gia hỗn hợp (MOE). Trước đây, với các máy chủ NVIDIA 8 card truyền thống, DeepSeek phải thực hiện nhiều cải tiến kỹ thuật phức tạp. Nhưng với kiến trúc độc đáo của Huawei, việc chạy mô hình chuyên gia quy mô lớn trở nên đơn giản và tự nhiên hơn.

1744341207406.png


Huawei Cloud đã làm điều đó như thế nào? Nói một cách dễ hiểu: họ sử dụng bus tốc độ cao để liên kết chặt chẽ nhiều máy chủ (chẳng hạn mỗi máy 8 card Ascend) thành một đơn vị tính toán logic duy nhất – gọi là “siêu nút”. Kiến trúc này phá vỡ giới hạn vật lý của máy chủ, tạo ra mô hình kết nối ngang hàng, tài nguyên dạng hồ, giúp tăng năng lực tính toán gấp 50 lần (mỗi siêu nút đạt tới 300 PFlops). Huawei đã chuyển công nghệ này thành dịch vụ đám mây Ascend, hạ thấp rào cản tiếp cận của doanh nghiệp với năng lực tính toán hiệu năng cao.

Vượt qua giới hạn đơn card, tạo ra sức mạnh hệ thống là chiến lược xuyên suốt của Huawei. Năm ngoái, Chủ tịch luân phiên Huawei – ông Từ Trực Quân – từng nói: “Huawei sẽ nắm bắt cơ hội cách mạng AI, dựa trên công nghệ sản xuất chip thực tế, tích hợp đổi mới giữa tính toán, lưu trữ và mạng, sáng tạo kiến trúc tính toán, xây dựng giải pháp ‘siêu nút + cụm tính toán’ để lâu dài đáp ứng nhu cầu AI.”

Tại hội nghị lần này, ông Trương Bình An tiếp tục nhấn mạnh: Đối mặt với thế giới thông minh, Huawei Cloud cam kết trở thành “nền tảng đám mây” và “bộ công cụ kích hoạt” chuyển đổi số cho ngành, thúc đẩy phát triển AI thông qua dịch vụ đám mây Ascend AI. “Chúng tôi không vội vàng, và Pangu Model của Huawei sẽ tiếp tục kiên định theo con đường AI ngành, giúp các doanh nghiệp tạo ra mô hình riêng cho chính họ. Huawei không làm ứng dụng AI hướng đến người dùng phổ thông, mà quan tâm đến việc giúp các ngành nghề thật sự áp dụng được AI.”

Tranh đua Trung – Mỹ không chỉ là thương mại mà còn là công nghệ

Theo báo cáo mới nhất Chỉ số AI 2025 từ Đại học Stanford, khoảng cách hiệu năng giữa các mô hình AI hàng đầu của Trung Quốc và Mỹ đã thu hẹp xuống còn 0,3%, trong khi năm 2023 là 20% – cho thấy các mô hình Trung Quốc đang rút ngắn khoảng cách nhanh chóng. Đáng chú ý, hiệu năng giữa các mô hình đầu bảng đang tiệm cận nhau, khi chênh lệch giữa mô hình số 1 và số 10 đã giảm mạnh từ 12% xuống còn 5%.

Trong bối cảnh cạnh tranh này, việc Trung Quốc tận dụng hiệu quả năng lực tính toán nội địa để đẩy nhanh triển khai AI vào thực tiễn càng trở nên cấp thiết. Tại Hội nghị AI Tiềm năng 2025 của Alibaba Cloud ngày 9/4, ông Lưu Vệ Quang – Phó Tổng giám đốc cấp cao Tập đoàn Alibaba Cloud, Tổng giám đốc Khối Dịch vụ đám mây công cộng – cho rằng: “Bùng nổ AI năm 2025 không có cái gọi là ‘nhanh nhất’, mà chỉ có ‘nhanh hơn nữa’.” Ông nhấn mạnh cần thúc đẩy đồng thời ba yếu tố: mô hình cơ sở, dịch vụ suy luận và công cụ phát triển, để giúp AI tăng tốc ứng dụng thực tiễn.

Ông cũng chia sẻ rằng trong năm qua, nhiều doanh nghiệp đã tích cực áp dụng mô hình ngôn ngữ lớn – từ tạo ảnh, tạo video, sáng tác tài liệu đến ứng dụng dữ liệu – và số lần gọi API của mô hình ngôn ngữ lớn Alibaba Cloud đã tăng gần 100 lần. Trong tương lai, AI sẽ hợp nhất sâu với các ngành nghề, sản sinh ra nhiều mô hình kinh doanh và quy trình sản xuất mới. Từ mô hình suy luận sâu đến năng lực đa phương thức, năng lực mô hình cơ sở của Trung Quốc đã cải thiện rõ rệt, giúp nhiều ngành nghề triển khai học tăng cường (reinforcement learning), thúc đẩy AI hiện thực hóa trong đời sống.

Tuy nhiên, để AI thực sự phát huy tác dụng, các doanh nghiệp Trung Quốc cần đồng lòng. Như lời ông Trương Bình An:
“Trong kỷ nguyên AI, không một doanh nghiệp nào có thể một mình giải quyết bài toán của cả ngàn ngành nghề. Chúng ta cần sức mạnh của toàn bộ hệ sinh thái – từ nhà cung cấp tính toán, nhà cung cấp công nghệ, đến các đơn vị phát triển mô hình – cùng phối hợp, cởi mở chia sẻ, thì mới có thể nhanh chóng đón đầu và tận hưởng thành quả của thời đại AI.”
 


Đăng nhập một lần thảo luận tẹt ga
Top