myle.vnreview
Writer
Theo hãng tin Nikkei, các công ty internet hàng đầu ByteDance, Alibaba và Tencent đã tích trữ hàng tỷ đô la chip trí tuệ nhân tạo H20 của Nvidia trong năm nay trước khi Mỹ hạn chế xuất khẩu sang loại chip này đến Trung Quốc kể từ tháng 4/2025.
Bộ xử lý đồ họa (GPU) H20 được thiết kế riêng để bán tại thị trường Trung Quốc nhằm tuân thủ các biện pháp kiểm soát xuất khẩu của Mỹ nhưng ByteDance, Alibaba và Tencent đã bắt đầu chuẩn bị vào năm ngoái cho khả năng Washington cũng có thể cấm bán nốt cả chip GPU này.
Ba công ty công nghệ hàng đầu Trung Quốc đã yêu cầu Nvidia vận chuyển tổng cộng khoảng 1 triệu chip H20 - nguồn cung cấp gần đủ cho một năm - càng sớm càng tốt, lý tưởng nhất là vào cuối tháng 5, một người được thông báo về vấn đề này chia sẻ với Nikkei. Nguồn tin cho biết thêm rằng số lượng thực tế được giao đã không đạt được do chính quyền của Tổng thống Trump tuyên bố vào đầu tháng 4 rằng những con chip này sẽ cần có giấy phép xuất khẩu.
Một nguồn tin khác chia sẻ với Nikkei rằng giá trị của các đơn đặt hàng gấp của 3 công ty ByteDance, Alibaba và Tencent vượt quá 12 tỷ USD và có tới hàng tỷ USD đã được chuyển đi trước khi lệnh hạn chế mới có hiệu lực.
Theo hai nguồn tin, ByteDance là một trong những công ty tích cực nhất trong việc mua càng nhiều chip Nvidia càng tốt.
Những nỗ lực tích trữ này diễn ra trong bối cảnh nhu cầu về sức mạnh tính toán AI ở Trung Quốc tăng vọt, đặc biệt là kể từ khi DeepSeek xuất hiện vào đầu năm nay. Vào tháng 2, Tencent đã bắt đầu tích hợp DeepSeek vào siêu ứng dụng WeChat của mình, thúc đẩy đáng kể nhu cầu về sức mạnh tính toán.
"Việc hạn chế xuất khẩu H20 không gây bất ngờ vì nó đã được dự đoán rộng rãi trong toàn ngành", một giám đốc điều hành công ty công nghệ hàng đầu của Trung Quốc cho biết. "Mọi công ty công nghệ lớn của Trung Quốc đều đã tích trữ H20 từ trước."
Ngoài các đơn đặt hàng gấp, các công ty Trung Quốc đã tìm cách mua chip Nvidia bên ngoài Trung Quốc, ở những thị trường không phải chịu sự kiểm soát xuất khẩu của Mỹ, các nguồn tin chia sẻ với Nikkei cho biết. Bên cạnh đó, các công ty Trung Quốc thường sử dụng các công ty con hoặc chi nhánh ở nước ngoài hoặc hợp tác với các đối tác trong ngành như nhà khai thác viễn thông để được tiếp cận vào phần cứng AI, nhiều nguồn tin trong ngành cho Nikkei biết.
"Các khách hàng [Trung Quốc] rất bình tĩnh", một giám đốc điều hành của một nhà cung cấp cho ByteDance và Alibaba Cloud đã gặp các công ty sau những hạn chế mới nhất cho biết. "Họ biết điều đó sẽ đến và họ đã chuẩn bị cho ngày này. Họ nói với chúng tôi rằng mục tiêu đầy tham vọng của họ là xây dựng thêm nhiều trung tâm dữ liệu trong năm nay vẫn không thay đổi".
Bên cạnh Trung Quốc đại lục và Hồng Kông, Alibaba điều hành các trung tâm dữ liệu tại 13 quốc gia, bao gồm hai trung tâm ở Mỹ trong khi ByteDance có các trung tâm dữ liệu ở nhiều quốc gia Đông Nam Á và châu Âu, bao gồm Ireland và Na Uy.
Trong khi đó, các gã khổng lồ về trung tâm dữ liệu của Trung Quốc đang đẩy nhanh quá trình xác minh cho các nền tảng GPU trong nước, chẳng hạn như Ascend của Huawei. Vào đầu tháng 4, Huawei đã công bố giải pháp điện toán AI mới nhất của mình, CloudMatrix 384, kết nối 384 chip AI Ascend do chính công ty phát triển để cạnh tranh với hiệu suất của GB200 NVL72 tiên tiến của Nvidia.
H20 là phiên bản hạ cấp hai lần của chip H100 của Nvidia, lần đầu tiên ra mắt trên thị trường toàn cầu vào quý 3 năm 2022. Để ứng phó với các biện pháp kiểm soát xuất khẩu của Mỹ vào năm đó, Nvidia đã giới thiệu H800 công suất thấp hơn cho thị trường Trung Quốc. Sau đó, Nvidia đã hạ cấp xuống H20 sau khi Mỹ tiếp tục siết chặt xuất khẩu phần cứng AI sang Trung Quốc.
Doanh thu của Nvidia tính theo quốc gia và khu vực mua.
H20, ra mắt vào nửa đầu năm 2024, chỉ bằng khoảng một phần mười công suất tính toán của H100 ban đầu để đào tạo AI và chỉ bằng 20% khả năng suy luận của H100. Tuy nhiên, nó vẫn rất phổ biến ở Trung Quốc.
Suy luận là ứng dụng AI đưa ra dự đoán hoặc tạo phản hồi dựa trên mô hình đã được đào tạo.
Eugene Lee, một kỹ sư AI tại Hồng Kông, cho biết mặc dù H20 có vẻ là một GPU đào tạo, nhưng cấu hình của nó thực sự được tối ưu hóa cho suy luận, trái ngược với khả năng đào tạo hiệu suất cao của chip H100 và H800 của Nvidia. Do đó, nếu nguồn cung cấp H20 bị thiếu hụt, nó có thể được thay thế một phần bằng các giải pháp thay thế trong nước hoặc giải pháp dựa trên đám mây cho các mô hình vừa và nhỏ. Tuy nhiên, việc triển khai và tối ưu hóa liên tục các mô hình lớn trong tình huống như vậy có thể bị hạn chế đáng kể.
Eugene Lee cho biết thêm rằng nhiều mô hình AI quy mô lớn dựa vào H100 và H800 đã mua trước đó để đào tạo, với các nhà cung cấp đám mây lớn cũng sử dụng chúng để cung cấp dịch vụ suy luận.
"Nếu lượng hàng tồn kho hiện có của H100 và H800 bị cạn kiệt, điều này có thể cản trở nghiêm trọng việc đào tạo các mô hình tiên tiến và phát triển các hệ thống thế hệ tiếp theo, gây ra mối đe dọa đáng kể đến khả năng cạnh tranh của Trung Quốc trong phát triển AI cao cấp", Eugene Lee cho biết.
Nvidia cảnh báo rằng các hạn chế đối với H20 sẽ có lợi cho các đối thủ cạnh tranh của mình khi khách hàng Trung Quốc tìm kiếm các giải pháp thay thế trong nước hoặc ở nơi khác. Vào ngày 15/4, Nvidia cho biết họ dự kiến sẽ chịu khoản lỗ 5,5 tỷ USD trong quý do lệnh hạn chế của Mỹ.
Sau thông báo đó, Giám đốc điều hành Nvidia Jensen Huang đã có chuyến thăm bất ngờ tới Bắc Kinh và đưa ra cam kết sẽ "nỗ lực hết sức" để tiếp tục phục vụ Trung Quốc.
Trong năm tài chính kết thúc vào ngày 26/1, Trung Quốc chiếm khoảng 13,1% tổng doanh thu của Nvidia, giảm so với mức gần 17% của năm trước đó. Ngược lại, thị phần của Singapore đã tăng lên 18% từ mức 11,2% của năm trước. Tuy nhiên, những con số đó dựa trên địa điểm thanh toán của khách hàng và Nvidia lưu ý rằng nhiều khách hàng sử dụng Singapore để tập trung hóa việc lập hóa đơn mặc dù sản phẩm thường được vận chuyển đến nơi khác. Theo số lượng hàng thực tế, Singapore chiếm chưa đến 2% tổng doanh thu của công ty trong giai đoạn đó.

Bộ xử lý đồ họa (GPU) H20 được thiết kế riêng để bán tại thị trường Trung Quốc nhằm tuân thủ các biện pháp kiểm soát xuất khẩu của Mỹ nhưng ByteDance, Alibaba và Tencent đã bắt đầu chuẩn bị vào năm ngoái cho khả năng Washington cũng có thể cấm bán nốt cả chip GPU này.
Ba công ty công nghệ hàng đầu Trung Quốc đã yêu cầu Nvidia vận chuyển tổng cộng khoảng 1 triệu chip H20 - nguồn cung cấp gần đủ cho một năm - càng sớm càng tốt, lý tưởng nhất là vào cuối tháng 5, một người được thông báo về vấn đề này chia sẻ với Nikkei. Nguồn tin cho biết thêm rằng số lượng thực tế được giao đã không đạt được do chính quyền của Tổng thống Trump tuyên bố vào đầu tháng 4 rằng những con chip này sẽ cần có giấy phép xuất khẩu.
Một nguồn tin khác chia sẻ với Nikkei rằng giá trị của các đơn đặt hàng gấp của 3 công ty ByteDance, Alibaba và Tencent vượt quá 12 tỷ USD và có tới hàng tỷ USD đã được chuyển đi trước khi lệnh hạn chế mới có hiệu lực.
Theo hai nguồn tin, ByteDance là một trong những công ty tích cực nhất trong việc mua càng nhiều chip Nvidia càng tốt.
Những nỗ lực tích trữ này diễn ra trong bối cảnh nhu cầu về sức mạnh tính toán AI ở Trung Quốc tăng vọt, đặc biệt là kể từ khi DeepSeek xuất hiện vào đầu năm nay. Vào tháng 2, Tencent đã bắt đầu tích hợp DeepSeek vào siêu ứng dụng WeChat của mình, thúc đẩy đáng kể nhu cầu về sức mạnh tính toán.
"Việc hạn chế xuất khẩu H20 không gây bất ngờ vì nó đã được dự đoán rộng rãi trong toàn ngành", một giám đốc điều hành công ty công nghệ hàng đầu của Trung Quốc cho biết. "Mọi công ty công nghệ lớn của Trung Quốc đều đã tích trữ H20 từ trước."
Ngoài các đơn đặt hàng gấp, các công ty Trung Quốc đã tìm cách mua chip Nvidia bên ngoài Trung Quốc, ở những thị trường không phải chịu sự kiểm soát xuất khẩu của Mỹ, các nguồn tin chia sẻ với Nikkei cho biết. Bên cạnh đó, các công ty Trung Quốc thường sử dụng các công ty con hoặc chi nhánh ở nước ngoài hoặc hợp tác với các đối tác trong ngành như nhà khai thác viễn thông để được tiếp cận vào phần cứng AI, nhiều nguồn tin trong ngành cho Nikkei biết.
"Các khách hàng [Trung Quốc] rất bình tĩnh", một giám đốc điều hành của một nhà cung cấp cho ByteDance và Alibaba Cloud đã gặp các công ty sau những hạn chế mới nhất cho biết. "Họ biết điều đó sẽ đến và họ đã chuẩn bị cho ngày này. Họ nói với chúng tôi rằng mục tiêu đầy tham vọng của họ là xây dựng thêm nhiều trung tâm dữ liệu trong năm nay vẫn không thay đổi".
Bên cạnh Trung Quốc đại lục và Hồng Kông, Alibaba điều hành các trung tâm dữ liệu tại 13 quốc gia, bao gồm hai trung tâm ở Mỹ trong khi ByteDance có các trung tâm dữ liệu ở nhiều quốc gia Đông Nam Á và châu Âu, bao gồm Ireland và Na Uy.
Trong khi đó, các gã khổng lồ về trung tâm dữ liệu của Trung Quốc đang đẩy nhanh quá trình xác minh cho các nền tảng GPU trong nước, chẳng hạn như Ascend của Huawei. Vào đầu tháng 4, Huawei đã công bố giải pháp điện toán AI mới nhất của mình, CloudMatrix 384, kết nối 384 chip AI Ascend do chính công ty phát triển để cạnh tranh với hiệu suất của GB200 NVL72 tiên tiến của Nvidia.
H20 là phiên bản hạ cấp hai lần của chip H100 của Nvidia, lần đầu tiên ra mắt trên thị trường toàn cầu vào quý 3 năm 2022. Để ứng phó với các biện pháp kiểm soát xuất khẩu của Mỹ vào năm đó, Nvidia đã giới thiệu H800 công suất thấp hơn cho thị trường Trung Quốc. Sau đó, Nvidia đã hạ cấp xuống H20 sau khi Mỹ tiếp tục siết chặt xuất khẩu phần cứng AI sang Trung Quốc.

Doanh thu của Nvidia tính theo quốc gia và khu vực mua.
H20, ra mắt vào nửa đầu năm 2024, chỉ bằng khoảng một phần mười công suất tính toán của H100 ban đầu để đào tạo AI và chỉ bằng 20% khả năng suy luận của H100. Tuy nhiên, nó vẫn rất phổ biến ở Trung Quốc.
Suy luận là ứng dụng AI đưa ra dự đoán hoặc tạo phản hồi dựa trên mô hình đã được đào tạo.
Eugene Lee, một kỹ sư AI tại Hồng Kông, cho biết mặc dù H20 có vẻ là một GPU đào tạo, nhưng cấu hình của nó thực sự được tối ưu hóa cho suy luận, trái ngược với khả năng đào tạo hiệu suất cao của chip H100 và H800 của Nvidia. Do đó, nếu nguồn cung cấp H20 bị thiếu hụt, nó có thể được thay thế một phần bằng các giải pháp thay thế trong nước hoặc giải pháp dựa trên đám mây cho các mô hình vừa và nhỏ. Tuy nhiên, việc triển khai và tối ưu hóa liên tục các mô hình lớn trong tình huống như vậy có thể bị hạn chế đáng kể.
Eugene Lee cho biết thêm rằng nhiều mô hình AI quy mô lớn dựa vào H100 và H800 đã mua trước đó để đào tạo, với các nhà cung cấp đám mây lớn cũng sử dụng chúng để cung cấp dịch vụ suy luận.
"Nếu lượng hàng tồn kho hiện có của H100 và H800 bị cạn kiệt, điều này có thể cản trở nghiêm trọng việc đào tạo các mô hình tiên tiến và phát triển các hệ thống thế hệ tiếp theo, gây ra mối đe dọa đáng kể đến khả năng cạnh tranh của Trung Quốc trong phát triển AI cao cấp", Eugene Lee cho biết.
Nvidia cảnh báo rằng các hạn chế đối với H20 sẽ có lợi cho các đối thủ cạnh tranh của mình khi khách hàng Trung Quốc tìm kiếm các giải pháp thay thế trong nước hoặc ở nơi khác. Vào ngày 15/4, Nvidia cho biết họ dự kiến sẽ chịu khoản lỗ 5,5 tỷ USD trong quý do lệnh hạn chế của Mỹ.
Sau thông báo đó, Giám đốc điều hành Nvidia Jensen Huang đã có chuyến thăm bất ngờ tới Bắc Kinh và đưa ra cam kết sẽ "nỗ lực hết sức" để tiếp tục phục vụ Trung Quốc.
Trong năm tài chính kết thúc vào ngày 26/1, Trung Quốc chiếm khoảng 13,1% tổng doanh thu của Nvidia, giảm so với mức gần 17% của năm trước đó. Ngược lại, thị phần của Singapore đã tăng lên 18% từ mức 11,2% của năm trước. Tuy nhiên, những con số đó dựa trên địa điểm thanh toán của khách hàng và Nvidia lưu ý rằng nhiều khách hàng sử dụng Singapore để tập trung hóa việc lập hóa đơn mặc dù sản phẩm thường được vận chuyển đến nơi khác. Theo số lượng hàng thực tế, Singapore chiếm chưa đến 2% tổng doanh thu của công ty trong giai đoạn đó.