Tuan Anh Vo
Intern Writer
CEO Nvidia Jensen Huang liên tục nhấn mạnh giá trị chiến lược của thị trường Trung Quốc. Bề ngoài, điều này liên quan đến doanh thu và thị phần, nhưng nguyên nhân sâu xa là vị thế thống trị tuyệt đối của Nvidia đang bị thách thức – sự phát triển nhanh chóng của các nhà sản xuất chip nội địa Trung Quốc đang phá vỡ cục diện thị trường.
Trong bối cảnh giấy phép xuất khẩu chip H20 bị trì hoãn, Nvidia dự kiến ra mắt kế hoạch ứng phó vào tháng 7, thông qua việc giảm cấu hình và "cắt gọt" để lách các quy định kiểm soát xuất khẩu. Các chip B20, B40/B30 sẽ thay thế H20, nhằm giành lại thị phần và đảo ngược xu hướng sụt giảm tại thị trường Trung Quốc.
Vào giữa tháng 6, AceCamp International công bố biên bản khảo sát chuyên gia, cho biết Nvidia dự kiến ra mắt chip B20 và B40/B30, kế thừa H20, dành riêng cho thị trường Trung Quốc vào tháng 7. Giá bán lẻ mỗi card dao động từ 6.500 USD đến 8.000 USD, trong khi máy chủ có giá từ 80.000 USD đến 100.000 USD.
Nếu B20 được ra mắt đúng kế hoạch, đây sẽ là sản phẩm “đặc chế” thế hệ thứ ba dành cho Trung Quốc, sau hai thế hệ trước là H20, H800 (dựa trên kiến trúc Hopper) và A800 (dựa trên kiến trúc Ampere).
So với H20, dòng sản phẩm mới đã bỏ bộ nhớ băng thông cao HBM, khiến băng thông bộ nhớ giảm từ 4,8TB/s (phiên bản HBM3e, hoặc 4,0TB/s với HBM3) xuống còn 1,5TB/s - 1,7TB/s. Điều này trực tiếp làm giảm số lượng tác vụ đồng thời mà chip có thể xử lý.
Việc thay thế HBM bằng GDDR7 là để tuân thủ quy định kiểm soát xuất khẩu của Bộ Thương mại Mỹ, vốn vào năm 2024 đã liệt kê bộ nhớ HBM (băng thông mật độ từ 2GB/s/mm² trở lên) vào danh sách kiểm soát đặc biệt cho các ứng dụng tính toán tiên tiến và trí tuệ nhân tạo. Các sản phẩm HBM2, HBM2e và các phiên bản cao cấp hơn đều thuộc phạm vi kiểm soát khi xuất khẩu hoặc tái xuất khẩu.
Dù việc giảm cấu hình bộ nhớ là điều chỉnh bị động, GDDR7 được xem là lựa chọn tối ưu để tránh vượt ngưỡng kiểm soát hiện nay. Ông Trần Vĩ, Chủ tịch Qianxin, nhận định: “Băng thông của GDDR7 dự kiến vượt 1,5TB/s, dù không bằng HBM3e nhưng vẫn tốt hơn HBM2e của A100, có thể xem như phiên bản IDC của RTX 4090.”
Theo Financial Times dẫn dữ liệu từ Omdia, Microsoft mua tổng cộng 485.000 chip Hopper của Nvidia trong năm 2024, trong khi ByteDance đứng thứ hai với 230.000 chip. Reuters đưa tin vào tháng 4 rằng các công ty công nghệ Trung Quốc như ByteDance, Alibaba đã chi hơn 16 tỷ USD (tương đương hơn 1.160 tỷ NDT) để mua chip H20 trong quý I năm nay.
Ông Trần Vĩ cho rằng, dựa trên thông tin hiện tại, các khách hàng sẽ có xu hướng khác nhau khi chọn giữa B20 và B40/B30: “B20 có băng thông hiệu quả thấp hơn B40/B30. Với xu hướng mô hình ngày càng lớn, các đại công ty có ngân sách sẽ chọn B40/B30, còn các IDC giá rẻ có thể nghiêng về B20.”
Do hiệu năng chip “đặc chế” liên tục bị cắt giảm, một chuyên gia GPU nội địa tiết lộ rằng một số doanh nghiệp lớn đang cân nhắc và đẩy nhanh việc chuyển sang hệ sinh thái nội địa. “Nếu xét đến tính an toàn và ổn định nguồn cung trong tương lai, việc sớm áp dụng sản phẩm nội địa là cần thiết. Tuy nhiên, nhiều doanh nghiệp vẫn kỳ vọng vào nguồn cung từ Nvidia.”
Việc giảm hiệu năng sản phẩm của Nvidia tạo cơ hội cho chip nội địa, nhưng các nhà sản xuất trong nước cũng đối mặt với thách thức riêng.
Một kỹ sư thuật toán tại đại công ty cho biết: “Sức mạnh tính toán của chip nội địa khá tốt, nhưng hệ sinh thái và khả năng triển khai cụm vẫn cần cải thiện.”
Hệ sinh thái của Nvidia xoay quanh CUDA, cung cấp mô hình lập trình thống nhất, thư viện mã phong phú, tương thích tốt với phần cứng Nvidia và các khung AI phổ biến, khiến các nhà phát triển dễ phụ thuộc. Hiện tại, các GPU nội địa đang nỗ lực tương thích với hệ sinh thái CUDA để hỗ trợ chuyển đổi.
“Thế độc quyền hệ sinh thái của Nvidia vẫn còn,” ông Trần Vĩ nói, nhưng ông cho rằng thách thức của GPU nội địa cao cấp còn nằm ở năng lực sản xuất công nghệ tiên tiến.
Theo Wall Street Journal, một công ty Trung Quốc đã sử dụng chi nhánh nước ngoài để thuê 300 máy chủ từ nhà cung cấp địa phương, sắp xếp kỹ sư vận chuyển 4.800TB dữ liệu doanh nghiệp qua ổ cứng để huấn luyện mô hình ở nước ngoài.
Việc dùng dữ liệu doanh nghiệp để huấn luyện mô hình riêng là khả thi về mặt kỹ thuật, nhưng liệu hành vi này có vi phạm quy định kiểm soát xuất khẩu của Mỹ?
Đầu năm 2024, chính quyền Biden từng thảo luận về việc hạn chế doanh nghiệp Trung Quốc tiếp cận dịch vụ đám mây Mỹ, nhưng chưa thực thi. Trong khi đó, chính quyền Trump vào tháng 5 năm nay, khi bãi bỏ “quy tắc lan tỏa AI”, đã nêu rõ trong thông cáo báo chí rằng nếu nhà cung cấp IaaS (cơ sở hạ tầng như dịch vụ) biết khách hàng sử dụng để huấn luyện mô hình AI nhạy cảm, họ phải xin giấy phép. Nói cách khác, nếu mô hình không dùng cho mục đích nhạy cảm, việc này vẫn hợp quy định.
“Rủi ro hiện chủ yếu giới hạn ở huấn luyện mô hình liên quan đến quân sự; các mô hình dân dụng thông thường không bị hạn chế,” một chuyên gia về tuân thủ cho biết.
Việc thuê tính toán tiên tiến từ các nhà cung cấp đám mây nước ngoài cần tuân thủ quy định, và dữ liệu doanh nghiệp Trung Quốc xuất cảnh cũng phải đảm bảo hợp pháp.
Luật sư Lưu Tinh, đối tác của Văn phòng Luật sư Bắc Kinh Phong Lễ, cho rằng trường hợp được Wall Street Journal đề cập không vi phạm pháp luật khi mang dữ liệu ra nước ngoài: “Dữ liệu cụ thể xuất cảnh cần khai báo đánh giá an ninh. Nếu không liên quan đến ‘dữ liệu quan trọng’ hoặc thông tin cá nhân, thường không kích hoạt yêu cầu đánh giá.” Chuyên gia tuân thủ cũng đồng ý, cho rằng nếu doanh nghiệp khử nhạy cảm dữ liệu theo quy định, sẽ không vi phạm về quyền riêng tư hoặc dữ liệu nhạy cảm.
“Dữ liệu gen, dữ liệu khảo sát, dữ liệu kỹ thuật thuộc diện kiểm soát xuất khẩu, và dữ liệu an ninh đều là dữ liệu quan trọng,” ông Lưu bổ sung.
Dù con đường dùng tính toán nước ngoài để huấn luyện mô hình lớn khả thi về kỹ thuật và luật pháp, các kịch bản kinh doanh phù hợp lại hạn chế.
“Xu hướng phát triển mô hình lớn hiện nay chủ yếu là sân chơi của vài tay chơi lớn (không cần tính toán nước ngoài). Huấn luyện thuật toán lái xe tự động dù đang cạnh tranh khốc liệt, nhưng dùng CSP nước ngoài như AWS, Azure thì rủi ro lớn, kể cả khi đi đường hợp quy,” một chuyên gia GPU nội địa nhận định.
Ông Lưu Tinh cho rằng các đại công ty internet, thường là “nhà điều hành cơ sở hạ tầng thông tin quan trọng”, phải tuân thủ nghiêm ngặt các quy định của Luật Đánh giá An ninh Dữ liệu Xuất cảnh, nên sẽ thận trọng hơn khi thực hiện huấn luyện mô hình ở nước ngoài.
Trong khi đó, ông Trần Vĩ cho rằng mang dữ liệu ra nước ngoài để huấn luyện mô hình có ưu điểm là tiếp cận được tính toán tiên tiến, và dữ liệu không đi qua internet nên ít rủi ro rò rỉ. Điều này phù hợp hơn với các công ty vừa và nhỏ làm mô hình ngành.
“Bài báo đề cập 300 máy chủ, có thể là H100, tương đương khoảng 2.400 card,” ông Trần nói. “DeepSeek huấn luyện với 2.048 card, trong khi các đại công ty có thể dùng cụm hàng chục nghìn card để huấn luyện.”

Trong bối cảnh giấy phép xuất khẩu chip H20 bị trì hoãn, Nvidia dự kiến ra mắt kế hoạch ứng phó vào tháng 7, thông qua việc giảm cấu hình và "cắt gọt" để lách các quy định kiểm soát xuất khẩu. Các chip B20, B40/B30 sẽ thay thế H20, nhằm giành lại thị phần và đảo ngược xu hướng sụt giảm tại thị trường Trung Quốc.
Vào giữa tháng 6, AceCamp International công bố biên bản khảo sát chuyên gia, cho biết Nvidia dự kiến ra mắt chip B20 và B40/B30, kế thừa H20, dành riêng cho thị trường Trung Quốc vào tháng 7. Giá bán lẻ mỗi card dao động từ 6.500 USD đến 8.000 USD, trong khi máy chủ có giá từ 80.000 USD đến 100.000 USD.

Trump trước đây tuyên bố trên mạng xã hội rằng sẽ sớm cấp phép cho Nvidia
Thế hệ thứ ba “đặc chế” cho Trung Quốc: Doanh nghiệp lớn chọn B40, IDC giá rẻ chọn B20
Do ảnh hưởng từ việc điều chỉnh linh hoạt các biện pháp kiểm soát xuất khẩu của Mỹ, Nvidia trong vài năm qua liên tục điều chỉnh danh mục sản phẩm (SKU) để đối phó với lệnh cấm.Nếu B20 được ra mắt đúng kế hoạch, đây sẽ là sản phẩm “đặc chế” thế hệ thứ ba dành cho Trung Quốc, sau hai thế hệ trước là H20, H800 (dựa trên kiến trúc Hopper) và A800 (dựa trên kiến trúc Ampere).
So với H20, dòng sản phẩm mới đã bỏ bộ nhớ băng thông cao HBM, khiến băng thông bộ nhớ giảm từ 4,8TB/s (phiên bản HBM3e, hoặc 4,0TB/s với HBM3) xuống còn 1,5TB/s - 1,7TB/s. Điều này trực tiếp làm giảm số lượng tác vụ đồng thời mà chip có thể xử lý.
Việc thay thế HBM bằng GDDR7 là để tuân thủ quy định kiểm soát xuất khẩu của Bộ Thương mại Mỹ, vốn vào năm 2024 đã liệt kê bộ nhớ HBM (băng thông mật độ từ 2GB/s/mm² trở lên) vào danh sách kiểm soát đặc biệt cho các ứng dụng tính toán tiên tiến và trí tuệ nhân tạo. Các sản phẩm HBM2, HBM2e và các phiên bản cao cấp hơn đều thuộc phạm vi kiểm soát khi xuất khẩu hoặc tái xuất khẩu.
Dù việc giảm cấu hình bộ nhớ là điều chỉnh bị động, GDDR7 được xem là lựa chọn tối ưu để tránh vượt ngưỡng kiểm soát hiện nay. Ông Trần Vĩ, Chủ tịch Qianxin, nhận định: “Băng thông của GDDR7 dự kiến vượt 1,5TB/s, dù không bằng HBM3e nhưng vẫn tốt hơn HBM2e của A100, có thể xem như phiên bản IDC của RTX 4090.”
Theo Financial Times dẫn dữ liệu từ Omdia, Microsoft mua tổng cộng 485.000 chip Hopper của Nvidia trong năm 2024, trong khi ByteDance đứng thứ hai với 230.000 chip. Reuters đưa tin vào tháng 4 rằng các công ty công nghệ Trung Quốc như ByteDance, Alibaba đã chi hơn 16 tỷ USD (tương đương hơn 1.160 tỷ NDT) để mua chip H20 trong quý I năm nay.
Ông Trần Vĩ cho rằng, dựa trên thông tin hiện tại, các khách hàng sẽ có xu hướng khác nhau khi chọn giữa B20 và B40/B30: “B20 có băng thông hiệu quả thấp hơn B40/B30. Với xu hướng mô hình ngày càng lớn, các đại công ty có ngân sách sẽ chọn B40/B30, còn các IDC giá rẻ có thể nghiêng về B20.”
02. Lo lắng của Nvidia và thách thức của chip nội địa
Jensen Huang và cả Thung lũng Silicon đều đang lo lắng, nhấn mạnh rằng việc kiểm soát quá mức sẽ làm suy yếu sức cạnh tranh của chip Mỹ, tạo cơ hội cho các đối thủ nội địa Trung Quốc. Sự sụt giảm thị phần từ 95% xuống 50% là một chỉ số rõ ràng.
Do hiệu năng chip “đặc chế” liên tục bị cắt giảm, một chuyên gia GPU nội địa tiết lộ rằng một số doanh nghiệp lớn đang cân nhắc và đẩy nhanh việc chuyển sang hệ sinh thái nội địa. “Nếu xét đến tính an toàn và ổn định nguồn cung trong tương lai, việc sớm áp dụng sản phẩm nội địa là cần thiết. Tuy nhiên, nhiều doanh nghiệp vẫn kỳ vọng vào nguồn cung từ Nvidia.”
Việc giảm hiệu năng sản phẩm của Nvidia tạo cơ hội cho chip nội địa, nhưng các nhà sản xuất trong nước cũng đối mặt với thách thức riêng.
Một kỹ sư thuật toán tại đại công ty cho biết: “Sức mạnh tính toán của chip nội địa khá tốt, nhưng hệ sinh thái và khả năng triển khai cụm vẫn cần cải thiện.”
Hệ sinh thái của Nvidia xoay quanh CUDA, cung cấp mô hình lập trình thống nhất, thư viện mã phong phú, tương thích tốt với phần cứng Nvidia và các khung AI phổ biến, khiến các nhà phát triển dễ phụ thuộc. Hiện tại, các GPU nội địa đang nỗ lực tương thích với hệ sinh thái CUDA để hỗ trợ chuyển đổi.
“Thế độc quyền hệ sinh thái của Nvidia vẫn còn,” ông Trần Vĩ nói, nhưng ông cho rằng thách thức của GPU nội địa cao cấp còn nằm ở năng lực sản xuất công nghệ tiên tiến.
Ai sẽ mang ổ cứng ra nước ngoài?
Việc xây dựng các trung tâm tính toán thông minh tại Trung Quốc đang diễn ra sôi nổi, nhưng sức mạnh tính toán tiên tiến vẫn chịu kiểm soát xuất khẩu. Một số doanh nghiệp bắt đầu thử nghiệm huấn luyện mô hình lớn ở nước ngoài để nâng cao hiệu quả.Theo Wall Street Journal, một công ty Trung Quốc đã sử dụng chi nhánh nước ngoài để thuê 300 máy chủ từ nhà cung cấp địa phương, sắp xếp kỹ sư vận chuyển 4.800TB dữ liệu doanh nghiệp qua ổ cứng để huấn luyện mô hình ở nước ngoài.

Việc dùng dữ liệu doanh nghiệp để huấn luyện mô hình riêng là khả thi về mặt kỹ thuật, nhưng liệu hành vi này có vi phạm quy định kiểm soát xuất khẩu của Mỹ?
Đầu năm 2024, chính quyền Biden từng thảo luận về việc hạn chế doanh nghiệp Trung Quốc tiếp cận dịch vụ đám mây Mỹ, nhưng chưa thực thi. Trong khi đó, chính quyền Trump vào tháng 5 năm nay, khi bãi bỏ “quy tắc lan tỏa AI”, đã nêu rõ trong thông cáo báo chí rằng nếu nhà cung cấp IaaS (cơ sở hạ tầng như dịch vụ) biết khách hàng sử dụng để huấn luyện mô hình AI nhạy cảm, họ phải xin giấy phép. Nói cách khác, nếu mô hình không dùng cho mục đích nhạy cảm, việc này vẫn hợp quy định.
“Rủi ro hiện chủ yếu giới hạn ở huấn luyện mô hình liên quan đến quân sự; các mô hình dân dụng thông thường không bị hạn chế,” một chuyên gia về tuân thủ cho biết.
Việc thuê tính toán tiên tiến từ các nhà cung cấp đám mây nước ngoài cần tuân thủ quy định, và dữ liệu doanh nghiệp Trung Quốc xuất cảnh cũng phải đảm bảo hợp pháp.
Luật sư Lưu Tinh, đối tác của Văn phòng Luật sư Bắc Kinh Phong Lễ, cho rằng trường hợp được Wall Street Journal đề cập không vi phạm pháp luật khi mang dữ liệu ra nước ngoài: “Dữ liệu cụ thể xuất cảnh cần khai báo đánh giá an ninh. Nếu không liên quan đến ‘dữ liệu quan trọng’ hoặc thông tin cá nhân, thường không kích hoạt yêu cầu đánh giá.” Chuyên gia tuân thủ cũng đồng ý, cho rằng nếu doanh nghiệp khử nhạy cảm dữ liệu theo quy định, sẽ không vi phạm về quyền riêng tư hoặc dữ liệu nhạy cảm.
“Dữ liệu gen, dữ liệu khảo sát, dữ liệu kỹ thuật thuộc diện kiểm soát xuất khẩu, và dữ liệu an ninh đều là dữ liệu quan trọng,” ông Lưu bổ sung.
Dù con đường dùng tính toán nước ngoài để huấn luyện mô hình lớn khả thi về kỹ thuật và luật pháp, các kịch bản kinh doanh phù hợp lại hạn chế.
“Xu hướng phát triển mô hình lớn hiện nay chủ yếu là sân chơi của vài tay chơi lớn (không cần tính toán nước ngoài). Huấn luyện thuật toán lái xe tự động dù đang cạnh tranh khốc liệt, nhưng dùng CSP nước ngoài như AWS, Azure thì rủi ro lớn, kể cả khi đi đường hợp quy,” một chuyên gia GPU nội địa nhận định.
Ông Lưu Tinh cho rằng các đại công ty internet, thường là “nhà điều hành cơ sở hạ tầng thông tin quan trọng”, phải tuân thủ nghiêm ngặt các quy định của Luật Đánh giá An ninh Dữ liệu Xuất cảnh, nên sẽ thận trọng hơn khi thực hiện huấn luyện mô hình ở nước ngoài.
Trong khi đó, ông Trần Vĩ cho rằng mang dữ liệu ra nước ngoài để huấn luyện mô hình có ưu điểm là tiếp cận được tính toán tiên tiến, và dữ liệu không đi qua internet nên ít rủi ro rò rỉ. Điều này phù hợp hơn với các công ty vừa và nhỏ làm mô hình ngành.
“Bài báo đề cập 300 máy chủ, có thể là H100, tương đương khoảng 2.400 card,” ông Trần nói. “DeepSeek huấn luyện với 2.048 card, trong khi các đại công ty có thể dùng cụm hàng chục nghìn card để huấn luyện.”