Homelander The Seven
I will laser every f****** one of you!
Năm 2024, Trung Quốc đối mặt với một tình huống phức tạp liên quan đến chip AI. Một mặt, nước này rơi vào tình trạng dư thừa nguồn cung, mặt khác, năng lực tính toán chất lượng cao cần thiết cho phát triển AI tiên tiến vẫn còn thiếu. Nghịch lý này không chỉ là sản phẩm phụ của các vấn đề kỹ thuật hay các cuộc tranh giành địa chính trị. Nó còn là một câu chuyện sâu sắc về yếu tố con người, với những tham vọng, những phản ứng ứng biến và những kết quả bất ngờ từ cơn sốt vàng.
Trước tiên, hãy hình dung một khung cảnh: Trong các trung tâm dữ liệu rộng lớn trên khắp Trung Quốc, một số lượng lớn GPU đẳng cấp thế giới được lắp đặt, nhưng chúng đang chờ đợi mà không được sử dụng. Đồng thời, DeepSeek, một công ty AI gần đây đã thu hút sự chú ý với những thành tựu đột phá, lại tuyên bố rằng họ thiếu các tài nguyên tính toán cần thiết để xây dựng các mô hình AI thế hệ tiếp theo. Làm thế nào mà hai tình huống này có thể cùng tồn tại?
Để hiểu điều này, trước tiên chúng ta cần nhìn lại những diễn biến gần đây. Khi Hoa Kỳ hạn chế quyền truy cập của Trung Quốc vào các chip AI tiên tiến nhất, các công ty, chính quyền địa phương và các đại gia viễn thông nhà nước của Trung Quốc đã nhanh chóng hành động như dự kiến. Đó là tích trữ hàng tồn kho.
Con người từ xưa đã tích trữ vật tư khi cảm thấy thiếu thốn. Họ đã mua một lượng lớn chip NVIDIA, xây dựng các trung tâm dữ liệu AI và xây dựng các cụm máy tính khổng lồ để dự đoán nhu cầu trong tương lai. Hơn nữa, người mua Trung Quốc tiếp tục né tránh các hạn chế xuất khẩu của Hoa Kỳ bằng cách đặt hàng chip AI mới nhất của NVIDIA (bao gồm cả dòng Blackwell mới) thông qua các bên thứ ba ở các khu vực lân cận. Tuy nhiên, trong khi chuẩn bị cho một tương lai do AI dẫn dắt, nhiều công ty đã bỏ qua câu hỏi cơ bản: "Chúng ta thực sự sẽ sử dụng tất cả sức mạnh tính toán này để làm gì?"
Giải thích đầu tiên cho nghịch lý này là vấn đề hậu cần và triển khai. Vào năm 2024, Trung Quốc được cho là đã bổ sung ít nhất 1 triệu chip AI để mở rộng năng lực tính toán của mình. Đây là một con số lớn, nhưng người ta cũng ước tính rằng Hoa Kỳ đang vận hành số lượng chip AI gấp nhiều lần con số này. Tuy nhiên, các chip được triển khai ở Trung Quốc không được bố trí để tối ưu hóa hiệu quả. Thay vào đó, chúng được phân tán trong các trung tâm dữ liệu có chất lượng khác nhau, thậm chí được lắp đặt ở những nơi có nhu cầu thấp. Các công ty và chính quyền địa phương muốn tham gia vào cơn sốt AI đã xây dựng cơ sở hạ tầng mà không có chiến lược rõ ràng, dẫn đến một lượng lớn cái gọi là "tài nguyên tính toán chất lượng thấp".
Ví dụ, hãy tưởng tượng một thế giới nơi nhiều người mua hàng triệu cây đàn piano hòa nhạc đắt tiền, tin rằng một ngày nào đó chúng sẽ trở nên hữu ích. Hơn nữa, thay vì đặt những cây đàn piano đó trong các phòng hòa nhạc hoặc trường âm nhạc, họ lại phân tán chúng một cách bừa bãi trong các nhà kho nhỏ. Mặc dù bản thân những cây đàn piano vẫn tồn tại nhưng tiềm năng của chúng hoàn toàn không được khai thác. Đây là bản chất của những gì đã xảy ra trong hệ sinh thái AI của Trung Quốc.
Giải thích thứ hai nằm ở vấn đề thời gian. Vào năm 2023, việc phát triển các hệ thống AI khổng lồ, được gọi là mô hình nền tảng, hỗ trợ mọi thứ từ chatbot đến tự động hóa nhà máy, đã trở nên quá nóng. Tuy nhiên, vào năm 2024, nhiều nỗ lực này đã bị đình trệ. Một số công ty đã rút lui khi nhận thấy sự thiếu hụt tài nguyên, trong khi những công ty khác chuyển trọng tâm từ nghiên cứu AI cơ bản sang phát triển ứng dụng AI. Kết quả là, nhu cầu đào tạo mô hình, vốn là phần tốn kém nhất của AI, đã giảm.
Đồng thời, nhu cầu "suy luận", tức là vận hành các mô hình đã được đào tạo, bắt đầu tăng lên. Tuy nhiên, suy luận đòi hỏi một loại cơ sở hạ tầng khác. Đào tạo mô hình là một quá trình giống như chạy marathon, đòi hỏi các cụm máy tính tập trung, khổng lồ. Mặt khác, suy luận giống như một điệu nhảy phức tạp, triển khai các mô hình AI trong các môi trường khác nhau, từ điện thoại thông minh đến dây chuyền sản xuất của nhà máy. Cơ sở hạ tầng mà Trung Quốc xây dựng vào năm 2023 được thiết kế để đào tạo, vì vậy khi thị trường thay đổi vào năm 2024, đã có sự mất cân bằng giữa tài nguyên đào tạo dư thừa và tài nguyên suy luận khan hiếm.
Điều làm phức tạp thêm vấn đề là sự tồn tại của các cụm GPU 10.000 "ảo" hoặc "giả". Có những công ty mua đủ GPU về mặt lý thuyết để xây dựng các trung tâm tính toán AI quy mô lớn, nhưng trên thực tế lại phân tán chúng trong nhiều trung tâm dữ liệu nhỏ hơn. Nếu không có mạng tốc độ cao và kiến trúc phần mềm phù hợp, các chip này không thể hoạt động như một hệ thống thống nhất.
Đây là một trường hợp điển hình của việc "nhầm lẫn việc tích lũy số lượng với khả năng". Có hàng ngàn GPU không tự động giúp bạn có khả năng nghiên cứu AI cạnh tranh. Nó cũng giống như việc sở hữu 100 chiếc Ferrari không giúp bạn trở thành một đội đua hàng đầu. Nhiều cụm AI ở Trung Quốc được coi là tài sản tài chính hơn là công cụ nghiên cứu thực tế.
Chính phủ Trung Quốc không phải không nhận ra sự kém hiệu quả này. Để đối phó, họ đã chuyển sang chính sách không cho phép xây dựng các trung tâm dữ liệu mới trừ khi chúng đáp ứng các yêu cầu cụ thể về vị trí và cơ sở hạ tầng. Họ cũng đang khuyến khích điện toán đám mây, khuyến khích các công ty chia sẻ tài nguyên tính toán thay vì tích trữ các cụm GPU chuyên dụng của riêng họ. Về lý thuyết, các biện pháp này sẽ tập trung năng lực tính toán chất lượng cao và đưa nó đến tay các nhà nghiên cứu AI thực sự cần nó.
Hơn nữa, chính phủ Trung Quốc đang hạn chế việc xây dựng các trung tâm dữ liệu mới dựa trên các tiêu chí về vị trí và cơ sở hạ tầng, đồng thời khuyến khích điện toán đám mây để sử dụng tài nguyên hiệu quả hơn. Tuy nhiên, câu hỏi đặt ra là những biện pháp này sẽ có ý nghĩa như thế nào trong dài hạn.
Hãy xem xét cơn sốt đường sắt đã xảy ra ở Hoa Kỳ vào thế kỷ 19. Trong cơn cuồng nhiệt công nghiệp hóa, các công ty đã xây dựng đường ray mà không quan tâm đến nhu cầu, dẫn đến một số tuyến đường trở nên vô dụng, trong khi những tuyến đường khác sau đó đã có thể thực hiện vai trò ban đầu của chúng khi các ngành công nghiệp và thành phố xung quanh phát triển. Ban đầu có sự hỗn loạn, nhưng cuối cùng nó đã hội tụ thành một hệ thống hiệu quả hơn.
Điều tương tự có thể xảy ra với cơ sở hạ tầng AI của Trung Quốc. Tình trạng dư cung hiện tại có thể trở thành nền tảng cho bước nhảy vọt của ngày mai. GPU hiện đang không hoạt động có thể được coi là một khoản đầu tư vào tương lai khi các ứng dụng AI trở nên phổ biến rộng rãi. Các công ty hợp nhất tài nguyên tính toán, chuyển sang suy luận và tinh chỉnh các chiến lược triển khai của họ cuối cùng sẽ tồn tại và phát triển. Những công ty không làm như vậy sẽ bị chôn vùi trong biên niên sử về sự trỗi dậy của AI ở Trung Quốc.
Mặc dù những thành tựu của DeepSeek rất đáng chú ý, nhưng không thể bỏ qua rằng quyền truy cập vào các chip tiên tiến vẫn rất quan trọng đối với sự phát triển AI lâu dài. Như một chuyên gia đã nói: "Nếu cần 100.000 chip để đào tạo các mô hình thế hệ tiếp theo, thì các hạn chế xuất khẩu sẽ có tác động lớn đến sự phát triển của các mô hình tiên tiến nhất của Trung Quốc". Động lực AI đang thay đổi nhanh chóng, cả hiệu quả và khả năng tiếp cận phần cứng tiên tiến sẽ đóng một vai trò lớn trong việc định hình tương lai phát triển AI toàn cầu.
Trước tiên, hãy hình dung một khung cảnh: Trong các trung tâm dữ liệu rộng lớn trên khắp Trung Quốc, một số lượng lớn GPU đẳng cấp thế giới được lắp đặt, nhưng chúng đang chờ đợi mà không được sử dụng. Đồng thời, DeepSeek, một công ty AI gần đây đã thu hút sự chú ý với những thành tựu đột phá, lại tuyên bố rằng họ thiếu các tài nguyên tính toán cần thiết để xây dựng các mô hình AI thế hệ tiếp theo. Làm thế nào mà hai tình huống này có thể cùng tồn tại?
Để hiểu điều này, trước tiên chúng ta cần nhìn lại những diễn biến gần đây. Khi Hoa Kỳ hạn chế quyền truy cập của Trung Quốc vào các chip AI tiên tiến nhất, các công ty, chính quyền địa phương và các đại gia viễn thông nhà nước của Trung Quốc đã nhanh chóng hành động như dự kiến. Đó là tích trữ hàng tồn kho.

Con người từ xưa đã tích trữ vật tư khi cảm thấy thiếu thốn. Họ đã mua một lượng lớn chip NVIDIA, xây dựng các trung tâm dữ liệu AI và xây dựng các cụm máy tính khổng lồ để dự đoán nhu cầu trong tương lai. Hơn nữa, người mua Trung Quốc tiếp tục né tránh các hạn chế xuất khẩu của Hoa Kỳ bằng cách đặt hàng chip AI mới nhất của NVIDIA (bao gồm cả dòng Blackwell mới) thông qua các bên thứ ba ở các khu vực lân cận. Tuy nhiên, trong khi chuẩn bị cho một tương lai do AI dẫn dắt, nhiều công ty đã bỏ qua câu hỏi cơ bản: "Chúng ta thực sự sẽ sử dụng tất cả sức mạnh tính toán này để làm gì?"
Vấn đề về tính không hiệu quả
Giải thích đầu tiên cho nghịch lý này là vấn đề hậu cần và triển khai. Vào năm 2024, Trung Quốc được cho là đã bổ sung ít nhất 1 triệu chip AI để mở rộng năng lực tính toán của mình. Đây là một con số lớn, nhưng người ta cũng ước tính rằng Hoa Kỳ đang vận hành số lượng chip AI gấp nhiều lần con số này. Tuy nhiên, các chip được triển khai ở Trung Quốc không được bố trí để tối ưu hóa hiệu quả. Thay vào đó, chúng được phân tán trong các trung tâm dữ liệu có chất lượng khác nhau, thậm chí được lắp đặt ở những nơi có nhu cầu thấp. Các công ty và chính quyền địa phương muốn tham gia vào cơn sốt AI đã xây dựng cơ sở hạ tầng mà không có chiến lược rõ ràng, dẫn đến một lượng lớn cái gọi là "tài nguyên tính toán chất lượng thấp".
Ví dụ, hãy tưởng tượng một thế giới nơi nhiều người mua hàng triệu cây đàn piano hòa nhạc đắt tiền, tin rằng một ngày nào đó chúng sẽ trở nên hữu ích. Hơn nữa, thay vì đặt những cây đàn piano đó trong các phòng hòa nhạc hoặc trường âm nhạc, họ lại phân tán chúng một cách bừa bãi trong các nhà kho nhỏ. Mặc dù bản thân những cây đàn piano vẫn tồn tại nhưng tiềm năng của chúng hoàn toàn không được khai thác. Đây là bản chất của những gì đã xảy ra trong hệ sinh thái AI của Trung Quốc.

Vấn đề về nhu cầu ngắn hạn và dài hạn
Giải thích thứ hai nằm ở vấn đề thời gian. Vào năm 2023, việc phát triển các hệ thống AI khổng lồ, được gọi là mô hình nền tảng, hỗ trợ mọi thứ từ chatbot đến tự động hóa nhà máy, đã trở nên quá nóng. Tuy nhiên, vào năm 2024, nhiều nỗ lực này đã bị đình trệ. Một số công ty đã rút lui khi nhận thấy sự thiếu hụt tài nguyên, trong khi những công ty khác chuyển trọng tâm từ nghiên cứu AI cơ bản sang phát triển ứng dụng AI. Kết quả là, nhu cầu đào tạo mô hình, vốn là phần tốn kém nhất của AI, đã giảm.
Đồng thời, nhu cầu "suy luận", tức là vận hành các mô hình đã được đào tạo, bắt đầu tăng lên. Tuy nhiên, suy luận đòi hỏi một loại cơ sở hạ tầng khác. Đào tạo mô hình là một quá trình giống như chạy marathon, đòi hỏi các cụm máy tính tập trung, khổng lồ. Mặt khác, suy luận giống như một điệu nhảy phức tạp, triển khai các mô hình AI trong các môi trường khác nhau, từ điện thoại thông minh đến dây chuyền sản xuất của nhà máy. Cơ sở hạ tầng mà Trung Quốc xây dựng vào năm 2023 được thiết kế để đào tạo, vì vậy khi thị trường thay đổi vào năm 2024, đã có sự mất cân bằng giữa tài nguyên đào tạo dư thừa và tài nguyên suy luận khan hiếm.
Cụm AI "ảo"
Điều làm phức tạp thêm vấn đề là sự tồn tại của các cụm GPU 10.000 "ảo" hoặc "giả". Có những công ty mua đủ GPU về mặt lý thuyết để xây dựng các trung tâm tính toán AI quy mô lớn, nhưng trên thực tế lại phân tán chúng trong nhiều trung tâm dữ liệu nhỏ hơn. Nếu không có mạng tốc độ cao và kiến trúc phần mềm phù hợp, các chip này không thể hoạt động như một hệ thống thống nhất.
Đây là một trường hợp điển hình của việc "nhầm lẫn việc tích lũy số lượng với khả năng". Có hàng ngàn GPU không tự động giúp bạn có khả năng nghiên cứu AI cạnh tranh. Nó cũng giống như việc sở hữu 100 chiếc Ferrari không giúp bạn trở thành một đội đua hàng đầu. Nhiều cụm AI ở Trung Quốc được coi là tài sản tài chính hơn là công cụ nghiên cứu thực tế.

Chính phủ Trung Quốc không phải không nhận ra sự kém hiệu quả này. Để đối phó, họ đã chuyển sang chính sách không cho phép xây dựng các trung tâm dữ liệu mới trừ khi chúng đáp ứng các yêu cầu cụ thể về vị trí và cơ sở hạ tầng. Họ cũng đang khuyến khích điện toán đám mây, khuyến khích các công ty chia sẻ tài nguyên tính toán thay vì tích trữ các cụm GPU chuyên dụng của riêng họ. Về lý thuyết, các biện pháp này sẽ tập trung năng lực tính toán chất lượng cao và đưa nó đến tay các nhà nghiên cứu AI thực sự cần nó.
Hơn nữa, chính phủ Trung Quốc đang hạn chế việc xây dựng các trung tâm dữ liệu mới dựa trên các tiêu chí về vị trí và cơ sở hạ tầng, đồng thời khuyến khích điện toán đám mây để sử dụng tài nguyên hiệu quả hơn. Tuy nhiên, câu hỏi đặt ra là những biện pháp này sẽ có ý nghĩa như thế nào trong dài hạn.
Tiền lệ lịch sử
Hãy xem xét cơn sốt đường sắt đã xảy ra ở Hoa Kỳ vào thế kỷ 19. Trong cơn cuồng nhiệt công nghiệp hóa, các công ty đã xây dựng đường ray mà không quan tâm đến nhu cầu, dẫn đến một số tuyến đường trở nên vô dụng, trong khi những tuyến đường khác sau đó đã có thể thực hiện vai trò ban đầu của chúng khi các ngành công nghiệp và thành phố xung quanh phát triển. Ban đầu có sự hỗn loạn, nhưng cuối cùng nó đã hội tụ thành một hệ thống hiệu quả hơn.

Điều tương tự có thể xảy ra với cơ sở hạ tầng AI của Trung Quốc. Tình trạng dư cung hiện tại có thể trở thành nền tảng cho bước nhảy vọt của ngày mai. GPU hiện đang không hoạt động có thể được coi là một khoản đầu tư vào tương lai khi các ứng dụng AI trở nên phổ biến rộng rãi. Các công ty hợp nhất tài nguyên tính toán, chuyển sang suy luận và tinh chỉnh các chiến lược triển khai của họ cuối cùng sẽ tồn tại và phát triển. Những công ty không làm như vậy sẽ bị chôn vùi trong biên niên sử về sự trỗi dậy của AI ở Trung Quốc.
Mặc dù những thành tựu của DeepSeek rất đáng chú ý, nhưng không thể bỏ qua rằng quyền truy cập vào các chip tiên tiến vẫn rất quan trọng đối với sự phát triển AI lâu dài. Như một chuyên gia đã nói: "Nếu cần 100.000 chip để đào tạo các mô hình thế hệ tiếp theo, thì các hạn chế xuất khẩu sẽ có tác động lớn đến sự phát triển của các mô hình tiên tiến nhất của Trung Quốc". Động lực AI đang thay đổi nhanh chóng, cả hiệu quả và khả năng tiếp cận phần cứng tiên tiến sẽ đóng một vai trò lớn trong việc định hình tương lai phát triển AI toàn cầu.