Vị “vua” mới Nvidia sợ nhất điều gì? Giải pháp nào chế ngự nó?

Thoại Viết Hoàng · 26/06/2024

Người bán xẻng sợ nhất điều gì? Thứ nhất, anh ta sợ mỏ vàng sẽ không sinh ra vàng; thứ hai, anh ta sợ cái giỏ không đủ để chứa vàng; và thứ ba, anh ta sợ người đào sẽ tự làm xẻng.

Đây là lý do tại sao dù Nvidia là vị vua mới, Huang Renxun (Hoàng Nhân Huân) vẫn nói: “Chúng tôi vẫn còn 30 ngày nữa sẽ phá sản” để không ngủ quên trên chiến thắng.

Theo The Information, Huang đã thảo luận một vấn đề nghiêm trọng với các giám đốc điều hành vào dịp Giáng sinh năm ngoái: Nếu không gian trung tâm dữ liệu của khách hàng không đủ, GPU có cũng trở thành vật trang trí.

Ngay sau cuộc họp, NVIDIA bắt đầu "bóng gió" với các nhà cung cấp dịch vụ đám mây: Thưa quý vị, ở nhà quý vị có đủ không gian và điện không? Nó có thể chứa GPU của chúng tôi không? Cho tôi xem bằng chứng chứng tỏ thực lực của mình, nếu không tôi sẽ không thu xếp giao hàng cho quý vị nữa.

Sau đó, một câu hỏi nghiêm túc khác lại xuất hiện trước mặt Huang: Nếu nhà đầu tư không cho khách hàng đốt tiền thì sao?

Hiện tại, Microsoft, Meta, OpenAI và xAI đều có nhu cầu sử dụng GPU để huấn luyện các mô hình AI thử nghiệm. Nhưng những mô hình này không tạo ra doanh thu một cách nhanh chóng. Các nhà đầu tư không hài lòng và hậu quả là nghiêm trọng, các công ty công nghệ lớn có thể mua ít GPU hơn. Ví dụ, vào tháng 4 năm nay, ngay sau khi Zuckerberg thừa nhận thu nhập của công ty không chắc chắn, giá cổ phiếu của Meta đã lao dốc.

Vì vậy Huang Renxun đã nghĩ đến "công ty xẻng" trước đây - Cisco.

Nó cũng cực kỳ chắc chắn; nó cũng là một ông vua chứng khoán tăng vọt; Sự khác biệt là một bên trỗi dậy trong thời đại Internet và đã sa sút, trong khi một bên trỗi dậy trong thời đại AI và đang ở đỉnh cao. Làm thế nào để tránh trở thành Cisco tiếp theo khiến người đàn ông 60 tuổi khoe hình xăm và cơ bắp của mình lo lắng.

NVIDIA sử dụng tấn công làm phòng thủ

Chiêu thứ nhất - thần thông khóa cổ, phân bổ tài nguyên chặt chẽ

Cách đây một thời gian, người đứng đầu một công ty điện toán đám mây nhỏ đã nói: “Việc mong đợi AWS triển khai đám mây GPU cũng giống như việc bước vào Ford và yêu cầu họ sản xuất Tesla Model Y”. Mọi người đều biết rằng việc cạnh tranh với điện toán đám mây AWS là một điều ngu ngốc. Trừ khi bạn có một người cha tốt. Người gây ra "chuyện hoang đường" như vậy chính là "con cưng" của Nvidia – nhà cung cấp dịch vụ cloud CoreWeave.

GPU khan hiếm đến mức nào? So sánh với kháng sinh penicillin đi cho dễ hình dung. Huang đã nắm chắc trong tay “quyền phân bổ” GPU để ngăn chặn bất kỳ đại gia nào tích trữ quá nhiều. Truyền miệng kể rằng người sáng lập Oracle, Larry Ellison và bạn của ông, Elon Musk, từng cầu xin Huang một giờ tại một nhà hàng Nhật Bản sang trọng ở Thung lũng Silicon.

Nếu quý vị đang vội sử dụng nó thì sao? Đi đến chỗ con trai tôi để lấy hàng.

CoreWeave kiêu ngạo đến mức nào? Vào tháng 8 năm ngoái, CoreWeave đã sử dụng Nvidia H100 làm tài sản thế chấp và thu được khoản vay 2,3 tỷ USD. Năm 2022, doanh thu của công ty vẫn là 25 triệu USD. Sau đó, nhờ cho thuê GPU, doanh thu sẽ tăng vọt lên 440 triệu USD. Số tiền thật tăng vọt này là khoản tiền Microsoft trả trong nước mắt.

Các đại gia thực sự đang gặp khó khăn. H100 vẫn chưa được phân phối, H200 lại xuất hiện và GB200 đang trên đường ra mắt. Nhưng bạn phải đặt hàng. Một mặt, Định luật Huang không phải là kiểu “vắt kem đánh răng” như Apple; mặt khác, cuộc chạy đua vũ trang AI đang nóng lên và các mô hình lớn của các đại gia công nghệ không thể thua được.

Chiêu thứ hai - ép mua bán

Dưới áp lực mạnh mẽ, nhất định phải có sự phản kháng, chưa kể một người khổng lồ không bao giờ phải nhìn mặt người khác xem thái độ họ thế nào. Về vấn đề này, mỗi công ty hoặc đã phát triển chip điện toán của riêng mình hoặc tìm ra một lối thoát khác và đã ngầm đạt được một "liên minh chống NVIDIA".

Phản ứng của Huang Renxun là “bán bia kèm lạc”.

Khi Nvidia giới thiệu GB200, hãng kêu gọi khách hàng thay thế bằng giá đỡ máy chủ Nvidia trong trung tâm dữ liệu. Lý do: Sử dụng một bộ hoàn chỉnh có thể cải thiện đáng kể hiệu suất GPU.

Tuy nhiên, những người trong cuộc và một số khách hàng của NVIDIA tin rằng sẽ rất rắc rối nếu sử dụng những giá đỡ tùy chỉnh này để thay thế những con chip khác trong tương lai.

Andrew Bell, phó chủ tịch Nvidia, cho biết: “Ai mua kệ sẽ được ưu tiên lấy GB200”.

Được biết, Microsoft và Nvidia đã tranh cãi về "vấn đề kệ" trong vài tuần. Một người trong cuộc tham gia vào cuộc đàm phán tiết lộ rằng việc sử dụng giá đỡ tùy chỉnh của Nvidia sẽ khiến Microsoft không thể chuyển đổi qua lại giữa các chip AI khác nhau một cách trơn tru.

Rõ ràng, đây không phải là lần đầu tiên Microsoft thua lỗ. Trước đó, để được ưu tiên vận chuyển, Microsoft đã mua cáp mạng của Nvidia. Tuy nhiên, khi giải quyết xong các khoản vào đầu năm 2023, người ta phát hiện ra rằng 1/3 số tiền trả cho Nvidia thực tế đã được chi cho những thiết bị "rác rưởi" này.

Kết quả hiện tại là Giám đốc điều hành Microsoft Satya Nadella và CTO Kevin Scott đã ra tay và có thể khiến Nvidia lùi lại một bước và không còn ép buộc “mua lạc” nữa.

Tuy nhiên, theo nhân viên của Nvidia, Google và AWS vẫn thua và sẽ buộc phải sử dụng giá đỡ tùy chỉnh GB200.

Ngoài ra, điều cần cân nhắc là nếu mô hình “bán bia kèm lạc” này được đổi mới và trở thành thông lệ sẽ khiến Dell, HPE và Supermicro gặp rủi ro.

Bằng cách này, Nvidia không chỉ xúc phạm Bên A mà còn ăn trộm bánh mì của Bên B. Không dễ để tạo ra kẻ thù bốn phía. Không có gì lạ khi Huang đã mặc áo hoàng bào nhưng không khỏi lo lắng.

Động tác thứ ba – tự tạo ra những đám mây

Ngoài việc hỗ trợ các nhà cung cấp dịch vụ điện toán đám mây quy mô nhỏ như CoreWeave làm “con đỡ đầu” của mình, NVIDIA cũng đang xây dựng đám mây của riêng mình.

Tại hội nghị GTC 2023 vào tháng 3 năm ngoái, Huang lần đầu tiên phát hành sản phẩm đám mây DGX Cloud. Người dùng có thể nhận các sản phẩm và dịch vụ AI của NVIDIA tại địa phương hoặc tại các trung tâm dữ liệu địa phương hàng tháng và giao tiếp trực tiếp với khách hàng - Microsoft. , AWS "xé toạc".

DGX Cloud chỉ là một hình thức "phân phối" khác vì nó được lưu trữ trên nền tảng đám mây của người khác. Nói cách khác, NVIDIA là “đại lý đồ cũ” giữa các công ty AWS và AI. Đối mặt với một thỏa thuận bá chủ như vậy, ban đầu AWS từ chối tuân thủ nhưng cuối cùng buộc phải chấp nhận.

Tính đến cuối năm ngoái, hoạt động kinh doanh trên nền tảng đám mây của Nvidia đã đóng góp khoảng 1 tỷ USD, khoảng 1% tổng doanh thu của công ty. Để so sánh, doanh số GPU năm ngoái là 47,5 tỷ USD.

DGX Cloud dù không mang lại nhiều lợi nhuận nhưng lại là một “lối thoát” tốt. Sasha Ostojic, cựu giám đốc điều hành Nvidia và đối tác hiện tại của công ty đầu tư mạo hiểm Playground Global, cho biết kinh doanh phần mềm và đám mây có thể tạo ra hàng tỷ đô la mỗi năm, điều này không phải ai cũng công nhận đầy đủ. Ông nói thêm: Nvidia có "tất cả các đòn bẩy" để phát triển các dịch vụ bổ sung cho chip của mình.

Hơn nữa, DGX Cloud còn có thể giúp các khách hàng khác chuyển sang sử dụng chip thế hệ mới. Ví dụ: nhà sản xuất phần mềm ServiceNow trước đây mua máy chủ NVIDIA cho trung tâm dữ liệu của riêng mình nhưng giờ lại thuê máy chủ trực tiếp từ NVIDIA.

Trên thực tế, vào mùa thu năm ngoái, Huang đã bắt đầu cân nhắc việc xây dựng trung tâm dữ liệu của riêng mình để phát triển DGX Cloud, nhằm vượt qua các nhà cung cấp dịch vụ đám mây khác. Gần đây, Nvidia cũng đã chiêu mộ Alexis Black Bjorlin từ Meta để chịu trách nhiệm kinh doanh đám mây, nhưng không rõ liệu họ có bắt đầu việc này hay không.

Nhân viên bán hàng của NVIDIA đã theo dõi thông tin tình báo từ mọi góc độ. Khi họ bán chip cho khách hàng hiện tại, họ sẽ hỏi ba câu hỏi: Họ bán chip cho ai? Chính xác thì nó được sử dụng để làm gì? Hợp đồng thuê trông như thế nào?

Mục tiêu của Huang được mọi người biết đến như ông đã nói: "Mục tiêu của tôi là tất cả các công ty trên thế giới... sẽ chạy trên NVIDIA AI Enterprise".

Sợ nhất lặp lại sai lầm giống nhau

Nói như vậy, nguyên nhân khiến Huang lo lắng và “điểm lo lắng” của ông đều liên quan đến sự sụp đổ của “công ty xẻng” nổi tiếng Cisco. Vậy Nvidia và Cisco giống nhau như thế nào?

Nvidia tập trung vào GPU, vốn rất cần thiết cho các công ty AI, trong khi Cisco tập trung vào các thiết bị chuyển mạch và bộ định tuyến, cũng là những phần cứng thiết yếu cho tất cả các công ty Internet.

Đầu những năm 1990, công nghệ Internet được các nhà đầu tư xác định là xu hướng của tương lai. Vào thời điểm đó, tầng ứng dụng chưa có nhiều tiếng vang và Cisco, hãng “bán xẻng” trở thành công ty được hưởng lợi nhiều nhất.

Kể từ khi niêm yết vào năm 1990 cho đến năm 2000, giá cổ phiếu của Cisco gần như tăng gấp đôi mỗi năm, với tốc độ tăng trưởng hàng năm là 104% trong 10 năm. Nó từng trở thành công ty lớn nhất trên thị trường chứng khoán Mỹ với giá trị vốn hóa thị trường hơn 500 tỷ USD. Ngay cả trước thời điểm bong bóng Internet xảy ra năm 2000, công ty vẫn duy trì mức tăng trưởng trên 40%. Đồng thời, tỷ suất lợi nhuận gộp của Cisco vẫn duy trì ở mức trên 65% quanh năm.

Vào thời điểm đó, Phố Wall đã gọi điện cho Microsoft, Intel và Cisco. Họ tin rằng ba công ty này sẽ thống trị hoàn toàn toàn bộ kỷ nguyên Internet - Microsoft sản xuất phần mềm, Intel sản xuất chip và Cisco sẽ thống trị thị trường mạng và phần cứng Internet.

Sự thất bại của Cisco bắt đầu từ bong bóng Internet vào đầu năm 2000.

Vào tháng 3/2000, một số công ty Internet nhỏ lần lượt bị phá sản, và tình trạng suy thoái càng trở nên trầm trọng hơn do làn sóng đổ bộ của các công ty hiện có vào lĩnh vực Internet. Mọi người đang cắt giảm thực phẩm và quần áo, và nhu cầu chung của toàn ngành đang chậm lại. Nhiều công ty Internet đã chỉ ra trong báo cáo tài chính rằng họ sẽ giảm quy mô mua phần cứng trong tương lai.

Lúc này, hiệu suất của các nhà cung cấp phần cứng Internet như Nortel, Juniper, Lucent bắt đầu giảm mạnh nhưng hiệu suất của Cisco hầu như không bị ảnh hưởng và vẫn duy trì tốc độ tăng trưởng hơn 60%.

Vào thời điểm đó, một số nhà phân tích giải thích "hiện tượng Cisco" là rào cản kỹ thuật cho phép họ cướp thị phần từ đối thủ trong môi trường khó khăn. Điều này cũng "đánh lừa" ban lãnh đạo Cisco. Họ nói với Phố Wall rằng họ lạc quan và không thấy bất kỳ dấu hiệu nào cho thấy nhu cầu đang chậm lại trong khi họ đẩy nhanh việc mua thiết bị và tiếp tục tăng lượng hàng tồn kho.

Hai quý sau, giá cổ phiếu của Cisco giảm mạnh 60%. Trong những năm tiếp theo, phần cứng của Cisco bị các hãng cùng ngành sao chép rộng rãi, khiến doanh số bán hàng của hãng không bao giờ trở lại thời kỳ đỉnh cao.

Tóm lại, sự thất bại của Cisco là do những quyết định “ngạo mạn” của ban lãnh đạo trong thời kỳ bong bóng Internet.

Nhưng Huang Renxun không hề kiêu ngạo chút nào, ông ấy là người thường xuyên nhắc nhở về viễn cảnh “công ty sắp sụp đổ”.

Do đó, chỉ có hai vấn đề thực sự mà Nvidia phải đối mặt.

Câu hỏi đầu tiên là liệu nhu cầu AI có trở thành bong bóng không?

Theo Coatue, “Vua phố Wall TMT”, AI không những không phải là thứ cường điệu mà thời kỳ hoàng kim của nó vẫn chưa đến.

Sự cường điệu có ba đặc điểm chính: 1. Giá trị được ghi nhận không tương xứng với số tiền đầu tư, như trường hợp cáp quang những năm 1990; 2. Thời gian và khả năng phát triển công nghệ được đánh giá quá cao, như trong lĩnh vực lái xe tự động; công nghệ này dẫn đến thiếu tính thực tiễn phổ quát, như trong điện toán lượng tử.

Một mặt, hầu hết các khoản đầu tư AI đều tập trung vào cấp độ mô hình (60%) và giá trị được ghi nhận đã xuất hiện. Mặt khác, lớp ứng dụng AI đang bùng nổ với những cơ hội to lớn và nhiều lĩnh vực khác nhau đã chứng minh tính thực tiễn của nó. Nhà phát triển tiết kiệm 55% thời gian sử dụng CopilotGithub; chỉnh sửa video trên Runway tiết kiệm 90% thời gian, v.v. Ngay cả trong giai đoạn đầu, 60% công ty có kế hoạch áp dụng AI. Ngoài ra, so sánh thời gian để các công nghệ mới đạt được 50% mức độ thâm nhập của người dùng ở Hoa Kỳ thì PC phải mất 20 năm, Internet là 12 năm, điện thoại thông minh là 6 năm và AI chỉ mất khoảng 3 năm.

Nhưng nếu chúng ta nghĩ theo cách khác, định nghĩa về "sự cường điệu" này sẽ rộng hơn một chút đối với các công ty "xẻng".

Ví dụ, bạn có thể nói rằng công nghệ Internet là sự cường điệu hóa không? Một mặt, phải mất 10 năm công nghệ Internet mới thực sự nổi lên cho đến khi bong bóng vỡ; mặt khác, sau bong bóng Internet, ngành này đã phát triển toàn diện trong khoảng 20 năm tới. Nhưng chỉ cần khoảng thời gian “bong bóng” ngắn ngủi như vậy cũng có thể khiến một công ty xẻng đang phát triển mạnh mẽ lụi tàn.

Điều này cũng khẳng định nỗi lo của Huang - Lợi nhuận LLM không chắc chắn, nhà đầu tư không để khách hàng đốt tiền thì phải làm sao?

Cũng giống như nhiều công ty Internet đang ráo riết tích trữ hàng hóa và chộp lấy phần cứng của Cisco với giá cao, giờ đây GPU của Nvidia cũng đang được thổi phồng là “penicillin”. Điều cần đề phòng là nếu các ứng dụng AI không thể kiếm tiền thì một số nhu cầu phi lý sẽ tiêu tan, điều này chắc chắn sẽ ảnh hưởng đến ngai vàng của Nvidia.

Từ góc độ này, sự “phân phối nghiêm ngặt” của Huang Renxun quả thực có hiệu quả.

Câu hỏi thứ hai là khả năng của đối thủ là gì?

AMD tích hợp CPU và GPU; Intel, với tư cách là người sáng lập kiến trúc x86, hiện cũng tham gia vào lĩnh vực thẻ tăng tốc AI. Nhưng hiện tại họ chỉ là "những lựa chọn thay thế" không thể có được Nvidia, và họ là những đối thủ đang để mắt tới nhưng không gây ra mối đe dọa thực sự.

Những gã khổng lồ bị bầy sói vây quanh - Microsoft đang nắm giữ cả phần mềm và phần cứng; Google đang xây dựng TPU mạnh mẽ nhất;…

Theo suy đoán của Bloomberg, Microsoft đóng góp 15%, Meta đóng góp 13%, AWS và Alphabet mỗi bên đóng góp 6% tổng doanh thu của Nvidia trong quý gần nhất.

Mặc dù những khách hàng này, những người đóng góp một nửa đất nước, chưa đe dọa được NVIDIA về mặt chip tự phát triển nhưng vẫn có sự đồng thuận: “NVIDIA sẽ không luôn độc quyền trên thị trường chip đào tạo và suy luận quy mô lớn”.

Giống như hồi đó Cisco có những lợi thế công nghệ vô song, Nvidia bây giờ cũng vậy. Nhưng nếu chu kỳ này kéo dài thì hào công nghệ có thể tiếp tục chảy trong bao lâu? Ví dụ, 5 năm nữa, 10 năm nữa? Xét cho cùng, Cisco đã tự hào trong 10 năm qua. Điều cần suy nghĩ là: khi nhu cầu đào tạo AI lên đến đỉnh điểm và nhu cầu suy luận tăng lên đáng kể, liệu thị trường có còn thèm khát NVIDIA đến vậy khi công nghệ chung trong ngành tăng lên đến một ngưỡng nhất định, liệu chất lượng cao có còn cao? và phần cứng giá rẻ trở nên phổ biến hơn?

Huang Renxun từng nói: "Chạy đi kiếm miếng ăn, hoặc chạy để không bị người khác coi là đồ ăn. Trong cả hai trường hợp, hãy tiếp tục chạy". Có lẽ Nvidia, vốn đang tăng tốc, sẽ vượt qua rủi ro.