NVIDIA GTC 2026: Jensen Huang không chỉ bán chip, ông đang xây dựng cả nền kinh tế AI.

Derpy · 10:02

Mới đây, anh Jensen Huang, CEO của NVIDIA, đã xuất hiện trong chiếc áo khoác da quen thuộc để khai mạc hội nghị GTC 2026. Năm nay, GTC có vẻ khác biệt so với mọi khi. Dù cả thế giới đang mong chờ những chiếc GPU nhanh hơn, nhưng anh Huang lại không mang đến một buổi ra mắt sản phẩm đơn thuần, mà là một câu chuyện lớn về cuộc cách mạng công nghiệp thời đại AI.

NVIDIA đã vẽ nên một bức tranh vĩ đại, định nghĩa rõ ràng về tư liệu sản xuất, phương thức sản xuất, mô hình kinh tế, cùng với nền tảng phần cứng và hệ điều hành sẽ thúc đẩy cuộc cách mạng này. Chỉ trong hai giờ ngắn ngủi, anh Huang đã phác thảo một cách rành mạch tương lai của NVIDIA và cả ngành công nghiệp AI.

Anh Jensen Huang đã đưa ra hai nhận định cốt lõi, làm nền tảng cho chiến lược của NVIDIA. Đầu tiên là "điểm uốn suy luận", nơi AI chuyển từ giai đoạn học hỏi sang giai đoạn làm việc thực tế. Trong hai năm qua, sức mạnh tính toán của AI chủ yếu tập trung vào huấn luyện, khi các doanh nghiệp AI lớn nỗ lực tạo ra những mô hình mạnh mẽ hơn. Quy luật mở rộng (Scaling Law) cũng phát huy tác dụng mạnh mẽ trong giai đoạn này: mô hình càng lớn, dữ liệu càng nhiều thì hiệu suất càng tốt.

Giờ đây, ngành đã vượt qua giai đoạn đó và bước vào thời kỳ bùng nổ của giai đoạn suy luận, với sự ra đời của các sản phẩm như OpenClaw đã giúp các mô hình AI được ứng dụng rộng rãi. Theo anh Huang, lượng tính toán cần cho suy luận có thể gấp hàng chục nghìn, thậm chí hàng trăm nghìn lần so với huấn luyện. Dù là ChatGPT, Gemini, DeepSeek hay Doubao, mỗi cuộc trò chuyện hàng ngày, mỗi lần tạo mã đều là một quá trình suy luận phức tạp. Vì vậy, ngay cả khi chu kỳ ra mắt các mô hình lớn tiên tiến bắt đầu chậm lại, nhu cầu về GPU vẫn tiếp tục tăng vọt. Việc OpenClaw, một sản phẩm mã nguồn mở tiềm ẩn rủi ro bảo mật, lại trở nên phổ biến toàn cầu, càng cho thấy sự tăng trưởng mà chúng ta đang thấy chỉ là phần nổi của tảng băng chìm.

Cùng với "điểm uốn suy luận", anh Huang cũng giới thiệu mô hình kinh tế mới cho các trung tâm dữ liệu, gọi là "kinh tế nhà máy AI". Theo đó, Token sẽ trở thành sản phẩm mới, và trung tâm dữ liệu không còn là nơi lưu trữ dữ liệu tốn kém mà là trung tâm lợi nhuận để sản xuất trí tuệ, hay còn gọi là "nhà máy AI". Sức mạnh tính toán sẽ trở thành một loại tiền tệ mới, có mối liên hệ trực tiếp với token. Chỉ số KPI mới sẽ là số lượng token có thể tạo ra trên mỗi watt điện tiêu thụ. Ở Mỹ, điện năng vẫn là nút thắt vật lý cuối cùng của mọi trung tâm dữ liệu. Việc tối đa hóa sản lượng token trên mỗi watt điện tương đương với việc tối đa hóa doanh thu. Cách giải thích vừa dễ hiểu vừa chính xác này không chỉ giúp các thuật ngữ chuyên ngành trừu tượng của AI trở nên cụ thể hơn, mà còn thu hút tư duy của cả CEO lẫn nhà phát triển vào lĩnh vực mà NVIDIA có lợi thế nhất. Với mô hình kinh tế mới này, tham vọng của NVIDIA đã lộ rõ: họ nắm giữ một lượng lớn "tiền tệ", không chỉ muốn bán "xẻng" cho những người đi "đào vàng", mà còn muốn xây dựng toàn bộ "bản thiết kế nhà máy" và "dây chuyền sản xuất".

Lợi thế lớn nhất của NVIDIA chính là sức mạnh tính toán. Ngoại trừ Google tự phát triển TPU và tạo dựng được chỗ đứng riêng, phần lớn các doanh nghiệp trên thế giới vẫn phụ thuộc vào nguồn cung GPU của NVIDIA. Sự bùng nổ nhu cầu suy luận đồng nghĩa với việc "nhà máy AI" sẽ cần tiêu thụ một lượng năng lượng chưa từng có. Trong bối cảnh đó, NVIDIA đã giới thiệu Vera Rubin, một sản phẩm được quảng bá từ lâu.

Khác với các GPU đơn lẻ được giới thiệu tại các kỳ GTC trước, Vera Rubin là một siêu máy tính cấp tủ rack. Về bản chất, đây là một sản phẩm tích hợp theo chiều dọc cực kỳ tinh vi, kết hợp bảy chip quan trọng như GPU thế hệ mới, CPU được thiết kế đặc biệt cho các tác vụ AI agent, mạng thế hệ mới, bộ nhớ thế hệ mới, cùng với công nghệ làm mát bằng chất lỏng và thiết kế phối hợp chính xác, tất cả được đóng gói trong một tủ rack duy nhất. Kể từ đây, đơn vị cung cấp của NVIDIA đã nâng cấp từ chip lên thành một hệ thống tính toán "cắm và chạy" hoàn chỉnh.

Ngoài ra, hội nghị GTC lần này còn mang đến một bất ngờ công nghệ khác, đó là sự tích hợp công nghệ Groq LPU. NVIDIA đã nhận thấy nhu cầu tính toán AI hiện tại đang có xu hướng cực đoan hóa: một là thông lượng cao, nơi Vera Rubin xuất sắc trong việc thực hiện tính toán song song quy mô lớn, phù hợp cho các tác vụ xử lý hàng loạt; hai là độ trễ cực thấp, nơi Groq LPU có tốc độ phản hồi đơn lẻ cực nhanh, điều này rất quan trọng cho các ứng dụng tương tác. Giải pháp của NVIDIA là "chia để trị" hai khả năng cần thiết này ở cấp độ phần mềm: các phép toán cường độ cao được đặt trên Vera Rubin, còn các tác vụ tạo token cực kỳ nhạy cảm với độ trễ sẽ được giao cho Groq. Giải pháp này đã giúp tăng hiệu suất của các ứng dụng tương tác giá trị cao lên đến 35 lần.

Sản phẩm của "nhà máy AI" không chỉ dừng lại ở token trong thế giới số. Theo anh Jensen Huang, trí tuệ nhân tạo hiện thân (Embodied AI) trong thế giới vật lý rộng lớn hơn còn có tiềm năng rất lớn. Tuy nhiên, chỉ dựa vào dữ liệu từ thế giới thực, việc huấn luyện robot để đối phó với mọi tình huống bất ngờ có lẽ là không bao giờ đủ. Giải pháp nằm trong mô hình kinh tế mới mà anh ấy đã đề xuất: sức mạnh tính toán chính là tiền tệ, và tiền tệ có thể mang lại dữ liệu. Thông qua nền tảng mô phỏng để tạo ra lượng lớn dữ liệu tổng hợp chất lượng cao, huấn luyện AI trong thế giới ảo, sau đó triển khai vào robot trong thế giới thực. Con đường "Sim-to-Real" này có lẽ là chìa khóa để giải quyết vấn đề thông minh hóa robot.

Tất nhiên, chủ nghĩa lạc quan công nghệ mù quáng là không nên, vì khả năng cơ bản của các mô hình AI hiện tại vẫn chưa đủ để hỗ trợ việc thương mại hóa trí tuệ nhân tạo hiện thân. Tuy nhiên, dù là mô hình nền tảng robot tổng quát GR00T hay mô hình lái xe tự động Alpamayo có khả năng suy nghĩ và lập luận, tất cả đều chứng minh rằng NVIDIA đang đưa năng suất từ "nhà máy AI" vào các ngành sản xuất và ô tô trị giá 50 nghìn tỷ USD (khoảng 1,27 triệu tỷ VNĐ).

Một "lò phản ứng hạt nhân" mạnh mẽ như Vera Rubin đã ra đời, vậy câu hỏi tiếp theo là làm thế nào để nó hoạt động hiệu quả 24/7. Câu trả lời cho vấn đề này cũng nằm ở cấp độ phần mềm. Blog công nghệ Dynamo 1.0 mà NVIDIA công bố cùng thời điểm với hội nghị GTC đã chính thức công khai "bộ não" điều khiển "nhà máy AI". Dynamo là một khung phần mềm được thiết kế đặc biệt cho suy luận AI quy mô lớn, đa nút, cấp doanh nghiệp. Nếu Vera Rubin là dây chuyền sản xuất phần cứng token, thì Dynamo chính là bộ điều khiển của dây chuyền đó. Nó không trực tiếp sản xuất token nhưng đảm bảo hiệu quả, tốc độ và sự ổn định của quy trình sản xuất.

Cụ thể, Dynamo đã đạt được những đột phá công nghệ ở các khía cạnh sau: trên nền tảng Vera Rubin, Dynamo có thể tăng khả năng xử lý yêu cầu suy luận của mô hình lên khoảng 7 lần thông qua các công nghệ như dịch vụ tách rời, trực tiếp nâng cao "chỉ số KPI" cốt lõi. Khi AI phát triển từ Chatbot thành Agent, quy trình làm việc của các tác nhân thông minh cần trải qua nhiều vòng đối thoại, suy nghĩ nền, gọi công cụ và các quy trình phức tạp khác. Dynamo có khả năng "nhận biết tác nhân" (Agent-aware), có thể hiểu mức độ ưu tiên của nhiệm vụ thông qua gợi ý tác nhân (Agent Hints), ưu tiên xử lý các nhiệm vụ quan trọng, giảm thời gian phản hồi đầu tiên của ứng dụng tác nhân xuống 4 lần. Các ứng dụng AI hiện đại thường xuyên cần khởi động các phiên bản mô hình mới, nhưng theo cách truyền thống, việc tải, biên dịch và tối ưu hóa mô hình tốn thời gian và công sức. Công nghệ ModelExpress của Dynamo, thông qua các phương pháp như khôi phục điểm kiểm tra và truyền tải trọng số mô hình, đã tăng tốc thời gian khởi động phiên bản mới lên 7 lần, giúp "nhà máy AI" sản xuất linh hoạt hơn. Việc triển khai các mô hình lớn vẫn còn quá khó khăn đối với hầu hết mọi người. Chức năng DGDR của Dynamo cho phép nhà phát triển chỉ cần cung cấp mô hình, phần cứng và mục tiêu lưu lượng, hệ thống sẽ tự động hoàn thành phân tích hiệu suất, cấu hình và triển khai. Sự ra đời của Dynamo đã chứng minh hoàn hảo rằng sự dẫn đầu của NVIDIA không còn chỉ giới hạn ở cấp độ phần cứng, mà còn có khả năng kỹ thuật phần mềm và hệ thống sâu sắc.

Tóm lại, "hào sâu" mà NVIDIA xây dựng thông qua GPU giờ đây đã mở rộng sang chiến lược hệ sinh thái. Trong bài phát biểu của mình, anh Jensen Huang đã ví OpenClaw, một khung tác nhân mã nguồn mở, như Linux của thời đại AI, và dự đoán nó sẽ trở thành hệ điều hành thế hệ tiếp theo, chắc chắn sẽ mở ra một kỷ nguyên "Agent-as-a-Service" hoàn toàn mới. Trước đây, chúng ta từng nhắc đến một sản phẩm nền tảng tên là NemoClaw, và giờ đây nó đã chính thức được phát hành. Mục tiêu của NVIDIA chỉ có một: trở thành người đặt ra tiêu chuẩn và người bảo vệ an toàn cho cuộc cách mạng công nghệ này, để mọi doanh nghiệp đều có thể yên tâm tham gia vào làn sóng "nuôi tôm" này.

Chiến lược tương tự cũng được áp dụng cho các mô hình nền tảng của tác nhân thông minh. Thông qua việc thành lập liên minh Nemotron, NVIDIA đã hợp tác với các công ty AI nổi tiếng như Mistral và Perplexity, nhằm cùng nhau xây dựng các mô hình nền tảng thế hệ tiếp theo. Bằng cách này, phần mềm của hệ sinh thái AI sẽ được gắn kết sâu sắc hơn với phần cứng của NVIDIA. Đây chính là sự khéo léo của anh Jensen Huang: từ chip (Rubin), hệ thống (tủ rack), mạng (NVLink), phần mềm (Dynamo), hệ điều hành (NemoClaw) đến mô hình AI (Nemotron), NVIDIA đã đạt được nghiên cứu và phát triển sâu rộng cùng thiết kế phối hợp tối ưu ở mọi khâu. Mô hình tích hợp theo chiều dọc này mang lại hiệu suất và hiệu quả mà các đối thủ cạnh tranh khó có thể sánh kịp.

Đồng thời, NVIDIA cũng không cố gắng độc chiếm thị trường. Việc hợp tác với các nhà cung cấp dịch vụ đám mây lớn và các công ty khởi nghiệp AI, bề ngoài là "trao quyền cho tất cả mọi người", "mang khách hàng đến cho các nhà cung cấp đám mây", nhưng thực chất là nhúng bộ công nghệ của mình vào các nền tảng tính toán toàn cầu, khiến toàn bộ hệ sinh thái được xây dựng trên nền tảng công nghệ của NVIDIA.

Nếu nhìn lại GTC 2026 trong tương lai, có lẽ đó sẽ là một bước ngoặt của thời đại. NVIDIA đã xây dựng một chu trình kinh tế hoàn toàn mới, với token là hàng hóa, sức mạnh tính toán là tiền tệ, và "nhà máy AI" là đơn vị sản xuất cốt lõi. Trong chu trình này, NVIDIA có công cụ sản xuất hiệu quả nhất, hệ thống quản lý sản xuất thông minh nhất, và thậm chí còn định nghĩa các tiêu chuẩn sản xuất. Họ không còn là một nhà cung cấp GPU đơn thuần, mà là người xây dựng cơ sở hạ tầng và nền kinh tế AI. Trong tương lai, sự phụ thuộc sẽ ngày càng chặt chẽ hơn. #NVIDIADLSS5

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

NVIDIA GTC 2026: Jensen Huang không chỉ bán chip, ông đang xây dựng cả nền kinh tế AI.

Derpy

Intern Writer

Derpy

Vì sao AI đang khiến hacker đi trước doanh nghiệp một bước?

85% người dùng vẫn Google lại sau khi đã hỏi AI. Có chuyện gì vậy?

Anthropic và Lầu Năm Góc đối đầu: Cuộc chiến kiểm soát AI quân sự

Anthropic kiện chính phủ Mỹ, chính phủ Mỹ muốn loại bỏ Claude. Chuyện gì sẽ tiếp theo?

Dell "bắt tay" NVIDIA thương mại hóa siêu máy tính để bàn Dell Pro Max chuyên chạy tác nhân AI tự chủ

AI tạo hình ảnh marketing trực tiếp đối đầu Canva và Adobe

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

NetApp ra mắt hệ thống lưu trữ EF-Series hiệu năng cao

Đánh giá nổi bật