Thị trường Việt Nam vừa xuất hiện "siêu máy tính mini" chuyên để đào tạo AI, giá từ 115 triệu đồng

Nhật Quang
Nhật Quang
Phản hồi: 0

Nhật Quang

Editor
Thành viên BQT
Thị trường máy tính hiệu năng cao tại Việt Nam vừa chứng kiến sự xuất hiện của một thiết bị mang tính đột phá: ASUS Ascent GX10. Đây không phải là một chiếc máy tính mini (mini PC) thông thường, mà là một "siêu máy tính trên bàn làm việc" (desktop supercomputer) được thiết kế chuyên dụng cho việc vận hành và huấn luyện các mô hình ngôn ngữ lớn (LLM).

1763194377148.jpeg

Với sức mạnh xử lý AI đạt 1 petaflop, khả năng xử lý các mô hình lên đến 200 tỷ tham số và mức giá khởi điểm từ 115 triệu đồng, Ascent GX10 hứa hẹn sẽ "dân chủ hóa" việc phát triển trí tuệ nhân tạo, mang công nghệ AI tại chỗ đến gần hơn với các doanh nghiệp, nhà nghiên cứu và các tổ chức giáo dục.

Sức mạnh đến từ "siêu chip" NVIDIA GB10 Grace Blackwell

Sức mạnh của Ascent GX10 không đến từ các linh kiện PC tiêu dùng, mà từ một "siêu chip" chuyên dụng của NVIDIA: NVIDIA GB10 Grace Blackwell. Đây là một kiến trúc đột phá, kết hợp CPU và GPU trên cùng một bo mạch với một liên kết siêu tốc, nhằm loại bỏ các nút thắt cổ chai truyền thống và tối ưu hóa cho các tác vụ AI.

1763194393665.jpeg

Cụ thể, con chip này bao gồm một CPU ARM Neoverse V2 với 20 lõi hiệu năng cao, chịu trách nhiệm xử lý và sắp xếp dữ liệu, và một GPU được trang bị lõi Tensor Cores thế hệ thứ năm, được thiết kế đặc biệt để xử lý các phép toán ma trận phức tạp của AI. Sự kết hợp này mang lại cho cỗ máy một hiệu suất tính toán AI lên tới 1 petaflop (tương đương một triệu tỷ phép tính mỗi giây).

Điểm mấu chốt của kiến trúc này là 128 GB bộ nhớ RAM LPDDR5X hợp nhất. Không giống như máy tính truyền thống, nơi CPU và GPU có bộ nhớ riêng biệt và phải giao tiếp qua khe cắm PCIe chậm chạp, bộ nhớ của GX10 được chia sẻ chung. Công nghệ liên kết NVLink C2C cung cấp một mô hình bộ nhớ đồng nhất với băng thông 272 GB/giây, được cho là gấp 5 lần so với chuẩn PCIe 5.0. Điều này cho phép con chip xử lý các mô hình AI lớn một cách mượt mà, khi cả CPU và GPU đều có thể truy cập chung vào một không gian bộ nhớ rộng lớn.

1763194408284.jpeg

Tuy nhiên, cần phải làm rõ rằng, dù 128GB là một con số khổng lồ, băng thông bộ nhớ LPDDR5X vẫn thấp hơn so với bộ nhớ HBM (High Bandwidth Memory) chuyên dụng trên các cụm GPU trị giá hàng triệu USD trong các trung tâm dữ liệu. Điều này định vị Ascent GX10 một cách rõ ràng: đây không phải là một giải pháp thay thế cho các siêu máy tính đám mây dùng để huấn luyện các mô hình nền tảng (Foundation Models) từ đầu. Thay vào đó, nó là một công cụ cực kỳ mạnh mẽ cho các nhà phát triển, các viện nghiên cứu, hay trường đại học, sinh viên và doanh nghiệp thực hiện các tác vụ nghiên cứu, tinh chỉnh (fine-tuning) và suy luận (inference) các mô hình quy mô nhỏ và vừa ngay tại chỗ.

Phá vỡ giới hạn 200 tỷ tham số và khả năng mở rộng linh hoạt

Khả năng thực tế của Ascent GX10 là điều gây chú ý nhất. Cỗ máy này có khả năng xử lý, tinh chỉnh và huấn luyện cục bộ các mô hình ngôn ngữ lớn (LLM) có quy mô từ 130 tỷ đến 200 tỷ tham số. Đây là một năng lực tính toán mà chỉ vài năm trước đây còn là đặc quyền của các tập đoàn công nghệ lớn nhất thế giới, đòi hỏi những hệ thống máy chủ đắt đỏ. Giờ đây, sức mạnh đó đã được gói gọn trong một thiết bị có thể đặt ngay trên bàn làm việc.

1763194418900.jpeg

Để có thể mở rộng giới hạn này, ASUS đã trang bị cho GX10 một cổng kết nối chuyên dụng ConnectX CX-7 SmartNIC 200 Gb/giây. Thông qua một sợi cáp đặc biệt, người dùng có thể kết nối hai máy GX10 lại với nhau. Khi được ghép nối, hai cỗ máy sẽ hoạt động như một hệ thống duy nhất, tăng gấp đôi hiệu năng và bộ nhớ, cho phép xử lý các mô hình AI phức tạp lên đến 405 tỷ tham số. Đây là một lộ trình nâng cấp rõ ràng, cho phép các nhóm nghiên cứu có thể mở rộng quy mô khi dự án của họ phát triển mà không cần phải thay thế toàn bộ hệ thống.

1763194434652.jpeg
1763194448352.jpeg
1763194490421.jpeg

Máy có hai phiên bản bộ nhớ trong là 1TB và 4TB SSD NVMe, sử dụng chuẩn PCIe Gen5x4 tốc độ cao để đảm bảo việc tải các mô hình AI và các tập dữ liệu lớn diễn ra nhanh chóng.

Thiết kế tản nhiệt chuyên dụng cho vận hành liên tục

Một trong những thách thức lớn nhất của việc "đưa siêu máy tính lên bàn làm việc" chính là vấn đề tản nhiệt. Việc vận hành các tác vụ AI nặng có thể khiến các con chip hoạt động ở 100% công suất trong nhiều giờ, thậm chí nhiều ngày liên tục. Ascent GX10, với trọng lượng chỉ 1,48 kg và kích thước 150 x 150 x 51 mm, đã được thiết kế với một hệ thống tản nhiệt chuyên dụng.

1763194504913.jpeg

Toàn bộ thân máy được làm từ khung nhôm nguyên khối, vừa tạo sự chắc chắn, vừa hoạt động như một bộ tản nhiệt thụ động khổng lồ. Bên trong là một hệ thống tản nhiệt chủ động với quạt kép và 7 cấp độ kiểm soát nhiệt độ thông qua phần mềm. Hệ thống này hút không khí mát từ đáy và thổi luồng khí nóng ra phía sau, một thiết kế tản nhiệt hiệu quả thường thấy trên các máy trạm chuyên nghiệp. Theo nhà sản xuất, thiết kế này có hiệu quả tản nhiệt cao gấp 1,6 lần so với các hệ thống nhỏ gọn tương đương, cho phép máy duy trì nhiệt độ ổn định (khoảng 50-60 độ C) ngay cả khi hoạt động dưới tải nặng liên tục 170W.

1763194516241.jpeg

Bài toán chiến lược: tại sao doanh nghiệp cần AI"tại chỗ"?

Sự ra mắt của Ascent GX10 không chỉ là một sự kiện về phần cứng, mà còn là một lời giải cho hai bài toán lớn nhất mà các doanh nghiệp đang phải đối mặt khi triển khai AI: chi phí và bảo mật.

Việc thuê các dịch vụ AI trên đám mây (Cloud AI) là một chi phí vận hành (OpEx) có thể trở nên cực kỳ đắt đỏ và khó kiểm soát khi quy mô sử dụng tăng lên. Ascent GX10 cung cấp một mô hình đầu tư (CapEx) có thể dự đoán được. Doanh nghiệp chỉ cần đầu tư một lần và có thể sử dụng cỗ máy với 100% công suất mà không phải lo lắng về các hóa đơn hàng tháng. Phân tích chi phí sở hữu tổng thể (TCO) cho thấy, đối với các tác vụ huấn luyện và tinh chỉnh thường xuyên, giải pháp "AI tại chỗ" sẽ mang lại lợi tức đầu tư (ROI) cao hơn đáng kể.

1763194575147.jpeg

Quan trọng hơn cả chi phí là vấn đề bảo mật. Trong các ngành như tài chính, ngân hàng, y tế hay pháp lý, dữ liệu của khách hàng là tài sản nhạy cảm và được quản lý bởi các quy định pháp lý nghiêm ngặt. Việc gửi những dữ liệu này lên các máy chủ của bên thứ ba (như OpenAI hay Google) để xử lý là một rủi ro về bảo mật và tuân thủ mà không phải doanh nghiệp nào cũng sẵn sàng chấp nhận. Ascent GX10 cho phép các tổ chức này có thể huấn luyện và vận hành các mô hình AI ngay tại hạ tầng nội bộ của mình, đảm bảo 100% dữ liệu nhạy cảm không bao giờ rời khỏi công ty.

Để phục vụ cho mục đích chuyên nghiệp này, Ascent GX10 không chạy Windows, mà sử dụng hệ điều hành chuyên dụng NVIDIA DGX Base OS. Đây là một phiên bản dựa trên Linux Ubuntu đã được tối ưu hóa đặc biệt cho các thiết bị AI, cài đặt sẵn toàn bộ driver, thư viện và các công cụ cần thiết, giúp các nhà phát triển có thể bắt tay vào làm việc ngay lập tức.

Sự ra mắt ASUS Ascent GX10 tại Việt Nam là một nỗ lực hợp tác chiến lược giữa ba bên: ASUS, Nhất Tiến Chung (NTC) và cộng đồng Tinh Tế.

1763195486089.jpeg

Với vai trò là nhà sản xuất phần cứng, ASUS mang đến một sản phẩm được hoàn thiện ở cấp độ cao nhất. Trong khi đó, Công ty TNHH Tin Học Viễn Thông Nhất Tiến Chung (NTC), với tư cách là một đối tác Elite của NVIDIA, đóng vai trò là nhà phân phối và cung cấp các giải pháp hạ tầng then chốt. Vai trò của NTC không chỉ là bán sản phẩm, mà còn là tư vấn, triển khai và tích hợp GX10 vào hệ thống CNTT hiện có của doanh nghiệp, đi kèm với gói bảo hành chính hãng 3 năm.

Sự xuất hiện của ASUS Ascent GX10 tại Việt Nam, với mức giá khởi điểm 115 triệu đồng cho bản 1TB và 129 triệu đồng cho bản 4TB, đã chính thức mở ra một phân khúc thị trường mới, hứa hẹn sẽ thúc đẩy mạnh mẽ các hoạt động nghiên cứu và phát triển AI quy mô nhỏ và vừa ngay tại trong nước.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL3RoaS10cnVvbmctdmlldC1uYW0tdnVhLXh1YXQtaGllbi1zaWV1LW1heS10aW5oLW1pbmktY2h1eWVuLWRlLWRhby10YW8tYWktZ2lhLXR1LTExNS10cmlldS1kb25nLjczODg4Lw==
Top