Hãng GPU vô danh Trung Quốc tuyên bố vượt mặt Nvidia về huấn luyện AI, sự thật thế nào?

Kiều My

Editor
Thành viên BQT
Theo một báo cáo mới từ cnBeta, công ty Moore Threads của Trung Quốc tuyên bố đang đạt được những bước tiến đáng kể trong lĩnh vực phát triển GPU AI. GPU tăng tốc AI mới nhất của họ, S4000, được cho là nhanh hơn đáng kể so với các thế hệ trước. Tuyên bố này dựa trên kết quả ấn tượng từ một bài kiểm tra AI, nơi cụm điện toán Intelligent Computing Cluster Kua'e Qianka sử dụng GPU S4000 đã thể hiện tốc độ đáng nể.

Cụ thể, trong bài kiểm tra ổn định cho cụm điện toán Kua'e Qianka, quá trình đào tạo AI chỉ mất tổng cộng 13,2 ngày và được báo cáo là diễn ra suôn sẻ, không gặp bất kỳ sự cố hay gián đoạn nào. Mô hình AI được sử dụng để đánh giá cụm máy tính mới là mô hình ngôn ngữ lớn MT-infini-3B.

"Quá trình đào tạo bằng cụm điện toán Intelligent Computing Cluster Kua'e Qianka dùng GPU S4000 đứng hạng thứ ba về tốc độ trong bài kiểm tra AI, vượt trội hơn một số đối thủ bao gồm cả các cụm GPU AI của NVIDIA." - Báo cáo của cnBeta cho biết.

1717117796822.png


Mặc dù kết quả ấn tượng, báo cáo cũng lưu ý rằng bảng xếp hạng có một số điểm chưa rõ ràng. "Ví dụ, cụm GPU MTT S4000 được so sánh với các GPU NVIDIA không xác định – do vậy chúng ta không biết đó là A100, H100 hay H200, nhưng nhiều khả năng có thể là A100. Các tác vụ cũng không giống nhau. Việc đào tạo bằng MT-infini-3B có thể khác đào tạo Llama3-3B chẳng hạn. Nói cách khác, thông tin trong bảng đánh giá này vẫn còn nhiều chi tiết không hoàn toàn hợp lý."

Mặc dù vậy, việc đào tạo thành công LLM (Large Language Model) trên GPU Moore Threads vẫn là một cột mốc quan trọng trên con đường nội địa hóa GPU của Trung Quốc. Ít nhất, cụm máy tính Kua'e Qianka đã chứng minh rằng GPU AI MTT S4000 có khả năng cạnh tranh sòng phẳng với kiến trúc GPU A100 thế hệ trước của Nvidia.

Kết luận này được củng cố bởi hiệu suất thô của S4000, không chỉ vượt trội so với các GPU AI tiền nhiệm S3000 và S2000 của Moore Thread mà còn cả các bộ gia tốc AI dựa trên kiến trúc Turing của NVIDIA.

"S4000 có thể không bằng được bộ gia tốc AI A100 của Nvidia, nhưng có lẽ không kém quá xa hiệu suất của dòng Ampere."

1717117806426.png

GPU S4000 của Moore Threads

Đối với Moore Threads, hiệu suất của Kua'e Qianka là một chiến thắng vang dội, bất kể GPU Nvidia hay LLM nào được sử dụng trong bài kiểm tra. Nó cho thấy Moore Threads đã có khả năng chế tạo GPU AI đủ sức thực hiện các tác vụ tương tự các đối thủ từ NVIDIA, AMD và Intel. Có thể hiệu suất chưa phải là tốt nhất, nhưng đây là bước đệm quan trọng trên con đường hướng tới các siêu máy tính và cụm AI nhanh hơn, mạnh mẽ hơn.

Thành tựu này càng đáng ghi nhận hơn khi Moore Threads mới chỉ là một công ty sản xuất GPU non trẻ của Trung Quốc, được thành lập chưa đầy 5 năm.

"Nếu Moore Threads có thể tiếp tục đạt được các cải tiến đáng kể về hiệu suất giữa các thế hệ GPU, họ có thể có một bộ gia tốc GPU AI với hiệu năng tương đương với đối thủ Phương Tây trong vài năm tới. Tất nhiên đó là một chữ "NẾU" và với kinh nghiệm lịch sử, nhiều người thấy rằng việc phát triển GPU không phải luôn diễn ra theo kế hoạch."

Bối cảnh chính phủ Mỹ đang nỗ lực hạn chế xuất khẩu GPU AI cao cấp sang Trung Quốc càng làm cho thành tựu này thêm phần ý nghĩa. Mỗi bước tiến, dù là nhỏ, về hiệu năng của các linh kiện này đều được coi là một bước tiến quan trọng cho khả năng tự chủ công nghệ cao của Trung Quốc.

Tuy nhiên, một câu hỏi còn bỏ ngỏ là liệu Moore Threads có thể đưa hiệu năng AI vượt trội này vào lĩnh vực game hay không. Cho đến nay, các GPU MTT vẫn chưa thể hiện tốt trong các bài kiểm tra game, một phần do driver/tối ưu hóa chưa hoàn thiện.

"Trong khi AI cần nhiều khả năng tính toán, nó rất khác so với xử lý đồ họa máy tính theo thời gian thực, vì vậy kinh nghiệm trong lĩnh vực này không đồng nghĩa với khả năng tương tự trong lĩnh vực kia."
 


Đăng nhập một lần thảo luận tẹt ga
Top