The Storm Riders
Writer
Nvidia đã phản bác lại tuyên bố của AMD, khẳng định rằng GPU GeForce RTX 5090 mới của họ vượt trội hơn sản phẩm hàng đầu của AMD với tỷ lệ đáng kinh ngạc. Theo "Đội Xanh", RTX 5090 nhanh hơn tới 2,2 lần so với RX 7900 XTX khi chạy các mô hình AI DeepSeek R1.
Gã khổng lồ công nghệ đã thực hiện các điểm chuẩn mở rộng bằng cách sử dụng ba phiên bản của mô hình AI DeepSeek R1: Distill Qwen 7b, Llama 8b và Qwen 32b. Khi sử dụng Qwen LLM với 32b tham số, Nvidia báo cáo rằng RTX 5090 nhanh hơn 124% so với đối thủ của AMD, trong khi RTX 4090 thế hệ trước vẫn duy trì vị trí dẫn đầu 47%. Các mẫu tương tự đã xuất hiện trong các bài kiểm tra khác. Với Llama 8b, RTX 5090 được cho là đã vượt qua RX 7900 XTX tới 106%, trong khi RTX 4090 vẫn duy trì lợi thế 47%. Ngay cả trong bài kiểm tra Qwen 7b, sản phẩm mới nhất của Nvidia cũng nhanh hơn 103%, với RTX 4090 cho thấy hiệu suất vượt trội 46%.
Những kết quả này hoàn toàn trái ngược với các điểm chuẩn trước đó của AMD, cho thấy RX 7900 XTX vượt trội hơn RTX 4090 và 4080 của NVIDIA trong hầu hết các trường hợp, với mức dẫn đầu lần lượt là 113% và 134%. Nvidia cũng tuyên bố rằng GPU GeForce RTX 50 Series được cung cấp bởi khả năng xử lý AI lên tới 3.352 nghìn tỷ phép toán mỗi giây, có vị trí độc nhất để chạy họ mô hình chưng cất của DeepSeek nhanh hơn bất kỳ tùy chọn nào khác trên thị trường PC. Điều này là do họ mô hình R1 của DeepSeek, mà Nvidia mô tả là một phần của lớp 'mô hình lý luận' mới.
Các LLM này được thiết kế để bắt chước quy trình giải quyết vấn đề của con người bằng cách phân bổ nhiều tài nguyên tính toán hơn để 'suy nghĩ' và 'phản ánh' về các vấn đề phức tạp. Cách tiếp cận này, được gọi là chia tỷ lệ thời gian thử nghiệm, cho phép mô hình phân bổ tài nguyên điện toán một cách linh hoạt trong quá trình suy luận để lý luận thông qua các vấn đề hiệu quả hơn.
Nvidia cũng lưu ý rằng GPU RTX 50 Series của họ, có Lõi Tensor thế hệ thứ năm chuyên dụng, được xây dựng trên cùng kiến trúc GPU Blackwell thúc đẩy sự đổi mới AI trong các trung tâm dữ liệu. Kiến trúc này cho phép RTX tăng tốc hoàn toàn các mô hình DeepSeek, mang lại hiệu quả suy luận cao nhất trên máy tính cá nhân.
Công ty cũng chào hàng nền tảng RTX AI của mình, một hệ sinh thái mở ra khả năng DeepSeek-R1 cho hơn 100 triệu PC Nvidia RTX AI trên toàn thế giới, bao gồm cả những PC được trang bị GPU GeForce RTX 50 Series mới nhất. Nvidia lập luận rằng GPU RTX hiệu suất cao đảm bảo các khả năng của AI vẫn có thể truy cập được, ngay cả khi không có kết nối internet. Điều này không chỉ cung cấp độ trễ thấp mà còn tăng cường quyền riêng tư, vì người dùng có thể tránh tải lên các tài liệu nhạy cảm hoặc tiết lộ các truy vấn của họ cho các dịch vụ trực tuyến.
Gã khổng lồ công nghệ đã thực hiện các điểm chuẩn mở rộng bằng cách sử dụng ba phiên bản của mô hình AI DeepSeek R1: Distill Qwen 7b, Llama 8b và Qwen 32b. Khi sử dụng Qwen LLM với 32b tham số, Nvidia báo cáo rằng RTX 5090 nhanh hơn 124% so với đối thủ của AMD, trong khi RTX 4090 thế hệ trước vẫn duy trì vị trí dẫn đầu 47%. Các mẫu tương tự đã xuất hiện trong các bài kiểm tra khác. Với Llama 8b, RTX 5090 được cho là đã vượt qua RX 7900 XTX tới 106%, trong khi RTX 4090 vẫn duy trì lợi thế 47%. Ngay cả trong bài kiểm tra Qwen 7b, sản phẩm mới nhất của Nvidia cũng nhanh hơn 103%, với RTX 4090 cho thấy hiệu suất vượt trội 46%.
![1738741994131.png 1738741994131.png](https://vnrv.s3.hn-1.cloud.cmctelecom.vn/data/attachments/34/34975-4c635f3a81f80d520be6eb56418dbdd2.jpg)
Những kết quả này hoàn toàn trái ngược với các điểm chuẩn trước đó của AMD, cho thấy RX 7900 XTX vượt trội hơn RTX 4090 và 4080 của NVIDIA trong hầu hết các trường hợp, với mức dẫn đầu lần lượt là 113% và 134%. Nvidia cũng tuyên bố rằng GPU GeForce RTX 50 Series được cung cấp bởi khả năng xử lý AI lên tới 3.352 nghìn tỷ phép toán mỗi giây, có vị trí độc nhất để chạy họ mô hình chưng cất của DeepSeek nhanh hơn bất kỳ tùy chọn nào khác trên thị trường PC. Điều này là do họ mô hình R1 của DeepSeek, mà Nvidia mô tả là một phần của lớp 'mô hình lý luận' mới.
Các LLM này được thiết kế để bắt chước quy trình giải quyết vấn đề của con người bằng cách phân bổ nhiều tài nguyên tính toán hơn để 'suy nghĩ' và 'phản ánh' về các vấn đề phức tạp. Cách tiếp cận này, được gọi là chia tỷ lệ thời gian thử nghiệm, cho phép mô hình phân bổ tài nguyên điện toán một cách linh hoạt trong quá trình suy luận để lý luận thông qua các vấn đề hiệu quả hơn.
![1738742010471.png 1738742010471.png](https://vnrv.s3.hn-1.cloud.cmctelecom.vn/data/attachments/34/34976-d7238548d9b3ef05ba0cc377ec01e5d7.jpg)
Nvidia cũng lưu ý rằng GPU RTX 50 Series của họ, có Lõi Tensor thế hệ thứ năm chuyên dụng, được xây dựng trên cùng kiến trúc GPU Blackwell thúc đẩy sự đổi mới AI trong các trung tâm dữ liệu. Kiến trúc này cho phép RTX tăng tốc hoàn toàn các mô hình DeepSeek, mang lại hiệu quả suy luận cao nhất trên máy tính cá nhân.
Công ty cũng chào hàng nền tảng RTX AI của mình, một hệ sinh thái mở ra khả năng DeepSeek-R1 cho hơn 100 triệu PC Nvidia RTX AI trên toàn thế giới, bao gồm cả những PC được trang bị GPU GeForce RTX 50 Series mới nhất. Nvidia lập luận rằng GPU RTX hiệu suất cao đảm bảo các khả năng của AI vẫn có thể truy cập được, ngay cả khi không có kết nối internet. Điều này không chỉ cung cấp độ trễ thấp mà còn tăng cường quyền riêng tư, vì người dùng có thể tránh tải lên các tài liệu nhạy cảm hoặc tiết lộ các truy vấn của họ cho các dịch vụ trực tuyến.