Hail the Judge
Ta chơi xong không trả tiền, vậy đâu có gọi là bán
Vào ngày 3 tháng 12 tại San Francisco, gã khổng lồ bán dẫn Mỹ Nvidia đã công bố những dữ liệu mới đầy ấn tượng, khẳng định rằng các máy chủ trí tuệ nhân tạo (AI) thế hệ mới nhất của hãng có khả năng nâng cao hiệu suất của các mô hình AI kiểu mới lên gấp 10 lần. Đáng chú ý, trong số các mô hình AI được dự báo sẽ hưởng lợi lớn từ sự nâng cấp hiệu năng này có sự góp mặt của hai mô hình đang rất phổ biến đến từ Trung Quốc.
Dữ liệu được Nvidia công bố tập trung vào công nghệ "MoE" (Mixture of Experts - hay còn gọi là Mô hình Hỗn hợp Chuyên gia). Đây là một kỹ thuật giúp vận hành các mô hình AI hiệu quả hơn bằng cách chia nhỏ các câu hỏi thành nhiều phần và phân công nhiệm vụ cho các "chuyên gia" cụ thể bên trong mô hình để xử lý. Công nghệ này đã bùng nổ sự phổ biến sau khi công ty khởi nghiệp DeepSeek của Trung Quốc gây tiếng vang lớn vào đầu năm nay khi ra mắt một mô hình nguồn mở hiệu suất cao, dù chỉ sử dụng số lượng chip Nvidia ít hơn để "huấn luyện" so với các đối thủ cạnh tranh. Hiện tại, phương pháp tiên tiến này đang được áp dụng rộng rãi bởi cả OpenAI - cha đẻ của ChatGPT, cũng như công ty khởi nghiệp AI Moonshot AI của Trung Quốc.
Theo thông tin từ Nvidia, khi sử dụng máy chủ AI mới nhất được trang bị 72 con chip bán dẫn tiên tiến nhất của hãng, hiệu suất của mô hình "Kimi K2 Thinking" thuộc Moonshot đã tăng gấp 10 lần so với khi vận hành trên các máy chủ Nvidia thế hệ trước. Mức độ cải thiện hiệu suất tương tự cũng được ghi nhận trên mô hình của DeepSeek, chứng minh sức mạnh vượt trội của hạ tầng phần cứng mới trong việc thúc đẩy các ứng dụng AI phức tạp.
Dữ liệu được Nvidia công bố tập trung vào công nghệ "MoE" (Mixture of Experts - hay còn gọi là Mô hình Hỗn hợp Chuyên gia). Đây là một kỹ thuật giúp vận hành các mô hình AI hiệu quả hơn bằng cách chia nhỏ các câu hỏi thành nhiều phần và phân công nhiệm vụ cho các "chuyên gia" cụ thể bên trong mô hình để xử lý. Công nghệ này đã bùng nổ sự phổ biến sau khi công ty khởi nghiệp DeepSeek của Trung Quốc gây tiếng vang lớn vào đầu năm nay khi ra mắt một mô hình nguồn mở hiệu suất cao, dù chỉ sử dụng số lượng chip Nvidia ít hơn để "huấn luyện" so với các đối thủ cạnh tranh. Hiện tại, phương pháp tiên tiến này đang được áp dụng rộng rãi bởi cả OpenAI - cha đẻ của ChatGPT, cũng như công ty khởi nghiệp AI Moonshot AI của Trung Quốc.
Theo thông tin từ Nvidia, khi sử dụng máy chủ AI mới nhất được trang bị 72 con chip bán dẫn tiên tiến nhất của hãng, hiệu suất của mô hình "Kimi K2 Thinking" thuộc Moonshot đã tăng gấp 10 lần so với khi vận hành trên các máy chủ Nvidia thế hệ trước. Mức độ cải thiện hiệu suất tương tự cũng được ghi nhận trên mô hình của DeepSeek, chứng minh sức mạnh vượt trội của hạ tầng phần cứng mới trong việc thúc đẩy các ứng dụng AI phức tạp.