Thoại Viết Hoàng
Writer
Công ty khởi nghiệp DeepSeek của Trung Quốc – cái tên từng làm dậy sóng giới công nghệ toàn cầu đầu năm nay – vừa lặng lẽ tung ra phiên bản nâng cấp của mô hình trí tuệ nhân tạo lý luận R1.
Dù không công bố chính thức, bản cập nhật của DeepSeek R1 đã xuất hiện trên nền tảng chia sẻ mô hình AI Hugging Face. Đây là động thái tương tự lần ra mắt đầu tiên của mô hình R1 – khi DeepSeek chọn cách không ồn ào nhưng vẫn gây chấn động nhờ chất lượng vượt trội và mã nguồn mở miễn phí.
R1 nhanh chóng vượt mặt nhiều mô hình cùng loại đến từ những tên tuổi lớn như Meta hay OpenAI, gây bất ngờ vì được phát triển trong thời gian ngắn với chi phí thấp. Điều này từng khiến thị trường lo ngại rằng các tập đoàn công nghệ Mỹ đang đầu tư quá mức vào hạ tầng AI, ảnh hưởng đến giá trị cổ phiếu của các công ty như Nvidia – nhà sản xuất chip chủ chốt cho ngành công nghiệp AI. Dù sau đó các cổ phiếu này đã phục hồi, cú sốc mà DeepSeek tạo ra vẫn để lại dấu ấn rõ nét.
Phiên bản nâng cấp R1 vẫn đi theo hướng phát triển mô hình lý luận – loại AI có khả năng xử lý nhiệm vụ phức tạp thông qua lập luận từng bước. Trên bảng xếp hạng LiveCodeBench – nơi đánh giá hiệu suất các mô hình AI – DeepSeek R1 phiên bản mới chỉ đứng sau o4-mini và o3 của OpenAI.
Sự kiện này tiếp tục cho thấy nỗ lực của Trung Quốc trong việc phát triển trí tuệ nhân tạo bất chấp những hạn chế từ phía Hoa Kỳ, đặc biệt là các lệnh siết xuất khẩu chip và công nghệ liên quan. Cùng thời điểm, các tập đoàn lớn của Trung Quốc như Baidu và Tencent cũng công bố các cải tiến mô hình AI nhằm thích ứng với bối cảnh thiếu hụt phần cứng.
Phát biểu hôm thứ Tư, Tổng giám đốc Nvidia – ông Jensen Huang – đã chỉ trích các biện pháp kiểm soát xuất khẩu của Mỹ, cho rằng những chính sách này dựa trên giả định sai lầm rằng Trung Quốc không thể sản xuất chip AI. Ông nhấn mạnh: “Câu hỏi không phải là Trung Quốc có AI hay không – bởi vì giờ thì rõ ràng là họ đã có.” (CNBC)

Dù không công bố chính thức, bản cập nhật của DeepSeek R1 đã xuất hiện trên nền tảng chia sẻ mô hình AI Hugging Face. Đây là động thái tương tự lần ra mắt đầu tiên của mô hình R1 – khi DeepSeek chọn cách không ồn ào nhưng vẫn gây chấn động nhờ chất lượng vượt trội và mã nguồn mở miễn phí.
R1 nhanh chóng vượt mặt nhiều mô hình cùng loại đến từ những tên tuổi lớn như Meta hay OpenAI, gây bất ngờ vì được phát triển trong thời gian ngắn với chi phí thấp. Điều này từng khiến thị trường lo ngại rằng các tập đoàn công nghệ Mỹ đang đầu tư quá mức vào hạ tầng AI, ảnh hưởng đến giá trị cổ phiếu của các công ty như Nvidia – nhà sản xuất chip chủ chốt cho ngành công nghiệp AI. Dù sau đó các cổ phiếu này đã phục hồi, cú sốc mà DeepSeek tạo ra vẫn để lại dấu ấn rõ nét.
Phiên bản nâng cấp R1 vẫn đi theo hướng phát triển mô hình lý luận – loại AI có khả năng xử lý nhiệm vụ phức tạp thông qua lập luận từng bước. Trên bảng xếp hạng LiveCodeBench – nơi đánh giá hiệu suất các mô hình AI – DeepSeek R1 phiên bản mới chỉ đứng sau o4-mini và o3 của OpenAI.
Sự kiện này tiếp tục cho thấy nỗ lực của Trung Quốc trong việc phát triển trí tuệ nhân tạo bất chấp những hạn chế từ phía Hoa Kỳ, đặc biệt là các lệnh siết xuất khẩu chip và công nghệ liên quan. Cùng thời điểm, các tập đoàn lớn của Trung Quốc như Baidu và Tencent cũng công bố các cải tiến mô hình AI nhằm thích ứng với bối cảnh thiếu hụt phần cứng.
Phát biểu hôm thứ Tư, Tổng giám đốc Nvidia – ông Jensen Huang – đã chỉ trích các biện pháp kiểm soát xuất khẩu của Mỹ, cho rằng những chính sách này dựa trên giả định sai lầm rằng Trung Quốc không thể sản xuất chip AI. Ông nhấn mạnh: “Câu hỏi không phải là Trung Quốc có AI hay không – bởi vì giờ thì rõ ràng là họ đã có.” (CNBC)