DeepSeek R1 nâng cấp: tăng chiều sâu tư duy và khả năng suy luận, hiệu suất gần ngang với o3

Đoàn Thúy Hà
Đoàn Thúy Hà
Phản hồi: 0

Đoàn Thúy Hà

Editor
Thành viên BQT
Ngày 29/5, công ty DeepSeek của Trung Quốc đã chính thức công bố bản nâng cấp của mẫu DeepSeek-R1, với nhiều cải tiến quan trọng về hiệu suất và độ tin cậy. Phiên bản mới mang tên DeepSeek-R1-0528, hiện đã khả dụng trên website chính thức, ứng dụng di động và chương trình mini (applet). Người dùng chỉ cần bật chức năng “Tư duy sâu” để trải nghiệm. API cũng được cập nhật đồng bộ mà không thay đổi cách gọi.

Theo thông báo, phiên bản mới được xây dựng trên nền tảng DeepSeek V3 Base (ra mắt tháng 12/2024), với khối lượng tính toán hậu huấn luyện được tăng cường đáng kể. Điều này giúp mô hình cải thiện rõ rệt chiều sâu tư duy và khả năng suy luận, đặc biệt vượt trội trong các bài toán toán học, lập trình và logic tổng quát. Kết quả đánh giá cho thấy DeepSeek-R1-0528 đạt thành tích cao nhất trong số các mô hình trong nước và tiệm cận với các mô hình hàng đầu thế giới như o3 và Gemini-2.5-Pro.

Một ví dụ cụ thể: trong thử nghiệm AIME 2025, độ chính xác của phiên bản mới tăng từ 70% lên 87,5%, cho thấy bước tiến lớn về khả năng xử lý các bài toán suy luận phức tạp. Đáng chú ý, phiên bản mới sử dụng trung bình 23.000 token để giải một câu hỏi, so với chỉ 12.000 token của phiên bản cũ, phản ánh khả năng phân tích sâu và chi tiết hơn.
1748568128482.png

Bản cập nhật cũng giải quyết đáng kể vấn đề “ảo giác” – hiện tượng mô hình tạo ra nội dung sai lệch hoặc không chính xác. Theo DeepSeek, tỷ lệ lỗi loại này đã giảm 45-50% trong các tác vụ như viết lại, tóm tắt và đọc hiểu, giúp kết quả đầu ra trở nên tin cậy và chính xác hơn.

Không chỉ nâng cao khả năng suy luận, DeepSeek-R1-0528 còn được tối ưu hóa để tạo nội dung dài và có cấu trúc tốt hơn, đặc biệt phù hợp với bài luận, tiểu luận, tiểu thuyết và các thể loại yêu cầu chiều sâu nội dung. Văn phong của mô hình cũng được tinh chỉnh để gần hơn với gu thẩm mỹ ngôn ngữ của con người.

DeepSeek cho biết, chuỗi tư duy của mô hình mới không chỉ có giá trị thực tiễn trong công nghiệp mà còn mở ra triển vọng nghiên cứu học thuật về mô hình suy luận. Về hiệu suất tổng thể, DeepSeek-R1-0528 hiện tương đương với mức o1-high của OpenAI, nhưng vẫn còn khoảng cách nhất định với o3-high và Claude 4 Sonnet.

Mô hình mới tiếp tục hỗ trợ ngữ cảnh 64K token trên nền tảng chính thức. Tuy nhiên, người dùng có thể truy cập bản mã nguồn mở R1-0528 với ngữ cảnh lên đến 128K qua các nền tảng bên thứ ba. Như các phiên bản trước, DeepSeek vẫn giữ nguyên tinh thần mã nguồn mở, cho phép cộng đồng sử dụng đầu ra mô hình hoặc phục vụ huấn luyện mô hình khác thông qua kỹ thuật chưng cất.

Trước đó, vào ngày 28/5, DeepSeek đã thông báo nội bộ trên nhóm WeChat rằng quá trình “nâng cấp thử nghiệm phiên bản phụ” đã hoàn tất, kêu gọi người dùng trải nghiệm phiên bản mới. API và giao diện sử dụng không có thay đổi.

Phản hồi từ người dùng mạng cho thấy bản nâng cấp được đánh giá rất cao, đặc biệt về khả năng suy luận. Tuy nhiên, một số ý kiến bày tỏ lo ngại về thời gian xử lý lâu hơn – có thể kéo dài 30 đến 60 phút cho một tác vụ – do mô hình triển khai tư duy sâu và phân tích kỹ lưỡng hơn so với trước đây.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL2RlZXBzZWVrLXIxLW5hbmctY2FwLXRhbmctY2hpZXUtc2F1LXR1LWR1eS12YS1raGEtbmFuZy1zdXktbHVhbi1oaWV1LXN1YXQtZ2FuLW5nYW5nLXZvaS1vMy42MjEzNS8=
Top