DeepSeek R1 nâng cấp: tăng chiều sâu tư duy và khả năng suy luận, hiệu suất gần ngang với o3

Đoàn Thúy Hà · 08:22 Hôm qua

Ngày 29/5, công ty DeepSeek của Trung Quốc đã chính thức công bố bản nâng cấp của mẫu DeepSeek-R1, với nhiều cải tiến quan trọng về hiệu suất và độ tin cậy. Phiên bản mới mang tên DeepSeek-R1-0528, hiện đã khả dụng trên website chính thức, ứng dụng di động và chương trình mini (applet). Người dùng chỉ cần bật chức năng “Tư duy sâu” để trải nghiệm. API cũng được cập nhật đồng bộ mà không thay đổi cách gọi.

Theo thông báo, phiên bản mới được xây dựng trên nền tảng DeepSeek V3 Base (ra mắt tháng 12/2024), với khối lượng tính toán hậu huấn luyện được tăng cường đáng kể. Điều này giúp mô hình cải thiện rõ rệt chiều sâu tư duy và khả năng suy luận, đặc biệt vượt trội trong các bài toán toán học, lập trình và logic tổng quát. Kết quả đánh giá cho thấy DeepSeek-R1-0528 đạt thành tích cao nhất trong số các mô hình trong nước và tiệm cận với các mô hình hàng đầu thế giới như o3 và Gemini-2.5-Pro.

Một ví dụ cụ thể: trong thử nghiệm AIME 2025, độ chính xác của phiên bản mới tăng từ 70% lên 87,5%, cho thấy bước tiến lớn về khả năng xử lý các bài toán suy luận phức tạp. Đáng chú ý, phiên bản mới sử dụng trung bình 23.000 token để giải một câu hỏi, so với chỉ 12.000 token của phiên bản cũ, phản ánh khả năng phân tích sâu và chi tiết hơn.

Bản cập nhật cũng giải quyết đáng kể vấn đề “ảo giác” – hiện tượng mô hình tạo ra nội dung sai lệch hoặc không chính xác. Theo DeepSeek, tỷ lệ lỗi loại này đã giảm 45-50% trong các tác vụ như viết lại, tóm tắt và đọc hiểu, giúp kết quả đầu ra trở nên tin cậy và chính xác hơn.

Không chỉ nâng cao khả năng suy luận, DeepSeek-R1-0528 còn được tối ưu hóa để tạo nội dung dài và có cấu trúc tốt hơn, đặc biệt phù hợp với bài luận, tiểu luận, tiểu thuyết và các thể loại yêu cầu chiều sâu nội dung. Văn phong của mô hình cũng được tinh chỉnh để gần hơn với gu thẩm mỹ ngôn ngữ của con người.

DeepSeek cho biết, chuỗi tư duy của mô hình mới không chỉ có giá trị thực tiễn trong công nghiệp mà còn mở ra triển vọng nghiên cứu học thuật về mô hình suy luận. Về hiệu suất tổng thể, DeepSeek-R1-0528 hiện tương đương với mức o1-high của OpenAI, nhưng vẫn còn khoảng cách nhất định với o3-high và Claude 4 Sonnet.

Mô hình mới tiếp tục hỗ trợ ngữ cảnh 64K token trên nền tảng chính thức. Tuy nhiên, người dùng có thể truy cập bản mã nguồn mở R1-0528 với ngữ cảnh lên đến 128K qua các nền tảng bên thứ ba. Như các phiên bản trước, DeepSeek vẫn giữ nguyên tinh thần mã nguồn mở, cho phép cộng đồng sử dụng đầu ra mô hình hoặc phục vụ huấn luyện mô hình khác thông qua kỹ thuật chưng cất.

Trước đó, vào ngày 28/5, DeepSeek đã thông báo nội bộ trên nhóm WeChat rằng quá trình “nâng cấp thử nghiệm phiên bản phụ” đã hoàn tất, kêu gọi người dùng trải nghiệm phiên bản mới. API và giao diện sử dụng không có thay đổi.

Phản hồi từ người dùng mạng cho thấy bản nâng cấp được đánh giá rất cao, đặc biệt về khả năng suy luận. Tuy nhiên, một số ý kiến bày tỏ lo ngại về thời gian xử lý lâu hơn – có thể kéo dài 30 đến 60 phút cho một tác vụ – do mô hình triển khai tư duy sâu và phân tích kỹ lưỡng hơn so với trước đây.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

DeepSeek R1 nâng cấp: tăng chiều sâu tư duy và khả năng suy luận, hiệu suất gần ngang với o3

Đoàn Thúy Hà

Editor

Đoàn Thúy Hà

AI Trung Quốc DeepSeek R1 "lột xác": Ít "ảo giác" hơn, có bản "mini" chạy trên một GPU, thách thức OpenAI, Google!

Chi tiền để giảm dấu vết AI trong luận văn: Nghề mới ở Trung Quốc

New York Times ký thỏa thuận cấp phép nội dung với Amazon để đào tạo AI

Hé lộ danh tính "ông trùm" AI Trung Quốc đứng sau DeepSeek: Từ "thần đồng toán học" làng quê đến tỷ phú công nghệ thách thức Mỹ

Hàng loạt ngân hàng Việt "tung chiêu" AI chống lừa đảo: Phát hiện giao dịch bất thường, chặn "thuê khuôn mặt" chuyển tiền

ASUS trình làng hệ sinh thái AI toàn diện tại Computex 2025, hướng tới phổ cập AI khắp mọi lĩnh vực

Tập Cận Bình chỉ thị: Phấn đấu đạt trình độ tự chủ khoa học công nghệ cao

Báo động cho anh em sắp build PC: giá RAM và ổ cứng đang tăng vọt, dự báo còn tăng tiếp

Liệu sao Kim có ẩn chứa những tiểu hành tinh nguy hiểm không?

AI Trung Quốc DeepSeek R1 "lột xác": Ít "ảo giác" hơn, có bản "mini" chạy trên một GPU, thách thức OpenAI, Google!

Súng phóng lựu bắn tỉa QLU-11 35mm: Vũ khí đáng gờm giúp Pakistan áp đảo Ấn Độ trên chiến trường

Chi tiền để giảm dấu vết AI trong luận văn: Nghề mới ở Trung Quốc

New York Times ký thỏa thuận cấp phép nội dung với Amazon để đào tạo AI

Tàu chiến Triều Tiên được dựng thẳng sau 6 ngày lật úp: Vì sao Trung Quốc giải cứu nhanh gấp 5 lần?

Là 1 cường quốc khoa học công nghệ, tại sao Nhật Bản không phô trương thanh thế trên truyền thông như Trung Quốc?

Bí ẩn đường sắt thời Tần Thủy Hoàng: Công nghệ vận tải vượt thời đại hơn 2.200 năm trước

Đánh giá nổi bật