DeepSeek-V4 đã được phát hành và công khai mã nguồn, mô hình AI đầu tiên làm được điều này

Linh Pham
Linh Pham
Phản hồi: 0

Linh Pham

Intern Writer
Vào ngày 24 tháng 4 năm 2026, theo thông tin chính thức, phiên bản xem trước của DeepSeek-V4 đã chính thức được ra mắt và đồng thời được công khai mã nguồn. DeepSeek-V4 sở hữu ngữ cảnh siêu dài lên đến một triệu từ, đạt hiệu suất hàng đầu cả trong nước và trên lĩnh vực mã nguồn mở về khả năng của tác nhân, kiến thức thế giới và hiệu suất suy luận. Mô hình này có hai phiên bản dựa trên kích thước.

Bắt đầu từ hôm nay, hãy đăng nhập vào trang web chính thức chat.deepseek.com hoặc ứng dụng chính thức để tương tác với DeepSeek-V4 mới nhất và khám phá trải nghiệm mới với bộ nhớ ngữ cảnh siêu dài 1MB.

DeepSeek-V4-Pro: Hiệu năng tương đương với các mẫu mã nguồn đóng hàng đầu​

hình ảnh

  • Khả năng của tác nhân được nâng cao đáng kể: So với phiên bản tiền nhiệm, khả năng của tác nhân trong DeepSeek-V4-Pro đã được nâng cao đáng kể. Trong lập trình tác nhân...Trong quá trình đánh giá, V4-Pro đã đạt được mức tốt nhất trong số các mô hình mã nguồn mở hiện có và cũng thể hiện xuất sắc trong các đánh giá liên quan đến tác nhân khác. Hiện tại, DeepSeek-V4 đã trở thành mô hình lập trình tác nhân được nhân viên nội bộ sử dụng. Theo phản hồi đánh giá, trải nghiệm người dùng của nó tốt hơn Sonnet 4.5, và chất lượng phân phối của nó gần bằng Opus 4.6 ở chế độ không tư duy.Tuy nhiên, nó vẫn có phần khác biệt so với lối tư duy của Opus 4.6.
  • Kiến thức thế giới sâu rộng: DeepSeek-V4-Pro vượt trội hơn hẳn các mô hình mã nguồn mở khác trong đánh giá kiến thức thế giới, chỉ xếp sau mô hình mã nguồn đóng hàng đầu Gemini-Pro-3.1 một chút.
  • Hiệu năng suy luận đẳng cấp thế giới: Trong các bài kiểm tra toán học, STEM và lập trình cạnh tranh, DeepSeek-V4-Pro vượt trội hơn tất cả các mô hình mã nguồn mở được đánh giá công khai hiện nay, đạt được kết quả xuất sắc, sánh ngang với các mô hình mã nguồn đóng hàng đầu thế giới.
hình ảnh

  • So với DeepSeek-V4-Pro, DeepSeek-V4-Flash có dung lượng kho tri thức thế giới nhỏ hơn một chút, nhưng lại thể hiện khả năng suy luận tương tự. Tuy nhiên, nhờ số lượng tham số và kích hoạt mô hình ít hơn, V4-Flash cung cấp dịch vụ API nhanh hơn và tiết kiệm hơn.
  • Trong quá trình đánh giá Agent, DeepSeek-V4-Flash có hiệu năng tương đương với DeepSeek-V4-Pro trong các tác vụ đơn giản, nhưng vẫn tụt hậu trong các tác vụ có độ khó cao.

Đổi mới cấu trúc và hiệu quả ngữ cảnh cực cao​

DeepSeek-V4 đã tiên phong trong việc sử dụng cơ chế chú ý mới, nén các token và kết hợp chúng với DeepSeek Sparse Attention (DSA) để đạt được khả năng xử lý ngữ cảnh dài hàng đầu thế giới, đồng thời giảm đáng kể yêu cầu về tính toán và bộ nhớ so với các phương pháp truyền thống. Từ nay trở đi, 1MB (một triệu) ngữ cảnh sẽ là tiêu chuẩn trên tất cả các dịch vụ DeepSeek chính thức.

hình ảnh

Chi phí tính toán và dung lượng bộ nhớ của DeepSeek-V4 và DeepSeek-V3.2 thay đổi tùy thuộc vào độ dài ngữ cảnh.

DeepSeek-V4 đã được điều chỉnh và tối ưu hóa cho các sản phẩm agent phổ biến như Claude Code, OpenClaw, OpenCode và CodeBuddy, giúp cải thiện hiệu suất trong các tác vụ viết mã và tạo tài liệu. Hình ảnh bên dưới hiển thị một ví dụ về slide PPT được tạo bởi V4-Pro trong một framework agent nhất định.

Truy cập API​

Hiện tại, API DeepSeek đã được ra mắt ở các phiên bản V4-Pro và V4-Flash, hỗ trợ giao diện OpenAI ChatCompletions và Anthropic. Khi truy cập một mô hình mới, base_url vẫn giữ nguyên, nhưng tham số model cần được thay đổi thành deepseek-v4-pro hoặc deepseek-v4-flash.

Cả V4-Pro và V4-Flash đều có kích thước ngữ cảnh tối đa là 1MB và hỗ trợ cả chế độ không suy nghĩ và chế độ suy nghĩ . Chế độ suy nghĩ cho phép thiết lập cường độ suy nghĩ (cao/tối đa) bằng tham số `reasoning_effort`. Đối với các kịch bản tác nhân phức tạp, nên sử dụng chế độ suy nghĩ và đặt cường độ ở mức tối đa. Để biết các phương pháp gọi mô hình và điều chỉnh tham số, vui lòng tham khảo tài liệu API.

Xin lưu ý: Hai tên mô hình deepseek-chat và deepseek-reasoner từ giao diện API cũ sẽ bị ngừng hỗ trợ sau ba tháng (ngày 24 tháng 7 năm 2026). Trong giai đoạn hiện tại, hai tên mô hình này lần lượt đề cập đến chế độ không suy nghĩ và chế độ suy nghĩ của deepseek-v4-flash.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL2RlZXBzZWVrLXY0LWRhLWR1b2MtcGhhdC1oYW5oLXZhLWNvbmcta2hhaS1tYS1uZ3Vvbi1tby1oaW5oLWFpLWRhdS10aWVuLWxhbS1kdW9jLWRpZXUtbmF5LjgyMjM3Lw==
Top