DeepSeek-V4 đã được phát hành và công khai mã nguồn, mô hình AI đầu tiên làm được điều này

Linh Pham · 21:37 Hôm qua

Vào ngày 24 tháng 4 năm 2026, theo thông tin chính thức, phiên bản xem trước của DeepSeek-V4 đã chính thức được ra mắt và đồng thời được công khai mã nguồn. DeepSeek-V4 sở hữu ngữ cảnh siêu dài lên đến một triệu từ, đạt hiệu suất hàng đầu cả trong nước và trên lĩnh vực mã nguồn mở về khả năng của tác nhân, kiến thức thế giới và hiệu suất suy luận. Mô hình này có hai phiên bản dựa trên kích thước.

Bắt đầu từ hôm nay, hãy đăng nhập vào trang web chính thức chat.deepseek.com hoặc ứng dụng chính thức để tương tác với DeepSeek-V4 mới nhất và khám phá trải nghiệm mới với bộ nhớ ngữ cảnh siêu dài 1MB.

DeepSeek-V4-Pro: Hiệu năng tương đương với các mẫu mã nguồn đóng hàng đầu

Khả năng của tác nhân được nâng cao đáng kể: So với phiên bản tiền nhiệm, khả năng của tác nhân trong DeepSeek-V4-Pro đã được nâng cao đáng kể. Trong lập trình tác nhân...Trong quá trình đánh giá, V4-Pro đã đạt được mức tốt nhất trong số các mô hình mã nguồn mở hiện có và cũng thể hiện xuất sắc trong các đánh giá liên quan đến tác nhân khác. Hiện tại, DeepSeek-V4 đã trở thành mô hình lập trình tác nhân được nhân viên nội bộ sử dụng. Theo phản hồi đánh giá, trải nghiệm người dùng của nó tốt hơn Sonnet 4.5, và chất lượng phân phối của nó gần bằng Opus 4.6 ở chế độ không tư duy.Tuy nhiên, nó vẫn có phần khác biệt so với lối tư duy của Opus 4.6.
Kiến thức thế giới sâu rộng: DeepSeek-V4-Pro vượt trội hơn hẳn các mô hình mã nguồn mở khác trong đánh giá kiến thức thế giới, chỉ xếp sau mô hình mã nguồn đóng hàng đầu Gemini-Pro-3.1 một chút.
Hiệu năng suy luận đẳng cấp thế giới: Trong các bài kiểm tra toán học, STEM và lập trình cạnh tranh, DeepSeek-V4-Pro vượt trội hơn tất cả các mô hình mã nguồn mở được đánh giá công khai hiện nay, đạt được kết quả xuất sắc, sánh ngang với các mô hình mã nguồn đóng hàng đầu thế giới.

So với DeepSeek-V4-Pro, DeepSeek-V4-Flash có dung lượng kho tri thức thế giới nhỏ hơn một chút, nhưng lại thể hiện khả năng suy luận tương tự. Tuy nhiên, nhờ số lượng tham số và kích hoạt mô hình ít hơn, V4-Flash cung cấp dịch vụ API nhanh hơn và tiết kiệm hơn.
Trong quá trình đánh giá Agent, DeepSeek-V4-Flash có hiệu năng tương đương với DeepSeek-V4-Pro trong các tác vụ đơn giản, nhưng vẫn tụt hậu trong các tác vụ có độ khó cao.

Đổi mới cấu trúc và hiệu quả ngữ cảnh cực cao

DeepSeek-V4 đã tiên phong trong việc sử dụng cơ chế chú ý mới, nén các token và kết hợp chúng với DeepSeek Sparse Attention (DSA) để đạt được khả năng xử lý ngữ cảnh dài hàng đầu thế giới, đồng thời giảm đáng kể yêu cầu về tính toán và bộ nhớ so với các phương pháp truyền thống. Từ nay trở đi, 1MB (một triệu) ngữ cảnh sẽ là tiêu chuẩn trên tất cả các dịch vụ DeepSeek chính thức.

Chi phí tính toán và dung lượng bộ nhớ của DeepSeek-V4 và DeepSeek-V3.2 thay đổi tùy thuộc vào độ dài ngữ cảnh.

DeepSeek-V4 đã được điều chỉnh và tối ưu hóa cho các sản phẩm agent phổ biến như Claude Code, OpenClaw, OpenCode và CodeBuddy, giúp cải thiện hiệu suất trong các tác vụ viết mã và tạo tài liệu. Hình ảnh bên dưới hiển thị một ví dụ về slide PPT được tạo bởi V4-Pro trong một framework agent nhất định.

Truy cập API

Hiện tại, API DeepSeek đã được ra mắt ở các phiên bản V4-Pro và V4-Flash, hỗ trợ giao diện OpenAI ChatCompletions và Anthropic. Khi truy cập một mô hình mới, base_url vẫn giữ nguyên, nhưng tham số model cần được thay đổi thành deepseek-v4-pro hoặc deepseek-v4-flash.

Cả V4-Pro và V4-Flash đều có kích thước ngữ cảnh tối đa là 1MB và hỗ trợ cả chế độ không suy nghĩ và chế độ suy nghĩ . Chế độ suy nghĩ cho phép thiết lập cường độ suy nghĩ (cao/tối đa) bằng tham số `reasoning_effort`. Đối với các kịch bản tác nhân phức tạp, nên sử dụng chế độ suy nghĩ và đặt cường độ ở mức tối đa. Để biết các phương pháp gọi mô hình và điều chỉnh tham số, vui lòng tham khảo tài liệu API.

思考模式 | DeepSeek API Docs

DeepSeek 模型支持思考模式：在输出最终回答之前，模型会先输出一段思维链内容，以提升最终答案的准确性。

api-docs.deepseek.com

Xin lưu ý: Hai tên mô hình deepseek-chat và deepseek-reasoner từ giao diện API cũ sẽ bị ngừng hỗ trợ sau ba tháng (ngày 24 tháng 7 năm 2026). Trong giai đoạn hiện tại, hai tên mô hình này lần lượt đề cập đến chế độ không suy nghĩ và chế độ suy nghĩ của deepseek-v4-flash.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

DeepSeek-V4 đã được phát hành và công khai mã nguồn, mô hình AI đầu tiên làm được điều này

Linh Pham

Intern Writer

Linh Pham

DeepSeek-V4-Pro: Hiệu năng tương đương với các mẫu mã nguồn đóng hàng đầu

Đổi mới cấu trúc và hiệu quả ngữ cảnh cực cao

Truy cập API

思考模式 | DeepSeek API Docs

Không phải tưởng tượng: Claude Code thực sự "ngu đi" suốt 2 tháng qua, Anthropic phải xin lỗi

Anthropic thừa nhận lỗi kỹ thuật này làm Claude Code "bị ngu đi" suốt gần hai tháng qua

Dùng AI miễn phí quen rồi, giờ phải trả tiền từ cú quay xe của các Big Tech

DeepSeek chính thức ra mắt DeepSeek V4, thời điểm ra mắt không khác gì "dằn mặt" ChatGPT

GPT-5.5 ra mắt: Thông minh hơn, đắt hơn và khó có thể quay lại như cũ

Google thừa nhận 75% code mới của công ty là do AI tạo

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Vụ nổ tháp pháo xe tăng của Nhật Bản có liên quan đến "Sản xuất tại Trung Quốc"?

Đánh giá nổi bật

Chủ đề hot

Có thể bạn quan tâm

DeepSeek-V4 đã được phát hành và công khai mã nguồn, mô hình AI đầu tiên làm được điều này

Intern Writer

DeepSeek-V4-Pro: Hiệu năng tương đương với các mẫu mã nguồn đóng hàng đầu​

Đổi mới cấu trúc và hiệu quả ngữ cảnh cực cao​

Truy cập API​

Không phải tưởng tượng: Claude Code thực sự "ngu đi" suốt 2 tháng qua, Anthropic phải xin lỗi

Anthropic thừa nhận lỗi kỹ thuật này làm Claude Code "bị ngu đi" suốt gần hai tháng qua

Dùng AI miễn phí quen rồi, giờ phải trả tiền từ cú quay xe của các Big Tech

DeepSeek chính thức ra mắt DeepSeek V4, thời điểm ra mắt không khác gì "dằn mặt" ChatGPT

GPT-5.5 ra mắt: Thông minh hơn, đắt hơn và khó có thể quay lại như cũ

Google thừa nhận 75% code mới của công ty là do AI tạo

DeepSeek-V4-Pro: Hiệu năng tương đương với các mẫu mã nguồn đóng hàng đầu

Đổi mới cấu trúc và hiệu quả ngữ cảnh cực cao

Truy cập API