Deepseek chuẩn bị gây chấn động thế giới lần thứ hai?

Mr. Darcy
Mr. Darcy
Phản hồi: 0

Mr. Darcy

Editor
Thành viên BQT
Tháng 7 năm ngoái, DeepSeek chứng kiến cú rơi mạnh về mức độ quan tâm khi lượt tải giảm từ hơn 80 triệu xuống chỉ còn hơn 20 triệu, tức giảm hơn 72%. Cụm từ “DeepSeek xuống dốc” khi đó nhanh chóng trở thành chủ đề nóng trên mạng.
1768009049659.png

Nhưng theo nhiều nguồn tin thân cận, DeepSeek đang chuẩn bị quay lại vị trí dẫn đầu. Họ dự kiến ra mắt DeepSeek-V4 vào giữa tháng 2 năm nay, đúng dịp Tết Nguyên đán 2026, tròn một năm sau khi DeepSeek-R1 xuất hiện. Trọng tâm của phiên bản mới là khả năng tạo và xử lý mã.

Các đánh giá nội bộ cho thấy V4 vượt lên trên nhiều đối thủ lớn như Claude của Anthropic hay dòng GPT của OpenAI trong các bài kiểm tra lập trình. Nhóm phát triển cũng cho biết họ đã giải quyết được nhiều nút thắt kỹ thuật tồn tại lâu nay, mở đường cho một thế hệ AI phục vụ “Vibe Coding”.

Một điểm đáng chú ý là DeepSeek-V4 không chỉ học thuộc dữ liệu mà hiểu được quy luật phía sau. Với R1 trước đây, mô hình từng thất bại ở những bài toán đơn giản như đếm số chữ “r” trong từ “strawberry”, do không nắm được khái niệm đếm mà chỉ suy đoán theo dữ liệu huấn luyện. V4 được cho là đã khắc phục triệt để vấn đề này, với điều kiện mô hình đã hiểu đúng bản chất trong quá trình huấn luyện.

Quan trọng hơn, khi trở nên phức tạp hơn, V4 vẫn giữ được độ ổn định. Trong huấn luyện AI, việc học cái mới thường kéo theo hiện tượng quên cái cũ, hay còn gọi là “quên lãng thảm khốc”. DeepSeek cho biết V4 tránh được tình trạng này, duy trì toàn vẹn các năng lực ban đầu mà không phát sinh tác dụng phụ. Đây là nền tảng cần thiết để xây dựng các tác nhân lập trình có thể làm việc với dự án lớn và mã nguồn phức tạp.
1768009063619.png

Sau R1, hướng đi của DeepSeek ngày càng rõ ràng. Tháng 9/2025, bài báo về R1 xuất hiện trên bìa Nature, với Liang Wenfeng là tác giả liên hệ. Nhóm cũng công khai chi phí huấn luyện gây chú ý, khi giai đoạn tinh chỉnh từ V3-Base lên R1 chỉ tiêu tốn khoảng 294.000 USD, tương đương khoảng 7,3 tỷ đồng, chưa tính chi phí 6 triệu USD cho mô hình nền tảng.

Cuối năm 2025, DeepSeek tiếp tục công bố nghiên cứu mHC, một kiến trúc mới giúp mô hình mở rộng quy mô mà vẫn giữ ổn định. Thử nghiệm cho thấy điểm suy luận tăng thêm hơn 2%, ngay cả ở các mô hình lớn. Nhiều dấu hiệu cho thấy V4 đã ứng dụng kiến trúc này.

Đầu tháng 1/2026, nhóm còn mở rộng bài báo R1 trên arXiv từ 22 lên 86 trang, công khai chi tiết toàn bộ quy trình huấn luyện. Trong giới AI, việc “xả” chi tiết kỹ thuật như vậy thường đồng nghĩa thế hệ tiếp theo đã sẵn sàng.

Trong khi đó, cuộc đua lập trình AI cũng nóng lên với sự tham gia của nhiều cái tên mới. Các mô hình mã nguồn mở, công cụ lập trình AI và thậm chí thiết bị phần cứng tích hợp trợ lý thông minh liên tục xuất hiện. Thị trường vốn cũng phản ứng mạnh, khi nhiều công ty AI Trung Quốc niêm yết và tăng giá ấn tượng, cho thấy nhà đầu tư sẵn sàng trả giá cao cho các mô hình chất lượng.

Ngành AI Trung Quốc đang bước qua giai đoạn hỗn loạn để tiến tới tập trung hơn. Một năm trước, DeepSeek gây chú ý với chiến lược chi phí thấp. Một năm sau, mọi ánh nhìn lại đổ dồn về DeepSeek-V4.

Liệu họ có tạo ra cú bứt phá lần thứ hai hay không, câu trả lời có lẽ sẽ lộ diện ngay trong những ngày tới. #DeepSeekV4
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL2RlZXBzZWVrLWNodWFuLWJpLWdheS1jaGFuLWRvbmctdGhlLWdpb2ktbGFuLXRodS1oYWkuNzcxMzEv
Top