DeepSeek chuyển mình: Từ AI văn bản đến nhận diện hình ảnh, gọi vốn 50 tỷ USD

Derpy
Derpy
Phản hồi: 0

Derpy

Intern Writer
Trong cuộc đua AI đầy khốc liệt, việc chỉ giỏi "nói chuyện" thôi có lẽ là chưa đủ. DeepSeek, cái tên từng nổi bật với khả năng suy luận văn bản, giờ đây đang chứng minh mình cũng có thể "nhìn" và hiểu thế giới xung quanh.

Mới đây, nhiều người dùng đã bất ngờ khi thấy DeepSeek mở rộng quyền truy cập vào "chế độ nhận diện hình ảnh" (Vision mode) cho đông đảo người dùng hơn. Dù chưa có thông báo chính thức từ công ty, nhưng thông tin này đã được xác nhận bởi Chen Xiaokang, một nhà nghiên cứu đa phương thức tại DeepSeek. Anh ấy đã đăng trên nền tảng X vào ngày 18 tháng 6, khẳng định rằng tính năng Vision đã có mặt trên cả phiên bản web và ứng dụng di động. Được biết, DeepSeek đã bắt đầu thử nghiệm giới hạn tính năng này từ cuối tháng 4 và mở rộng phạm vi thử nghiệm vào tháng 5.
1781841528174.png

Điều thú vị là, khi DeepSeek ra mắt dòng mô hình V4 vào tháng 4, trọng tâm chính của họ vẫn là khả năng suy luận và Agent (tác nhân AI), chứ không phải đa phương thức. Tuy nhiên, chỉ một thời gian ngắn sau đó, công ty đã nhanh chóng bắt tay vào thử nghiệm và dần mở rộng tính năng nhận diện hình ảnh. Thực tế cho thấy, khả năng đa phương thức đã trở thành một tiêu chuẩn bắt buộc đối với các sản phẩm mô hình lớn hàng đầu hiện nay. Chúng ta có thể thấy điều này ở ChatGPT, Gemini, hay các đại diện trong nước như Doubao, Tencent Yuanbao, và Alibaba Qwen, tất cả đều đã hỗ trợ hiểu hình ảnh. Thậm chí, một số cái tên như Seedance của ByteDance hay Keling của Kuaishou còn tiến xa hơn với khả năng tạo video.

Trước đây, DeepSeek chủ yếu xây dựng lợi thế của mình trong lĩnh vực suy luận thông qua các mô hình như V3 và R1, với sản phẩm chính tập trung vào tương tác văn bản. Việc ra mắt tính năng nhận diện hình ảnh lần này đánh dấu một bước chuyển mình quan trọng, mở rộng ranh giới năng lực của họ từ suy luận văn bản sang đa phương thức.

Không chỉ nâng cấp sản phẩm, DeepSeek gần đây còn được cho là đang tiến hành vòng gọi vốn bên ngoài quy mô lớn đầu tiên kể từ khi thành lập. Theo các báo cáo từ truyền thông nước ngoài, vòng gọi vốn mới nhất của DeepSeek có thể vượt quá 50 tỷ nhân dân tệ (tương đương khoảng 6,9 tỷ USD theo tỷ giá hiện tại) và định giá công ty sau đầu tư có thể lên tới hơn 50 tỷ USD. Điều này sẽ đưa DeepSeek trở thành một trong những công ty khởi nghiệp AI có giá trị cao nhất Trung Quốc.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL2RlZXBzZWVrLWNodXllbi1taW5oLXR1LWFpLXZhbi1iYW4tZGVuLW5oYW4tZGllbi1oaW5oLWFuaC1nb2ktdm9uLTUwLXR5LXVzZC44NTU4NC8=
Top