Mô hình AI 'Hybrid Reasoning' đầu tiên trên thế giới hoạt động thế nào

Ngọc Yến
Ngọc Yến
Phản hồi: 0
1740450503924.png

Anthropic đã ra mắt Claude 3.7 Sonnet, mô hình ngôn ngữ mới của họ có mô hình lý luận lai. Mô hình này tích hợp lý luận với mô hình cốt lõi, cải thiện hiệu suất trên nhiều tác vụ khác nhau. Ngoài ra, Claude Code, một công cụ dành cho nhà phát triển, cho phép mã hóa liền mạch từ thiết bị đầu cuối.
1740450717928.png


Anthropic được Amazon hậu thuẫn đã ra mắt mô hình ngôn ngữ mới nhất, Claude 3.7 Sonnet, cạnh tranh với ChatGPT, DeepSeek và các đối thủ khác và thậm chí còn tiến xa hơn với việc ra mắt mô hình lý luận lai đầu tiên. Anthropic đã bước những bước đầu tiên vào các tác nhân AI với một công cụ mới dành cho các nhà phát triển có tên là Claude Code.
Đáng chú ý là Claude đã chuyển hướng khỏi cách kể chuyện truyền thống về việc có một mô hình được đào tạo trước và một mô hình lý luận độc lập với nhau. Thay vào đó, công ty do Dario Amodei lãnh đạo đã tích hợp mô hình lý luận cùng với mô hình biên giới, nghĩa là người dùng chỉ cần yêu cầu chatbot khi họ muốn nó suy nghĩ lâu hơn trước khi trả lời, về cơ bản là kích hoạt chế độ lý luận, trong đó nó sẽ tự phản ánh trước khi trả lời bất kỳ truy vấn nào. Claude cho biết việc kích hoạt chế độ lý luận (hay như họ gọi là 'chế độ suy nghĩ mở rộng') sẽ giúp cải thiện hiệu suất của mô hình về toán học, vật lý, hướng dẫn theo dõi và mã hóa cùng với nhiều nhiệm vụ khác.

Mô hình lý luận là gì? Tại sao nó lại là vấn đề lớn?​

Mô hình lý luận là một loại LLM khác (lực lượng đằng sau các chatbot khác nhau), được thiết kế để mô phỏng suy nghĩ giống con người nhằm giải quyết các vấn đề phức tạp hơn. Mô hình lý luận, o1, được OpenAI ra mắt vào tháng 9 năm ngoái và kể từ đó đã có một loạt các lần ra mắt như vậy từ những công ty như Google, Grok và thậm chí là DeepSeek.
Anthropic cho biết mô hình lý luận của họ được tối ưu hóa ít hơn cho các vấn đề toán học và khoa học máy tính và nhiều hơn cho việc giải quyết các nhiệm vụ trong thế giới thực. Công ty tuyên bố rằng với các mô hình mới, họ sẽ có thể duy trì "vị thế dẫn đầu về mã hóa" trong một thị trường AI tạo ra có tính cạnh tranh cao.
Nó cũng cho thấy một số điểm chuẩn trong đó Claude 3.7 Sonnet đạt điểm chính xác cao hơn nhiều so với các đối thủ như OpenAI o-3 Mini (Cao) và DeepSeek R1.
Tuy nhiên, không giống như các mô hình AI khác như Grok 3 lý luận, DeepSeek R1 hoặc o3 Mini (băng thông hạn chế) được cung cấp miễn phí, chế độ suy nghĩ mở rộng của Claude 3.7 Sonnet sẽ chỉ khả dụng cho các thành viên trả phí. Trong khi đó, người dùng miễn phí có thể truy cập vào mô hình được đào tạo trước mới nhất, Claude 3.7 Sonnet.

Anthropic đã phát triển công cụ tác nhân đầu tiên:​

Anthropic cũng đã công bố sản phẩm agentic đầu tiên của mình trong bản xem trước giới hạn, Claude Code - một công cụ dòng lệnh nhằm mục đích cho phép các nhà phát triển ủy thác các nhiệm vụ kỹ thuật quan trọng của họ trực tiếp từ thiết bị đầu cuối của họ. Claude cho biết họ đã cải thiện trải nghiệm mã hóa trên trang web của mình nhưng tiện ích mở rộng Github của họ cũng khả dụng trên tất cả các gói, cho phép các nhà phát triển kết nối kho lưu trữ mã hóa của họ trực tiếp với chatbot.
Công ty cho biết Claude Code có thể 'tìm kiếm và đọc mã, chỉnh sửa tệp, viết và chạy thử nghiệm, cam kết và đẩy mã lên GitHub và sử dụng các công cụ dòng lệnh' trong khi vẫn đảm bảo người dùng luôn cập nhật ở mọi bước. #Claude3.7Sonnet
 


Đăng nhập một lần thảo luận tẹt ga
Top