Lại 1 mô hình AI được quảng bá là "siêu AI" có thể suy nghĩ như con người

A-Train The Seven
A-Train The Seven
Phản hồi: 0

A-Train The Seven

...'cause for once, I didn't hate myself.
Trong bối cảnh các công ty khởi nghiệp và gã khổng lồ công nghệ đang chạy đua để giành lợi thế trong lĩnh vực trí tuệ nhân tạo (AI), Anthropic tuyên bố đã phát triển mô hình AI "thông minh nhất" của công ty cho đến nay. Startup được Amazon hậu thuẫn này đã ra mắt Claude 3.7 Sonnet vào thứ Hai. Điều khiến nó trở nên độc đáo là cái gọi là mô hình lai, kết hợp khả năng suy luận — hoặc dừng lại để suy nghĩ về những câu trả lời phức tạp — với một mô hình truyền thống đưa ra câu trả lời trong thời gian thực.

Anthropic đang phát hành một mô hình AI biên mới có tên là Claude 3.7 Sonnet, được công ty thiết kế để "suy nghĩ" về các câu hỏi bao lâu tùy theo người dùng muốn. Anthropic gọi Claude 3.7 Sonnet là "mô hình suy luận AI lai" đầu tiên của ngành, bởi vì nó là một mô hình duy nhất có thể đưa ra cả câu trả lời theo thời gian thực và câu trả lời "suy nghĩ" kỹ lưỡng hơn cho các câu hỏi. Người dùng có thể chọn kích hoạt khả năng "suy luận" của mô hình AI, điều này sẽ nhắc Claude 3.7 Sonnet "suy nghĩ" trong một khoảng thời gian ngắn hoặc dài.

Mô hình này thể hiện nỗ lực rộng lớn hơn của Anthropic nhằm đơn giản hóa trải nghiệm người dùng xung quanh các sản phẩm AI của mình. Hầu hết các chatbot AI ngày nay đều có một bộ chọn mô hình khó hiểu, buộc người dùng phải chọn từ một số tùy chọn khác nhau, khác nhau về chi phí và khả năng. Các phòng thí nghiệm như Anthropic muốn bạn không phải suy nghĩ về điều đó - lý tưởng nhất là một mô hình thực hiện tất cả công việc.

1740455622087.png


Anthropic cho biết Claude 3.7 Sonnet sẽ được tung ra cho tất cả người dùng và nhà phát triển vào thứ Hai, nhưng chỉ những người trả tiền cho các gói chatbot Claude cao cấp của Anthropic mới có quyền truy cập vào các tính năng suy luận của mô hình. Người dùng Claude miễn phí sẽ nhận được phiên bản Claude 3.7 Sonnet tiêu chuẩn, không suy luận, mà Anthropic tuyên bố vượt trội hơn mô hình AI biên trước đó của nó, Claude 3.5 Sonnet.

Claude 3.7 Sonnet có giá 3 đô la cho mỗi triệu token đầu vào (có nghĩa là bạn có thể nhập khoảng 750.000 từ, nhiều từ hơn toàn bộ bộ truyện "Chúa tể của những chiếc nhẫn", vào Claude với giá 3 đô la) và 15 đô la cho mỗi triệu token đầu ra. Điều đó làm cho nó đắt hơn so với o3-mini của OpenAI (1,10 đô la cho mỗi 1 triệu token đầu vào/4,40 đô la cho mỗi 1 triệu token đầu ra) và R1 của DeepSeek (55 xu cho mỗi 1 triệu token đầu vào/2,19 đô la cho mỗi 1 triệu token đầu ra), nhưng hãy nhớ rằng o3-mini và R1 là các mô hình suy luận nghiêm ngặt - không phải là mô hình lai như Claude 3.7 Sonnet.

Claude 3.7 Sonnet là mô hình AI đầu tiên của Anthropic có thể "suy luận", một kỹ thuật mà nhiều phòng thí nghiệm AI đã chuyển sang khi các phương pháp cải thiện hiệu suất AI truyền thống giảm dần tính hiệu quả.

1740455639617.png


Các mô hình suy luận như o3-mini, R1, Gemini 2.0 Flash Thinking của Google và Grok 3 (Think) của xAI sử dụng nhiều thời gian và sức mạnh tính toán hơn trước khi trả lời câu hỏi. Các mô hình chia nhỏ các vấn đề thành các bước nhỏ hơn, có xu hướng cải thiện độ chính xác của câu trả lời cuối cùng. Các mô hình suy luận không suy nghĩ hoặc suy luận giống như một con người, nhất thiết phải như vậy, nhưng quá trình của chúng được mô phỏng theo suy diễn.

Cuối cùng, Anthropic muốn Claude tự tìm ra thời gian "suy nghĩ" về các câu hỏi, mà không cần người dùng chọn các điều khiển trước, trưởng bộ phận sản phẩm và nghiên cứu của Anthropic, Dianne Penn, nói với TechCrunch trong một cuộc phỏng vấn.

"Tương tự như cách con người không có hai bộ não riêng biệt cho các câu hỏi có thể được trả lời ngay lập tức so với những câu hỏi cần suy nghĩ," Anthropic đã viết trong một bài đăng trên blog được chia sẻ với TechCrunch, "chúng tôi coi suy luận đơn giản là một trong những khả năng mà một mô hình biên nên có, được tích hợp trơn tru với các khả năng khác, thay vì một cái gì đó được cung cấp trong một mô hình riêng biệt."

Anthropic cho biết họ đang cho phép Claude 3.7 Sonnet hiển thị giai đoạn lập kế hoạch nội bộ của mình thông qua một "bảng nháp có thể nhìn thấy". Penn nói với TechCrunch rằng người dùng sẽ thấy toàn bộ quá trình suy nghĩ của Claude đối với hầu hết các lời nhắc, nhưng một số phần có thể bị che giấu vì mục đích tin cậy và an toàn.

1740455753219.png


Anthropic cho biết họ đã tối ưu hóa các chế độ tư duy của Claude cho các tác vụ trong thế giới thực, chẳng hạn như các vấn đề viết code khó khăn hoặc các tác vụ tác nhân. Các nhà phát triển khai thác API của Anthropic có thể kiểm soát "ngân sách" cho việc suy nghĩ, đánh đổi tốc độ và chi phí để có chất lượng câu trả lời.

Trong một bài kiểm tra để đo lường các tác vụ viết code trong thế giới thực, SWE-Bench, Claude 3.7 Sonnet chính xác 62,3%, so với mô hình o3-mini của OpenAI đạt 49,3%. Trong một thử nghiệm khác để đo lường khả năng tương tác của mô hình AI với người dùng mô phỏng và API bên ngoài trong bối cảnh bán lẻ, TAU-Bench, Claude 3.7 Sonnet đạt 81,2%, so với mô hình o1 của OpenAI đạt 73,5%.

Anthropic cũng cho biết Claude 3.7 Sonnet sẽ từ chối trả lời các câu hỏi ít hơn so với các mô hình trước đây của nó, tuyên bố rằng mô hình này có khả năng phân biệt sắc thái hơn giữa các lời nhắc có hại và lành tính. Anthropic cho biết họ đã giảm 45% số lần từ chối không cần thiết so với Claude 3.5 Sonnet. Điều này diễn ra vào thời điểm mà một số phòng thí nghiệm AI khác đang suy nghĩ lại về cách tiếp cận của họ để hạn chế câu trả lời của chatbot AI của họ.

Ngoài Claude 3.7 Sonnet, Anthropic cũng đang phát hành một công cụ viết code tác nhân có tên là Claude Code. Ra mắt dưới dạng bản xem trước nghiên cứu, công cụ này cho phép các nhà phát triển chạy các tác vụ cụ thể thông qua Claude trực tiếp từ thiết bị đầu cuối của họ.

1740455782885.png


Trong một bản demo, các nhân viên của Anthropic đã cho thấy cách Claude Code có thể phân tích một dự án viết code bằng một lệnh đơn giản như, "Giải thích cấu trúc dự án này." Sử dụng tiếng Anh đơn giản trong dòng lệnh, nhà phát triển có thể sửa đổi một cơ sở mã. Claude Code sẽ mô tả các chỉnh sửa của nó khi nó thực hiện các thay đổi và thậm chí kiểm tra một dự án xem có lỗi hay không hoặc đẩy nó lên kho lưu trữ GitHub.

Claude Code ban đầu sẽ có sẵn cho một số lượng người dùng hạn chế trên cơ sở "ai đến trước được phục vụ trước", một phát ngôn viên của Anthropic nói với TechCrunch. Anthropic đang phát hành Claude 3.7 Sonnet vào thời điểm các phòng thí nghiệm AI đang tung ra các mô hình AI mới với tốc độ chóng mặt. Anthropic trong lịch sử đã có một cách tiếp cận có phương pháp, tập trung vào an toàn hơn. Nhưng lần này, công ty đang tìm cách dẫn đầu.

Tuy nhiên, câu hỏi là trong bao lâu. OpenAI có thể sắp phát hành một mô hình AI lai của riêng mình; Giám đốc điều hành của công ty, Sam Altman, đã nói rằng nó sẽ đến trong "vài tháng". Jared Kaplan, đồng sáng lập và trưởng phòng khoa học của Anthropic, nói với CNBC trong một cuộc phỏng vấn: “Mô hình này có tất cả các khả năng được kết hợp lại với nhau — chúng tôi muốn một AI mạch lạc có thể giúp ích cho mọi thứ. Có một lợi thế về sự đơn giản cho khách hàng của chúng tôi."

Anthropic cho biết đây là mô hình "lai" duy nhất thuộc loại này có sẵn trên thị trường và sẽ hoạt động ngay lập tức. Kaplan ví nó với cách bộ não con người hoạt động. Một số câu hỏi đòi hỏi suy nghĩ sâu sắc, một số đòi hỏi phản ứng nhanh chóng. Nhưng Anthropic đang tìm cách tích hợp cả hai khả năng, thay vì có một mô hình hoàn toàn riêng biệt cho cả hai.

Động thái này có thể mang lại cho Anthropic một lợi thế rất cần thiết trước đối thủ OpenAI và các công ty công nghệ lớn đều đang đầu tư mạnh vào các mô hình AI. Chatbot Claude của Anthropic là đối thủ cạnh tranh với ChatGPT của OpenAI và Gemini của Google. CNBC đã đưa tin rằng Anthropic đang đàm phán để huy động tới 2 tỷ đô la từ Lightspeed và Google với mức định giá 60 tỷ đô la. Amazon đã rót khoảng 8 tỷ đô la để hỗ trợ công ty khởi nghiệp.

Mike Krieger, trưởng bộ phận sản phẩm của Anthropic, người trước đây đã đồng sáng lập Instagram, cho biết cách tiếp cận kết hợp là một cách để đơn giản hóa quy trình chatbot cho khách hàng. Họ có thể sử dụng nhiều khả năng mà không cần phải suy nghĩ xem lựa chọn nào là tốt nhất. Krieger nói với CNBC: "Các mô hình đều có cá tính, tất cả đều hơi khác nhau", đồng thời cho biết thêm rằng "rất nhiều" để người tiêu dùng lựa chọn mô hình hoặc thời gian họ muốn nó suy luận. "Tôi muốn mọi người, người dùng cuối, không phải suy nghĩ về điều đó nhiều."

Krieger cho biết người dùng có thể bật hoặc tắt tùy chọn kết hợp để đơn giản. Họ có thể cung cấp cho nó một "ngân sách" thời gian dựa trên những gì họ đang làm việc. Anthropic cũng sẽ tung ra một công cụ để viết code sử dụng các tác nhân vào thứ Hai. Công ty khởi nghiệp đã có một vài chiến thắng với việc ra mắt sản phẩm trước các đối thủ cạnh tranh. Nó cũng là người đầu tiên tiết lộ một khả năng "tác nhân" có sẵn rộng rãi vào cuối năm ngoái, mà OpenAI đã sớm theo sau. Krieger và Kaplan đều cho biết họ hy vọng các đối thủ cạnh tranh sẽ đi theo hướng này với các mô hình kết hợp.

Giám đốc điều hành OpenAI Sam Altman đã gợi ý về việc đi theo một hướng tương tự vào đầu tháng Hai. Trong một bài đăng trên X, Altman cho biết công ty AI của ông có kế hoạch "thực hiện công việc tốt hơn trong việc chia sẻ lộ trình dự định của chúng tôi và công việc tốt hơn nhiều trong việc đơn giản hóa các sản phẩm của chúng tôi." Altman viết: "Chúng tôi ghét bộ chọn mô hình cũng như bạn và muốn quay trở lại trí thông minh thống nhất kỳ diệu."

#ClaudeAI #cáchsửdụngClaudeSonnet #chiphíClaudeSonnet
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top