Claude 3.7 Sonnet trình làng: AI 'chơi' cả Pokémon, chứng minh khả năng suy luận vượt trội

Mai Nhung · 12:46

Anthropic, công ty do một nhóm cựu lãnh đạo OpenAI sáng lập, vừa ra mắt Claude 3.7 Sonnet, mô hình AI mới nhất và tiên tiến nhất của hãng. Công ty mô tả mô hình AI mới này là một "sản phẩm lai", có khả năng đưa ra phản hồi gần như tức thì, đồng thời có thể tham gia vào quá trình "suy nghĩ mở rộng", cho phép đưa ra câu trả lời và hoàn thành nhiệm vụ với chất lượng cao hơn. Anthropic cũng công bố một công cụ lập trình mới dựa trên Claude, có tên là Claude Code.

View attachment 37913

Claude 3.7 Sonnet: Kết Hợp Phản Ứng Nhanh và Lý Luận Sâu

Khi mô hình hàng đầu trước đó của Anthropic, Claude 3.5 Sonnet, được phát hành vào tháng 6 năm 2024, nó đã được ca ngợi về khả năng lập trình vượt trội và được sử dụng để phát triển một số ứng dụng dành cho những người không có nền tảng lập trình, chẳng hạn như Replit. Mô hình mới, Claude 3.7 Sonnet, còn tiến xa hơn nữa bằng cách tích hợp khả năng lý luận.

Điều này có nghĩa là mô hình có thể "suy nghĩ" về cách tốt nhất để giải quyết một vấn đề hoặc trả lời một truy vấn bằng cách sử dụng một quy trình tương tự như chuỗi suy nghĩ của con người, thay vì đưa ra một phản hồi máy móc.

View attachment 37914

Cho đến nay, các mô hình lý luận như o1 của OpenAI và các mô hình ngôn ngữ lớn như GPT-4o của OpenAI được cung cấp dưới dạng các sản phẩm riêng biệt. Tuy nhiên, Claude 3.7 Sonnet cho phép các nhà phát triển truy cập cả hai trong một gói duy nhất. "Giống như con người sử dụng một bộ não duy nhất cho cả phản ứng nhanh và suy ngẫm sâu sắc," công ty viết trong một bài đăng trên blog, "chúng tôi tin rằng lý luận nên là một khả năng tích hợp của các mô hình tiên tiến, thay vì một mô hình riêng biệt hoàn toàn."

Đơn Giản Hóa Mô Hình AI: Xu Hướng Của Tương Lai?

Anthropic không phải là doanh nghiệp AI duy nhất đang nỗ lực đơn giản hóa các sản phẩm của mình bằng cách tích hợp nhiều khả năng vào một mô hình duy nhất. Đầu tháng này, Sam Altman, đồng sáng lập và CEO của OpenAI, cho biết trên X rằng công ty của ông sẽ phát hành GPT-5, được mong đợi từ lâu, vào cuối năm nay, và tiết lộ rằng nó sẽ hợp nhất các mô hình dòng GPT và dòng o của công ty thành một hệ thống duy nhất.

Kiểm Soát Chi Phí AI: Tính Năng Đột Phá Cho Doanh Nghiệp

Theo Anthropic, các nhà phát triển sẽ có thể chọn mức độ "suy nghĩ" mà Claude 3.7 Sonnet sử dụng khi tận dụng khả năng lý luận của nó để hoàn thành nhiệm vụ. Đối với các doanh nghiệp nhỏ muốn sử dụng Claude, đây là một điểm quan trọng:

Bạn có thể hướng dẫn API của Claude "suy nghĩ" trong một số lượng token (đơn vị dữ liệu được mô hình xử lý và được sử dụng để xác định giá) cụ thể.
Sử dụng nhiều token hơn có thể mang lại câu trả lời chất lượng cao hơn nhưng đắt hơn, trong khi ít token hơn sẽ cho câu trả lời đơn giản hơn, rẻ hơn.
Điều đó có nghĩa là các doanh nhân có ngân sách hạn chế có thể đặt giới hạn ngân sách cho các tính năng AI của họ, đảm bảo rằng họ chỉ phải trả tối đa một số tiền nhất định cho mỗi lần gọi API.

Hiệu Suất Vượt Trội: Thử Nghiệm Thực Tế và... Chơi Pokémon

Trong các bài kiểm tra đánh giá khả năng giải quyết các vấn đề phần mềm thực tế và sử dụng giao diện máy tính một cách chính xác mà không cần sự hỗ trợ của con người, Claude 3.7 Sonnet đã vượt trội hơn các phiên bản trước của Claude và mô hình o1 của OpenAI. Anthropic cũng cho biết, "Ngoài các bài kiểm tra truyền thống," mô hình mới "thậm chí còn vượt trội hơn tất cả các mô hình trước đây trong các bài kiểm tra chơi trò chơi Pokémon của chúng tôi."

View attachment 37915

Claude Code: Công Cụ Hỗ Trợ Lập Trình Mạnh Mẽ

Ngoài Claude 3.7 Sonnet, Anthropic còn phát hành một công cụ mã hóa tác nhân có tên là Claude Code, mà công ty cho biết có thể đóng vai trò là "một cộng tác viên tích cực, có thể tìm kiếm và đọc mã, chỉnh sửa tệp, viết và chạy thử nghiệm, cam kết và đẩy mã lên GitHub, và sử dụng các công cụ dòng lệnh." Anthropic cho biết các nhóm nội bộ của họ đã sử dụng công cụ này để hỗ trợ gỡ lỗi phần mềm và giảm khối lượng công việc phát triển. Các nhà phát triển cũng có thể kết nối trực tiếp kho mã GitHub của họ với Claude.ai, sản phẩm hướng đến người tiêu dùng của Anthropic.

Cải Thiện Khả Năng Phân Biệt Ngữ Cảnh

Anthropic cũng cho biết mô hình mới tốt hơn trong việc phân biệt "sắc thái giữa các yêu cầu có hại và vô hại". Claude đã bị chỉ trích trong quá khứ vì từ chối hỗ trợ các yêu cầu không thực sự có hại, nhưng nhờ khả năng hiểu sắc thái được cải thiện, Anthropic cho biết 3.7 Sonnet từ chối các yêu cầu ít hơn 45% so với phiên bản tiền nhiệm.

Giá Cả Không Đổi

Giá API của Claude 3.7 Sonnet vẫn không thay đổi so với Claude 3.5 Sonnet. Các nhà phát triển sẽ cần phải trả 3 đô la cho mỗi triệu token đầu vào và 15 đô la cho mỗi triệu token đầu ra.

#ClaudeAI

Chủ đề hot

Có thể bạn quan tâm

Claude 3.7 Sonnet trình làng: AI 'chơi' cả Pokémon, chứng minh khả năng suy luận vượt trội

Mai Nhung

Writer

Mai Nhung

Claude 3.7 Sonnet là gì? Cách truy cập và chi phí sử dụng Claude 3.7 Sonnet

Claude 3.7 Sonnet trình làng: AI 'chơi' cả Pokémon, chứng minh khả năng suy luận vượt trội

Lại 1 mô hình AI được quảng bá là "siêu AI" có thể suy nghĩ như con người

Chuyện gì thế này: video ông Trump hôn chân Elon Musk phát ngay tại cơ quan chính phủ Mỹ

Dự báo thời tiết bằng mô hình AI hiệu quả hơn 20%, tiết kiệm năng lượng gấp 1.000 lần

6 xu hướng lớn về AI cần chú ý năm 2025: Từ lý luận lai đến khả năng lập trình siêu phàm

Tại sao Gmail từ bỏ xác thực bằng tin nhắn SMS để chuyển sang mã QR?

Cục diện tranh giành quyền lực ngành công nghiệp bán dẫn toàn cầu bây giờ ra sao?

Elon Musk vừa tiết lộ lý do thực sự của email khiến công chức liên bang khủng hoảng tinh thần

Khám phá về siêu tân tinh có thể làm thay đổi hoàn toàn hiểu biết của chúng ta về lịch sử vũ trụ!

Xiaomi sắp ra flagship Android khiến Galaxy S25 Ultra trở thành "đồ cổ"

Sẽ ra sao nếu Trái Đất không có khí quyển?

Làm thế nào để phát hiện ra cuộc gọi lừa đảo?

Vị vua kỳ lạ trong sử Việt: 41 tuổi xuất gia, 2 lần từ chối vương vị

Chuẩn USB 3.2 là gì? Giải thích ngắn gọn về USB 3.2 và lý do cần chú ý khi mua ổ USB

Hibernate (ngủ đông) là gì? Khác gì so với sleep mode?

Đánh giá nổi bật