A-Train The Seven
...'cause for once, I didn't hate myself.
Anthropic vừa công bố Claude 3.7 Sonnet, một mô hình ngôn ngữ mới có khả năng xử lý cả tác vụ chung và suy luận logic, đánh dấu bước tiến đáng chú ý trong cuộc đua AI. Sự ra mắt này diễn ra sau khi các đối thủ lớn như OpenAI (o3), Google (Gemini 2.0 Flash Thinking), xAI (Grok 3 Reasoning) và DeepSeek (R1) giới thiệu các mô hình suy luận lớn (LRM) của riêng họ.
Khác với cách tiếp cận của các phòng thí nghiệm AI khác – tách biệt mô hình ngôn ngữ lớn (LLM) và mô hình suy luận (LRM) thành hai sản phẩm riêng – Anthropic quyết định tích hợp cả hai vào Claude 3.7 Sonnet để mang lại “trải nghiệm liền mạch” cho người dùng. Các đối thủ như OpenAI hay Google từng thừa nhận việc buộc người dùng chọn giữa các mô hình gây không ít phiền toái, họ cũng đang hướng tới mục tiêu tương tự. Tuy nhiên, Anthropic đã đi trước 1 bước khi gộp cả hai khả năng vào cùng mô hình.
Điểm đặc biệt của Claude 3.7 Sonnet là chế độ “extended thinking mode” (chế độ suy nghĩ mở rộng). Khi kích hoạt, mô hình sẽ tự tạo ra một chuỗi suy nghĩ (chain-of-thought – CoT) trước khi đưa ra đáp án cuối cùng – tương tự cách hoạt động của các LRM như o1 hay R1. Anthropic giải thích trên blog: “Chế độ này không chuyển sang một mô hình khác với chiến lược riêng. Nó chỉ đơn giản là cho phép cùng một mô hình dành thêm thời gian và công sức để tìm ra câu trả lời.” Dù vậy, công ty chưa tiết lộ chi tiết cách họ huấn luyện mô hình này để thực hiện cả hai loại suy luận (một số nghiên cứu cho thấy có thể huấn luyện mô hình tự chọn chế độ dựa trên lời nhắc đầu vào).
Không giống Grok 3 hay o3 – vốn chỉ hiển thị phiên bản tóm tắt của CoT để tránh bị đối thủ sao chép – Claude 3.7 Sonnet công khai toàn bộ quá trình suy nghĩ “dạng thô” của mình. Anthropic gọi đây là “bản xem trước nghiên cứu” và ám chỉ rằng họ có thể ẩn CoT trong các phiên bản tương lai: “Chúng tôi sẽ cân nhắc ưu và nhược điểm của việc tiết lộ quá trình suy nghĩ cho các bản phát hành sau.” Sự minh bạch này mang lại cơ hội hiếm có để người dùng và nhà nghiên cứu hiểu rõ cách mô hình đưa ra kết luận.
Theo thử nghiệm của Anthropic, Claude 3.7 Sonnet vượt qua các mô hình hàng đầu khác ở một số lĩnh vực then chốt: kỹ thuật phần mềm (SWE-Bench Verified) và tương tác người dùng-công cụ (TAU-Bench). Nó cũng đạt kết quả gần mức tối ưu trên các bài đánh giá tiêu chuẩn như MATH, AIME 2024 và MMLU. Điều này cho thấy mô hình không chỉ mạnh về suy luận mà còn linh hoạt trong các tác vụ thông thường.
Giống các phiên bản trước của Anthropic, Claude 3.7 Sonnet không mã nguồn mở và chỉ khả dụng qua máy chủ của công ty. Người dùng có thể trải nghiệm qua ứng dụng chatbot Claude, với mọi cấp bậc đều được tiếp cận – kể cả người dùng miễn phí. Tuy nhiên, chế độ suy nghĩ mở rộng bị giới hạn cho các gói trả phí. Mô hình cũng có trên Anthropic API, Amazon Bedrock và Google Vertex AI, với giá 3 USD cho 1 triệu token đầu vào và 15 USD cho 1 triệu token đầu ra. So với OpenAI o1, Claude rẻ hơn đáng kể, dù đắt gấp gần 4 lần o3-mini (giá có thể giảm mạnh nếu dùng bộ nhớ đệm lời nhắc).
API cho phép nhà phát triển đặt giới hạn token suy luận, tránh tình trạng “đốt tiền” ngoài ý muốn – một tính năng thiết thực cho các ứng dụng thực tế.
Các bước truy cập:
Bước 1: Vào đường dẫn https://claude.ai/login và đăng nhập bằng 1 tài khoản Gmail
Bước 2: Lựa chọn dịch vụ giữa Miễn phí hoặc Trả phí 20 USD/tháng
Bước 3: Nhập tên người dùng của bạn và chọn tiếp tục 2 lần.
Bước 4: Nhập liệu đầu vào cho Claude, lưu ý mô hình mặc định sẽ là Claude 3.7 Sonnet luôn.
#ClaudeAI #cáchsửdụngClaudeSonnet #chiphíClaudeSonnet
Claude 3.7 Sonnet có gì đặc biệt?

Khác với cách tiếp cận của các phòng thí nghiệm AI khác – tách biệt mô hình ngôn ngữ lớn (LLM) và mô hình suy luận (LRM) thành hai sản phẩm riêng – Anthropic quyết định tích hợp cả hai vào Claude 3.7 Sonnet để mang lại “trải nghiệm liền mạch” cho người dùng. Các đối thủ như OpenAI hay Google từng thừa nhận việc buộc người dùng chọn giữa các mô hình gây không ít phiền toái, họ cũng đang hướng tới mục tiêu tương tự. Tuy nhiên, Anthropic đã đi trước 1 bước khi gộp cả hai khả năng vào cùng mô hình.
Điểm đặc biệt của Claude 3.7 Sonnet là chế độ “extended thinking mode” (chế độ suy nghĩ mở rộng). Khi kích hoạt, mô hình sẽ tự tạo ra một chuỗi suy nghĩ (chain-of-thought – CoT) trước khi đưa ra đáp án cuối cùng – tương tự cách hoạt động của các LRM như o1 hay R1. Anthropic giải thích trên blog: “Chế độ này không chuyển sang một mô hình khác với chiến lược riêng. Nó chỉ đơn giản là cho phép cùng một mô hình dành thêm thời gian và công sức để tìm ra câu trả lời.” Dù vậy, công ty chưa tiết lộ chi tiết cách họ huấn luyện mô hình này để thực hiện cả hai loại suy luận (một số nghiên cứu cho thấy có thể huấn luyện mô hình tự chọn chế độ dựa trên lời nhắc đầu vào).
MInh bạch quy trình suy luận
Không giống Grok 3 hay o3 – vốn chỉ hiển thị phiên bản tóm tắt của CoT để tránh bị đối thủ sao chép – Claude 3.7 Sonnet công khai toàn bộ quá trình suy nghĩ “dạng thô” của mình. Anthropic gọi đây là “bản xem trước nghiên cứu” và ám chỉ rằng họ có thể ẩn CoT trong các phiên bản tương lai: “Chúng tôi sẽ cân nhắc ưu và nhược điểm của việc tiết lộ quá trình suy nghĩ cho các bản phát hành sau.” Sự minh bạch này mang lại cơ hội hiếm có để người dùng và nhà nghiên cứu hiểu rõ cách mô hình đưa ra kết luận.
Hiệu suất vượt trội
Theo thử nghiệm của Anthropic, Claude 3.7 Sonnet vượt qua các mô hình hàng đầu khác ở một số lĩnh vực then chốt: kỹ thuật phần mềm (SWE-Bench Verified) và tương tác người dùng-công cụ (TAU-Bench). Nó cũng đạt kết quả gần mức tối ưu trên các bài đánh giá tiêu chuẩn như MATH, AIME 2024 và MMLU. Điều này cho thấy mô hình không chỉ mạnh về suy luận mà còn linh hoạt trong các tác vụ thông thường.

Cách truy cập và giá cả
Giống các phiên bản trước của Anthropic, Claude 3.7 Sonnet không mã nguồn mở và chỉ khả dụng qua máy chủ của công ty. Người dùng có thể trải nghiệm qua ứng dụng chatbot Claude, với mọi cấp bậc đều được tiếp cận – kể cả người dùng miễn phí. Tuy nhiên, chế độ suy nghĩ mở rộng bị giới hạn cho các gói trả phí. Mô hình cũng có trên Anthropic API, Amazon Bedrock và Google Vertex AI, với giá 3 USD cho 1 triệu token đầu vào và 15 USD cho 1 triệu token đầu ra. So với OpenAI o1, Claude rẻ hơn đáng kể, dù đắt gấp gần 4 lần o3-mini (giá có thể giảm mạnh nếu dùng bộ nhớ đệm lời nhắc).
API cho phép nhà phát triển đặt giới hạn token suy luận, tránh tình trạng “đốt tiền” ngoài ý muốn – một tính năng thiết thực cho các ứng dụng thực tế.
Các bước truy cập:

Bước 1: Vào đường dẫn https://claude.ai/login và đăng nhập bằng 1 tài khoản Gmail

Bước 2: Lựa chọn dịch vụ giữa Miễn phí hoặc Trả phí 20 USD/tháng

Bước 3: Nhập tên người dùng của bạn và chọn tiếp tục 2 lần.

Bước 4: Nhập liệu đầu vào cho Claude, lưu ý mô hình mặc định sẽ là Claude 3.7 Sonnet luôn.
#ClaudeAI #cáchsửdụngClaudeSonnet #chiphíClaudeSonnet