Giờ đây, trí tuệ nhân tạo có thể tự kiểm tra mã nguồn; Opus 4.7 giải quyết vấn đề "đống mã rác"

Thoại Viết Hoàng · 17/04/2026

Anthropic vừa ra mô hình mới, nhưng cố tình làm nó... yếu hơn.

Hầu hết các công ty AI khi ra mắt sản phẩm đều nói: "Đây là thứ mạnh nhất chúng tôi có." Anthropic thì nói ngược lại: "Chúng tôi có thứ mạnh hơn, nhưng chưa thể đưa ra cho bạn."

Và đó chính xác là những gì xảy ra với Claude Opus 4.7, ra mắt ngày 17/4/2026.

Trước Opus 4.7, Anthropic vừa công bố một mô hình nội bộ tên Mythos, nhưng phải tạm dừng phát hành vì khả năng tấn công mạng của nó quá mạnh. Thay vào đó, họ ra Opus 4.7 như một phiên bản thử nghiệm, trong đó một số khả năng bảo mật mạng đã bị cố ý giới hạn trong quá trình huấn luyện.

Nghe lạ, nhưng đây không phải sự thừa nhận thất bại. Đây là một lựa chọn có chủ ý.

Opus 4.7 thực sự mạnh hơn ở đâu?

Về lập trình, Opus 4.7 đạt 87,6% trên bài kiểm tra SWE-Bench Verified, so với 80,8% của phiên bản trước. Trên bài kiểm tra khó hơn là SWE-Bench Pro, con số là 64,3% so với 53,4%. Dịch ra ngôn ngữ thực tế: bạn có thể giao cho nó những tác vụ lập trình phức tạp hơn, và nó sẽ xử lý kỹ càng hơn, tuân thủ hướng dẫn chính xác hơn, thậm chí tự kiểm tra đầu ra trước khi báo cáo.

Về hình ảnh, mô hình giờ nhận ảnh có độ phân giải lên tới khoảng 3,75 megapixel, gấp hơn ba lần trước. Mục tiêu không phải để nhận dạng ảnh thông thường mà để AI có thể nhìn rõ màn hình phần mềm, bảng dữ liệu dày đặc hay giao diện dòng lệnh. Nếu AI không nhìn rõ "đang làm việc ở đâu", khả năng vận hành của nó gần như vô nghĩa.

Về bộ nhớ, Opus 4.7 có thể ghi nhớ các quyết định, ràng buộc và sở thích người dùng qua nhiều phiên làm việc. Đây là bước chuyển từ "nhân viên tạm thời thông minh" sang "đồng nghiệp ổn định".

Một điểm cần lưu ý nếu bạn dùng Claude thường xuyên

Opus 4.7 tuân thủ hướng dẫn theo nghĩa đen, chặt hơn hẳn các phiên bản trước. Trước đây Claude hay tự "đọc ý" và bỏ qua những yêu cầu mơ hồ hoặc mâu thuẫn. Giờ thì không. Điều này có nghĩa là các prompt cũ vốn hoạt động tốt có thể cho ra kết quả khác, đôi khi không như kỳ vọng.

Giá niêm yết không đổi: 5 USD cho mỗi triệu token đầu vào, 25 USD cho đầu ra (khoảng 129.000 và 644.000 đồng). Nhưng bộ mã hóa mới có thể khiến cùng một đoạn văn tốn nhiều token hơn từ 1 đến 1,35 lần. Cộng thêm việc mô hình "nghĩ nhiều hơn" ở chế độ mạnh, chi phí thực tế có thể cao hơn dù tên gọi vẫn vậy.

Anthropic lý giải rằng nếu mô hình làm đúng ngay từ đầu thay vì thử sai nhiều lần, tổng chi phí cho cả tác vụ vẫn thấp hơn.

Bài học lớn hơn từ cách Anthropic ra mắt sản phẩm

Các công ty AI trước nay cạnh tranh theo kiểu "tôi giỏi hơn bạn", chạy đua điểm số và tham số. Nhưng khi mô hình đủ mạnh để gây hại, logic đó bắt đầu vỡ.

Anthropic chọn hướng khác: khóa mô hình mạnh nhất lại, dùng phiên bản có kiểm soát để thử nghiệm cơ chế bảo mật, và biến sự "kiềm chế" đó thành một điểm khác biệt của sản phẩm.

Liệu thị trường có chấp nhận điều đó không, chỉ có thời gian trả lời. Nhưng ít nhất Anthropic đã đặt ra một câu hỏi mà nhiều người chưa nghĩ tới: đôi khi "biết mình không nên làm gì" quan trọng hơn "biết mình có thể làm gì".

#Opus47

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Giờ đây, trí tuệ nhân tạo có thể tự kiểm tra mã nguồn; Opus 4.7 giải quyết vấn đề "đống mã rác"

Thoại Viết Hoàng

Writer

Thoại Viết Hoàng

Chỉ cần vài giây để AI Gemini bóc tách và tóm tắt nội dung cả video Youtube, khỏi cần xem

Người dùng Google AI Pro sẽ được xem YouTube Premium hoàn toàn miễn phí

Một mô hình AI làm chao đảo cả chính sách Nhà Trắng. Trump đột ngột hủy ký sắc lệnh về AI vào phút chót

6 prompt bắt ChatGPT, Claude AI viết như người dành cho ngành marketing và truyền thông

Sinh viên giỏi tăng đột biến vì ChatGPT, giờ sao?

7 việc trợ lý AI Gemini Spark mới của Google có thể làm cho chúng ta

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Thị trường TV quý 1/2026: TCL tăng trưởng bùng nổ, áp sát ngôi vương của Samsung

Đánh giá nổi bật