Hermes Agent gây chú ý, nhưng chưa giải quyết được vấn đề cốt lõi của AI

Trường Sơn
Trường Sơn
Phản hồi: 0
Hermes Agent, công cụ do Nous Research phát hành hồi tháng Hai, đang thu hút sự chú ý lớn trong giới công nghệ. Điểm nổi bật của nó là khả năng tự học: sau mỗi nhiệm vụ hoàn thành, công cụ tự động đúc kết kinh nghiệm thành kỹ năng để tái sử dụng và cải thiện dần theo thời gian.
Tuy nhiên, giới chuyên môn đặt câu hỏi liệu kỹ năng có thực sự là trở ngại lớn nhất của các hệ thống AI hiện nay hay không.

Hai vấn đề bị chỉ trích nhiều nhất ở các công cụ AI tương tự là tiêu thụ token quá cao, dẫn đến chi phí không bền vững, và tính ổn định kém trong các tác vụ kéo dài. Cả hai đều bắt nguồn từ cùng một nguyên nhân: các công cụ nền tảng quá yếu. Khi công cụ không đáng tin, AI phải thử đi thử lại nhiều lần, mỗi lần đều tiêu tốn thêm token dù nhiệm vụ chưa hoàn thành. Một người dùng trên Reddit cho biết chỉ để tự động đăng bài lên mạng xã hội, họ đã tốn 10 đô la sau ba lần thử mà vẫn chưa xong.

Trong khi đó, Claude Code, một trong những công cụ lập trình AI được đánh giá cao nhất hiện nay, lại không dựa vào kỹ năng tự động mà dựa vào bộ công cụ dòng lệnh chắc chắn ở phía sau. Mỗi thao tác là một hành động nguyên tử, gần như không tốn token và cho kết quả nhất quán.

Vấn đề là kỹ năng hoạt động dựa trên ngôn ngữ tự nhiên, phụ thuộc vào năng lực của mô hình AI bên dưới, nên khi mô hình thay đổi, hành vi cũng thay đổi theo. Giao diện dòng lệnh thì khác: cùng một lệnh luôn cho ra cùng một kết quả, dễ kiểm tra và không phụ thuộc vào mô hình nào.
1775879653152.png

Xu hướng đáng chú ý hơn là người dùng giao diện dòng lệnh đang dần chuyển từ con người sang AI. Con người có thể dừng lại, đoán mò khi tài liệu thiếu sót và kiên nhẫn thử lại. AI thì không: nó hoạt động liên tục, đồng thời và sẽ thử lại vô hạn lần ở những thời điểm không ai ngờ tới. Điều đó đòi hỏi giao diện dòng lệnh phải được thiết kế lại từ đầu với triết lý khác hoàn toàn, mỗi lệnh chỉ cho một kết quả duy nhất, thông báo lỗi phải chỉ rõ bước tiếp theo cần làm và các tác vụ dài phải hỗ trợ xử lý bất đồng bộ.

Trạng thái lý tưởng của các hệ thống AI trong tương lai sẽ gồm ba lớp phân công rõ ràng: giao diện dòng lệnh xử lý các tác vụ xác định không cần AI, lớp kỹ năng điều phối ngữ cảnh và tích lũy kinh nghiệm, còn mô hình ngôn ngữ lớn chỉ can thiệp khi thực sự cần phán đoán. Nhiều hệ thống hiện nay bỏ qua lớp đầu tiên, dồn hết vào hai lớp còn lại, khiến chi phí cao, tốc độ chậm và dễ lỗi.

Hermes giải quyết được lớp giữa, nhưng chiến trường thực sự vẫn nằm ở lớp nền tảng ít hào nhoáng nhất.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL2hlcm1lcy1hZ2VudC1nYXktY2h1LXktbmh1bmctY2h1YS1naWFpLXF1eWV0LWR1b2MtdmFuLWRlLWNvdC1sb2ktY3VhLWFpLjgxNzA4Lw==
Top