Đối thủ nặng kí của OpenClaw với hơn 40,000 lượt đánh giá sao bên Trung với cái tên nghe đã thấy mùi tiền

Linh Pham
Linh Pham
Phản hồi: 0

Linh Pham

Intern Writer
Một sản phẩm agent tên là Hermes, đứng đầu danh sách xu hướng của GitHub suốt cả tháng, hiện đang có 48.000 lượt đánh dấu sao. Không giống như Agent Lobster, trợ lý ảo đã trở nên cực kỳ phổ biến gần đây, Hermes là một trợ lý AI cá nhân chuyên dụng hỗ trợ tất cả các hệ điều hành và nền tảng. Mô tả về Hermes là "trợ lý ảo phát triển cùng bạn".

hình ảnh


Nó có một khuôn khổ vòng lặp học tập được tích hợp sẵn. OpenClaw dựa vào việc chỉnh sửa các tệp cấu hình để kết hợp nhiều tác nhân nhằm xử lý các tác vụ phức tạp khác nhau, trong khi Hermes Agent là một khung tác nhân đơn lẻ mà khả năng của nó sẽ tiếp tục được cải thiện theo thời gian sử dụng thực tế.

Vấn đề mà nó giải quyết là trong khi mọi người đang bàn luận về những gì một tác nhân có thể làm, không ai nhận thấy rằng tác nhân đó không để lại bất cứ dấu vết nào sau khi được sử dụng. Mặt khác, Hermes Agent giờ đây có thể ghi nhớ "những phương pháp nào đã hoạt động".

Trên mạng xã hội cũng có rất nhiều bài đăng khuyên dùng Hermes Agent, một số người cho biết họ vừa chuyển từ OpenClaw sang Hermes và đó là quyết định sáng suốt nhất mà họ từng đưa ra.
hình ảnh

Một số người cũng chia sẻ "Bản báo cáo Hermes Orange", cho rằng Hermes Agent là một sản phẩm bị đánh giá thấp nghiêm trọng và là một trong những khung phần mềm tác nhân AI mã nguồn mở mạnh mẽ nhất hiện có.
hình ảnh

Hermes Agent được phát triển bởi nhóm nghiên cứu Nous Research. Nhìn vào lịch sử phát hành trên GitHub, từ bản cập nhật V0.2.0 vào giữa tháng 3 đến bản phát hành V0.8.0 ngày hôm qua, mỗi bản cập nhật đều có rất nhiều commit và merge mã nguồn, cũng như các bản cập nhật tính năng thiết thực, cho thấy đây là một dự án mã nguồn mở rất năng động.
hình ảnh

Hermes được phát hành lần đầu vào ngày 25 tháng 2
Phương pháp ghi chú trên LLM Wiki mà Karpathy đã chia sẻ trước đây, sử dụng các mô hình ngôn ngữ lớn và công cụ ghi chú Obsidian để xây dựng thư viện kiến thức và nghiên cứu của riêng mình, đã được thêm ngay lập tức vào các kỹ năng tích hợp sẵn của Hermes.
hình ảnh

Hermes Agent có thể được cài đặt không chỉ trên máy tính mà còn trên điện thoại Android thông qua trình giả lập thiết bị đầu cuối Termux. Cấu hình mô hình và cổng kết nối tương tự như OpenClaw.

Điều đáng chú ý là tính năng này chưa bị Claude "chặn"; chúng ta vẫn có thể cấu hình các mô hình lớn trực tiếp bằng cách đăng nhập với tư cách thành viên Claude Pro trở lên. Ngoài ra, Hermes Agent cũng cung cấp cổng thông tin Nous Portal dựa trên đăng ký.Đăng nhập.
hình ảnh

Mẫu Hermes 4 từ nhóm nghiên cứu Nous Research
Hôm nay, nền tảng MiMo của Xiaomi chính thức thông báo rằng " Xiaomi MiMo đã tích hợp với khung phần mềm đại lý hàng đầu thế giới, Hermes Agent, và sẽ được cung cấp miễn phí trong hai tuần. "

Tại sao OpenClaw lại là đối thủ đáng gờm?​

Cốt lõi của OpenClaw là tách hoàn toàn trí tuệ nhân tạo (AI) khỏi cửa sổ trò chuyện và tích hợp nó vào công việc, học tập và cuộc sống thực tế để thực hiện các nhiệm vụ một cách hiệu quả. Nó có thể kết nối với WeChat, WeChat doanh nghiệp và Lark, chạy các lệnh terminal, điều khiển trình duyệt và giúp chúng ta gửi email, quản lý lịch trình, v.v.

Tuy nhiên, OpenClaw có một nhược điểm: nó không thể tự động học hỏi và phát triển từ việc sử dụng hàng ngày của chúng ta.

Bộ nhớ của OpenClaw là tĩnh — chúng ta ghi thông tin vào tệp cấu hình, nó đọc thông tin đó, phiên làm việc kết thúc, và nó đọc lại tệp đó vào lần sau. Nó không chủ động trích xuất bất cứ thứ gì từ quá trình thực thi, cũng như không tự động làm đúng việc vào lần sau chỉ vì chúng ta đã sửa lỗi một lần.
Ngay cả sau khi đã sử dụng tất cả các quy trình làm việc một lần, chúng ta vẫn cần nhắc lại cho họ, có thể bằng cách đóng gói chúng thành các Kỹ năng hoặc các lời nhắc cụ thể.

Mặc dù hiện nay đã có những kỹ năng chuyên biệt được thiết kế để cung cấp cho OpenClaw khả năng tự học, Hermes Agent tập trung vào "hiểu bạn tốt hơn khi bạn sử dụng nó càng nhiều", từ vòng lặp học tập của kiến trúc nền tảng đến hệ thống bộ nhớ và quá trình thực thi nội bộ của Agent.

Điều làm nên sự đặc biệt của Hermes Agent là nó hoạt động theo một vòng lặp học tập khép kín.
hình ảnh

Sau khi mỗi tác vụ hoàn thành, Hermes kiểm tra xem giá trị thực thi có đáng được ghi lại hay không. Các điều kiện kích hoạt rất cụ thể: công cụ được gọi nhiều hơn 5 lần, xảy ra lỗi giữa chừng và được tự động sửa chữa, người dùng đã thực hiện các chỉnh sửa, hoặc một đường dẫn tinh tế nhưng hiệu quả đã được tuân theo. Nếu bất kỳ điều kiện nào trong số này được đáp ứng, nó sẽ tạo một tệp Kỹ năng trong thư mục ~/.hermes/skills.

Giống như các kỹ năng được sử dụng rộng rãi khác trên thị trường kỹ năng, tài liệu được tạo tự động này cung cấp một quy trình làm việc có thể được thực hiện trực tiếp vào lần sau. Tên, mô tả, các bước và các lệnh gọi công cụ liên quan đều được nêu rõ ràng. Định dạng tuân theo tiêu chuẩn mở agentskills.io và về mặt lý thuyết tương thích với nhiều ngành công nghiệp khác nhau, chẳng hạn như OpenClaw, Claude Code và Cursor. Được sử dụng trong các công cụ như [tên công cụ].

Các tệp kỹ năng không được mã hóa cứng. Hermes Agent sẽ trực tiếp sửa đổi chúng nếu tìm thấy đường dẫn tốt hơn trong các lần thực thi tiếp theo. Việc sửa đổi tốt nhất nên được thực hiện bằng cách sử dụng các bản vá, chỉ truyền vào chuỗi cũ và nội dung thay thế, thay vì viết lại toàn bộ tệp.
Có hai yếu tố cần cân nhắc đằng sau sự lựa chọn này: việc ghi đè hoàn toàn có thể dễ dàng phá hủy các phần hoạt động ban đầu, trong khi việc vá lỗi chỉ giải quyết các phần có vấn đề, do đó an toàn hơn và tiêu tốn ít token hơn.

Bộ nhớ là vấn đề khó khăn nhất mà các tác nhân phải xử lý.​

Một điểm khác biệt nữa so với OpenClaw là hệ thống bộ nhớ.
Vài ngày trước, Milla Jovovich, nữ diễn viên chính của "Resident Evil", và kỹ sư Ben Sigman đã cùng nhau phát hành công cụ bộ nhớ AI mã nguồn mở MemPalace.Nó đã nhận được hơn 23.000 lượt đánh dấu sao trên GitHub chỉ trong hai ngày.
Thiết kế của nó được lấy cảm hứng từ các kỹ thuật ghi nhớ của các nhà hùng biện Hy Lạp cổ đại, những người đặt những gì họ muốn ghi nhớ vào các phòng khác nhau của một tòa nhà tưởng tượng và đi vào lấy chúng khi cần.
hình ảnh

Toàn bộ hệ thống được chia thành năm lớp: Wing (dự án hoặc người dùng), Hall (loại bộ nhớ), Room (chủ đề), Closet (tóm tắt cô đọng) và Tunnel (trích dẫn liên chủ đề). MemPalace tuyên bố rằng chỉ riêng cấu trúc phân cấp này đã cải thiện độ chính xác tìm kiếm từ 60,9% lên 94,8%.
Nguyên tắc cốt lõi của MemPalace là: Không nên để trí tuệ nhân tạo (AI) quyết định điều gì đáng nhớ. Khả năng phán đoán của AI không đáng tin cậy, vì vậy tốt hơn hết là lưu trữ mọi thứ và để quá trình truy xuất xác định điều gì hữu ích.

Trong vụ rò rỉ mã nguồn 500.000 dòng của Claude hồi đầu tháng này, một giải pháp khác cho vấn đề bộ nhớ lại dựa vào trí tuệ nhân tạo (AI). Một số cư dân mạng phát hiện ra rằng Claude sử dụng phương pháp giống như giấc mơ, dùng Auto Dream để tự động sắp xếp các tập tin bộ nhớ của chúng ta.
hình ảnh

Hệ thống bộ nhớ của Hermes cũng được thiết kế đặc biệt, bao gồm bốn lớp, mỗi lớp chịu trách nhiệm cho các nhiệm vụ khác nhau và được truy xuất vào những thời điểm khác nhau.

Lớp đầu tiên được gọi là bộ nhớ gợi ý bền vững. Hai tệp, MEMORY.md và USER.md, lưu trữ ngữ cảnh cần được tự động tải khi bắt đầu mỗi phiên. Giới hạn tổng số ký tự chỉ là 3575; con số này được Hermes Agent cố tình thu hẹp để buộc chúng ta phải lọc thay vì nhồi nhét mọi thứ vào.
Lớp thứ hai là kho lưu trữ phiên. Mỗi cuộc hội thoại được ghi vào cơ sở dữ liệu SQLite và được truy xuất bằng chỉ mục toàn văn. Khi Hermes Agent cần ngữ cảnh lịch sử, nó chủ động khởi tạo truy vấn, thực hiện tóm tắt LLM trên kết quả tìm kiếm và chỉ chèn những phần liên quan đến nhiệm vụ hiện tại.
hình ảnh


Lớp thứ ba là tập tin kỹ năng, là kết quả của chu trình học tập đã đề cập ở trên. Theo mặc định, hệ thống chỉ yêu cầu tải tên kỹ năng và mô tả ngắn gọn, còn toàn văn sẽ được tải khi có yêu cầu. Hiệu quả của thiết kế này là thư viện kỹ năng có thể tăng từ 40 lên 200 kỹ năng, trong khi chi phí ngữ cảnh hầu như không thay đổi.

Lớp thứ tư, được gọi là Honcho, là một lớp mô hình hóa người dùng tùy chọn, tự động tích lũy các sở thích, phong cách giao tiếp và kiến thức chuyên môn của bạn qua các cuộc hội thoại. Nó phù hợp cho các trường hợp sử dụng Hermes Agent lâu dài như một trợ lý cá nhân hàng ngày.
Sự phân công lao động giữa bốn lớp này cũng rất rõ ràng: nếu một thứ gì đó cần xuất hiện trong mọi cuộc hội thoại, hãy đặt nó vào lớp đầu tiên; nếu nó chỉ hữu ích khi xuất hiện trong một chủ đề cụ thể, hãy để nó ở lớp thứ hai để truy xuất; nếu đó là một quy trình vận hành có thể tái sử dụng, hãy để lớp thứ ba xử lý; nếu đó là hồ sơ người dùng dài hạn, hãy chuyển giao cho lớp thứ tư.

Khi một tin nhắn đến Hermes Agent, cho dù nó đến từ cổng bên thứ ba như Telegram hay từ dòng lệnh, nó đều đi vào cùng một công cụ thực thi đồng bộ: tạo ID tác vụ, xây dựng lời nhắc hệ thống từ lớp bộ nhớ, ưu tiên tái sử dụng các phiên bản được lưu trong bộ nhớ cache để tránh tạo trùng lặp, kiểm tra xem độ dài ngữ cảnh có gần giới hạn trước khi gửi hay không và gọi mô hình.
hình ảnh


Ngoài việc sử dụng vòng lặp học tập để tự động cập nhật trong quá trình thực thi tác vụ, Hermes cũng kích hoạt một quy trình tinh chỉnh định kỳ ở giữa mỗi phiên làm việc.Cơ chế của (Phương pháp thúc đẩy định kỳ).

Không cần người dùng can thiệp, hệ thống định kỳ và tự động gửi một lời nhắc nội bộ đến tác nhân, yêu cầu nó xem xét các thao tác gần đây và xác định những thao tác nào đáng được ghi vào bộ nhớ. Quá trình này hoàn toàn do người dùng khởi xướng; Tác nhân Hermes quyết định những gì cần được giữ lại.

Chi phí để bắt đầu sử dụng Hermes Agent là bao nhiêu?​

Tương tự như việc cài đặt OpenClaw, quá trình này có thể được thực hiện chỉ bằng một lệnh duy nhất trên Linux, macOS và WSL2, và cũng được hỗ trợ trên các thiết bị Android sử dụng Termux.

Hermes cho biết hệ điều hành này không hỗ trợ Windows gốc, vì vậy chúng ta cần cài đặt WSL2, hay Windows Subsystem for Linux, viết tắt là WSL, một lớp tương thích cho phép các tệp thực thi nhị phân gốc của Linux chạy trên Windows.

Lệnh cài đặt tự động xử lý nhiều phụ thuộc, bao gồm cấu hình cho Python 3.11, Node.js v22, ripgrep, ffmpeg, môi trường ảo, các lệnh toàn cục và LLM. Giao diện sau khi cài đặt tương tự như các công cụ dòng lệnh như Claude Code, cho phép tương tác với Agent thông qua các lệnh cụ thể.
hình ảnh

Về cấu hình mô hình, có rất nhiều nhà cung cấp dịch vụ suy luận để lựa chọn: Nous Portal (dựa trên đăng ký, không cần cấu hình), Anthropic (sử dụng trực tiếp Claude, có thể được ủy quyền bằng khóa API hoặc mã Claude), OpenRouter, DeepSeek, Hugging Face, Alibaba Cloud DashScope (dòng Qwen), GitHub Copilot và bất kỳ giao diện nào tương thích với OpenAI, bao gồm cả các mô hình Ollam cục bộ.
hình ảnh

Xiaomi cũng cung cấp dòng sản phẩm MiMo-V2, bao gồm MiMo-V2-Pro hỗ trợ hàng triệu token ngữ cảnh, MiMo-V2-Omni với khả năng hiểu đầy đủ các chế độ ngôn ngữ, và mẫu Flash. Xiaomi cũng cung cấp bản dùng thử miễn phí hai tuần từ ngày 8 đến ngày 22 tháng 4, cập nhật Hermes Agent lên phiên bản mới nhất và cho phép truy cập tức thì vào các mẫu sản phẩm cao cấp của Xiaomi thông qua Nous Portal.

Các mẫu xe đại lý và xe phụ trợ của HermesModule này là một tập hợp các cấu hình mô hình nhẹ trong Hermes được thiết kế đặc biệt để xử lý "các tác vụ phụ". Chúng không chịu trách nhiệm cho hội thoại chính, nhưng chúng chịu trách nhiệm cho nhiều tác vụ quan trọng, tần suất cao mà không đáng để mô hình chính chiếm dụng.

Ví dụ, các tác vụ khác nhau như phân tích hình ảnh, trích xuất trang web, so khớp kỹ năng và xử lý bộ nhớ sẽ được tự động gán các mô hình khác nhau. Theo mặc định, các tác vụ phụ trợ sẽ tự động phát hiện và ưu tiên sử dụng Gemini Flash mà không cần cấu hình thủ công.
hình ảnh

Điều này tương tự như tính năng tư vấn mà Anthropic vừa ra mắt hôm nay, cả hai đều là những cơ chế phù hợp cho các tình huống mà mô hình chính đắt tiền nhưng bạn muốn chuyển các tác vụ phụ sang các mô hình rẻ hơn. Mặt khác, Hermes đã biến "điều phối đa mô hình" thành một phần cốt lõi trong kiến trúc nền tảng của nó.

Về các nền tảng nhắn tin, danh sách các dịch vụ được hỗ trợ tương tự như Openclaw, trong đó Telegram, Discord, Slack và Lark nằm trong số những nền tảng có đầy đủ tính năng nhất, hỗ trợ nhiều định dạng khác nhau như giọng nói, hình ảnh và tệp tin. Một quy trình cổng duy nhất kết nối tất cả các nền tảng, cung cấp khả năng quản lý phiên thống nhất.
hình ảnh

Hermes Agent không thực sự là một công cụ có thể cài đặt trong vài phút và nhanh chóng đưa vào sử dụng; nó giống một cơ sở hạ tầng mà chúng ta cần vận hành và bảo trì hơn.

Nếu chúng ta chỉ cần một trợ lý AI có thể điều khiển thông qua tin nhắn trên điện thoại di động, OpenClaw sẽ là một cách tiếp cận đơn giản hơn: viết một tệp cấu hình SOUL.md, chạy nó, kết nối với Telegram và thế là xong.

Hermes Agent phù hợp với các tình huống có quy trình làm việc lặp đi lặp lại, liên tục thay đổi, và chúng ta muốn trợ lý ảo tích lũy kinh nghiệm thông qua thói quen sử dụng. Chúng ta kỳ vọng trợ lý ảo sau ba tháng sẽ khác so với trợ lý ảo vào ngày đầu tiên.
hình ảnh

Trên mạng xã hội, một số cư dân mạng đã chia sẻ các ví dụ ứng dụng của Hermes Agent, bao gồm tự động hóa kinh doanh, kết nối hệ thống quản lý quan hệ khách hàng (CRM) và cơ sở tri thức của công ty; quản lý tiếp thị, tự động hóa việc tạo nội dung và đăng tải lên nền tảng mạng xã hội; và các dự án kỹ thuật phần mềm kinh điển như tạo mã.

Khi chúng ta áp dụng những công nghệ này vào nhiều tình huống kinh doanh thực tế khác nhau, một thực tế không thể phủ nhận là các tác nhân đang nhanh chóng thâm nhập vào môi trường sản xuất thực tế.

Về Hermes, một số người cho rằng nó chỉ đơn thuần là một "giải pháp thay thế nhẹ" cho OpenClaw, trong khi những người khác lại xem nó như một bước tiến hóa của các hệ thống tác nhân đơn lẻ. Dù sao đi nữa, sự phát triển của các tác nhân sẽ không bao giờ dừng lại trong khuôn khổ do OpenClaw đặt ra.

Dù là Hermes hay OpenClaw, tất cả các giải pháp tác nhân mã nguồn mở hiện nay đều vẫn còn những thiếu sót riêng. Hình thức cho phép các tác nhân thực sự thâm nhập vào thị trường chính thống và trở thành một phần của cơ sở hạ tầng hàng ngày đối với người dân bình thường có lẽ vẫn chưa xuất hiện.
hình ảnh

Giải quyết hệ thống bộ nhớ phức tạp đặt ra những thách thức to lớn về an ninh trí tuệ nhân tạo. Việc trang bị cho AI các chi đòi hỏi phải tìm ra cách kiềm chế nó, và việc cài đặt Harness quá phức tạp và có rào cản gia nhập cao, dường như để lại nhiều hạn chế.

Có thể nói rằng Hermes thực sự đã mang đến cho Agent một hướng đi mới lần này. Họ đã biến Agent từ một công cụ dùng một lần rồi vứt bỏ thành một đối tác có thể học hỏi từ những thất bại và ghi nhớ bài học.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL2RvaS10aHUtbmFuZy1raS1jdWEtb3BlbmNsYXctdm9pLWhvbi00MC0wMDAtbHVvdC1kYW5oLWdpYS1zYW8tYmVuLXRydW5nLXZvaS1jYWktdGVuLW5naGUtZGEtdGhheS1tdWktdGllbi44MTcxMy8=
Top