Nhật Bản vừa ra AI đa tác nhân đánh bại GPT 5.5 của OpenAI và Fable 5 của Anthropic, nhưng sự thật là gì?

Kiều My
Kiều My
Phản hồi: 0

Kiều My

Thợ săn tin nóng
Thành viên BQT
Một startup công nghệ tại Tokyo vừa tung ra giải pháp trí tuệ nhân tạo mới trực tiếp thách thức các ông lớn tại Thung lũng Silicon. Sakana AI đã công bố phát hành rộng rãi Sakana Fugu, hệ thống kết hợp nhiều mô hình trí tuệ nhân tạo vào một quy trình làm việc cộng tác thống nhất.

Ngay khi xuất hiện, Sakana Fugu đã gây chú ý lớn khi trực tiếp đối đầu và vượt qua hàng loạt mô hình ngôn ngữ lớn (LLM) hàng đầu hiện nay trong các bài kiểm tra hiệu năng thực tế.

1782196091995.png

Hạ gục các ông lớn ở bài kiểm tra cấp tiến sĩ​

Theo công bố từ phía Sakana AI, hệ thống Fugu đã vượt qua bốn mô hình ngôn ngữ lớn khác trên nhiều bài test chuẩn về khả năng viết mã nguồn. Danh sách các đối thủ bị Fugu đánh bại gồm những cái tên đình đám như GPT 5.5 của OpenAI, Fable 5 của Anthropic và Gemini 3.1 Pro của Google.

Đáng chú ý, Fugu còn vượt qua phiên bản xem trước của mô hình Claude Mythos từ Anthropic trong bài kiểm tra GPQA Diamond. Đây là bộ tiêu chuẩn cực kỳ khắt khe chuyên dùng để đánh giá khả năng trả lời các câu hỏi cấp độ tiến sĩ thuộc lĩnh vực khoa học của các mô hình ngôn ngữ lớn.

Phương thức vận hành kiểu nhạc trưởng​

1782196106047.png


Bản chất của Fugu là một mô hình ngôn ngữ lớn đóng vai trò điều phối nhiều LLM khác nhau. Thay vì tự mình giải quyết toàn bộ quy trình, mô hình này tự động phân chia và giao các tác vụ cụ thể cho từng LLM có thế mạnh tương ứng, sau đó tự trị kết hợp các kết quả đơn lẻ thành một đầu ra hoàn chỉnh.

Khi đối mặt với những nhiệm vụ phức tạp, Fugu tự học cách xác định thời điểm cần ủy quyền tính toán cho các LLM khác nhau và tìm cách tích hợp kết quả thu được một cách mạch lạc nhất.

Chi phí sử dụng và lộ trình nâng cấp​

Người dùng hiện có thể tiếp cận dịch vụ Fugu thông qua hình thức đăng ký thuê bao tháng hoặc trả tiền theo mức độ sử dụng (pay-as-you-go). Mức giá thuê bao được startup Nhật Bản đưa ra bắt đầu từ 20 USD một tháng.

Trong thời gian tới, Sakana AI sẽ mở rộng thêm danh sách các tác nhân chuyên gia - thuật ngữ chỉ các LLM được Fugu sử dụng để điều phối. Việc bổ sung các tác nhân mới hứa hẹn cho phép người dùng tinh chỉnh sâu hơn hành vi của Fugu, đồng thời giải quyết các tác vụ đòi hỏi nhiều thời gian xử lý.

Sự xuất hiện của Sakana Fugu cho thấy một hướng đi mới đầy tiềm năng: thay vì cố gắng xây dựng một mô hình duy nhất xử lý mọi việc, việc tối ưu hóa khả năng điều phối và cộng tác giữa các mô hình chuyên biệt có thể mang lại hiệu quả vượt trội, thậm chí vượt qua cả những thực thể đơn lẻ mạnh mẽ nhất hiện nay.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL25oYXQtYmFuLXZ1YS1yYS1haS1kYS10YWMtbmhhbi1kYW5oLWJhaS1ncHQtNS01LWN1YS1vcGVuYWktdmEtZmFibGUtNS1jdWEtYW50aHJvcGljLW5odW5nLXN1LXRoYXQtbGEtZ2kuODU4ODEv
Top