Các nhà nghiên cứu tại ByteDance, công ty mẹ của TikTok tại Trung Quốc, vừa phát hiện ra một quy luật mở rộng mới mô tả tốc độ tự cải thiện của các tác nhân trí tuệ nhân tạo (AI agent) thông qua việc thực hiện các nhiệm vụ thực tế. Phát hiện này có thể giúp duy trì sự bùng nổ của AI trong bối cảnh các phương pháp phát triển truyền thống đang dần chạm giới hạn.
ByteDance, gã khổng lồ công nghệ Trung Quốc đứng sau ứng dụng TikTok nổi tiếng, cũng đang dẫn đầu trong nghiên cứu trí tuệ nhân tạo tại Trung Quốc. Ảnh: Reuters
Phát hiện này xuất hiện khi ngành công nghiệp AI toàn cầu đang tìm kiếm các phương thức mới để cải thiện mô hình. Trong nhiều năm qua, giới phát triển phụ thuộc vào việc nạp thêm dữ liệu và tăng cường sức mạnh tính toán trong giai đoạn huấn luyện ban đầu. Tuy nhiên, các nhân vật nổi bật trong ngành, bao gồm cả nhà đồng sáng lập OpenAI Andrej Karpathy, đã cảnh báo rằng cách tiếp cận thô sơ này không thể kéo dài mãi mãi.
Một phần nguyên nhân đến từ nguy cơ cạn kiệt dữ liệu. Viện nghiên cứu Epoch AI của Mỹ gần đây cảnh báo nguồn dữ liệu văn bản công khai do con người tạo ra trên internet có thể bị khai thác hết trong vòng sáu năm tới. Điều này khiến việc tìm kiếm các hướng đi thay thế để phát triển AI trở thành một trong những ưu tiên hàng đầu của toàn ngành.
Để giải quyết vấn đề, nhóm nghiên cứu đã xây dựng bộ công cụ đánh giá mang tên EdgeBench, bao gồm 134 nhiệm vụ dài hạn phức tạp trải rộng trên nhiều lĩnh vực từ kỹ thuật phần mềm, khám phá khoa học cho đến toán học và công việc chuyên môn. Mỗi nhiệm vụ yêu cầu tác nhân AI phải vận hành liên tục ít nhất 12 giờ.
Các nhà nghiên cứu đã ghi nhận tổng cộng 38.000 giờ tương tác với môi trường để đánh giá năm mô hình hàng đầu hiện nay. Danh sách thử nghiệm bao gồm Claude Opus 4.8 của Anthropic, GPT 5.5 và GPT 5.4 của OpenAI, cùng các mô hình từ những đơn vị dẫn đầu tại Trung Quốc là Zhipu AI và DeepSeek.
Nhóm nghiên cứu từ ByteDance nhấn mạnh rằng việc học hỏi sau khi triển khai trong các môi trường phong phú xứng đáng nhận được sự đầu tư có hệ thống tương đương như giai đoạn huấn luyện ban đầu. Khả năng thích ứng này ngày càng trở nên quan trọng khi các tác nhân AI đang được tích hợp sâu vào nhiều kịch bản đời thực, từ phần mềm doanh nghiệp cho đến các dự án nghiên cứu khoa học và kỹ thuật.
Thay vì chỉ dựa vào lượng kiến thức tĩnh có sẵn từ trước, các công cụ này cần phải liên tục tự nâng cấp ngay trong quá trình làm việc để đáp ứng yêu cầu triển khai thực tế trên quy mô lớn.
Theo kết luận của các nhà nghiên cứu trên trang web chính thức của EdgeBench, khả năng tự học hỏi từ môi trường và cải thiện hiệu suất của tác nhân AI là yếu tố cốt lõi để triển khai các hệ thống AI trên quy mô lớn trong thế giới thực.
ByteDance, gã khổng lồ công nghệ Trung Quốc đứng sau ứng dụng TikTok nổi tiếng, cũng đang dẫn đầu trong nghiên cứu trí tuệ nhân tạo tại Trung Quốc. Ảnh: Reuters
Lối thoát khi phương pháp huấn luyện truyền thống gặp rào cản
Trong một báo cáo nghiên cứu được công bố vào thứ Năm, đội ngũ Seed AI của ByteDance tiết lộ rằng các tác nhân AI (phần mềm tự chủ thực hiện nhiệm vụ thay thế con người) có thể tăng gấp đôi tốc độ học hỏi sau mỗi ba tháng nhờ quá trình tương tác với môi trường thực tế trong thời gian dài.Phát hiện này xuất hiện khi ngành công nghiệp AI toàn cầu đang tìm kiếm các phương thức mới để cải thiện mô hình. Trong nhiều năm qua, giới phát triển phụ thuộc vào việc nạp thêm dữ liệu và tăng cường sức mạnh tính toán trong giai đoạn huấn luyện ban đầu. Tuy nhiên, các nhân vật nổi bật trong ngành, bao gồm cả nhà đồng sáng lập OpenAI Andrej Karpathy, đã cảnh báo rằng cách tiếp cận thô sơ này không thể kéo dài mãi mãi.
Một phần nguyên nhân đến từ nguy cơ cạn kiệt dữ liệu. Viện nghiên cứu Epoch AI của Mỹ gần đây cảnh báo nguồn dữ liệu văn bản công khai do con người tạo ra trên internet có thể bị khai thác hết trong vòng sáu năm tới. Điều này khiến việc tìm kiếm các hướng đi thay thế để phát triển AI trở thành một trong những ưu tiên hàng đầu của toàn ngành.
Đánh giá qua thử nghiệm 38.000 giờ
Mặc dù các doanh nghiệp công nghệ đang chuyển hướng sang các hệ thống AI dạng tác nhân, các nhà nghiên cứu của ByteDance lưu ý trong báo cáo rằng cách các hệ thống tự chủ này tự học hỏi từ môi trường thực tế sau khi triển khai vẫn là điều chưa được hiểu rõ.Để giải quyết vấn đề, nhóm nghiên cứu đã xây dựng bộ công cụ đánh giá mang tên EdgeBench, bao gồm 134 nhiệm vụ dài hạn phức tạp trải rộng trên nhiều lĩnh vực từ kỹ thuật phần mềm, khám phá khoa học cho đến toán học và công việc chuyên môn. Mỗi nhiệm vụ yêu cầu tác nhân AI phải vận hành liên tục ít nhất 12 giờ.
Các nhà nghiên cứu đã ghi nhận tổng cộng 38.000 giờ tương tác với môi trường để đánh giá năm mô hình hàng đầu hiện nay. Danh sách thử nghiệm bao gồm Claude Opus 4.8 của Anthropic, GPT 5.5 và GPT 5.4 của OpenAI, cùng các mô hình từ những đơn vị dẫn đầu tại Trung Quốc là Zhipu AI và DeepSeek.
AI tự tiến hóa sau khi triển khai thực tế
Dữ liệu thu được cho thấy hiệu suất của các tác nhân AI tuân theo một đường cong toán học có thể dự đoán được. Điều này đồng nghĩa với việc năng lực của AI vẫn tiếp tục tiến bộ một cách ổn định thông qua trải nghiệm thực tế, ngay cả khi những lợi ích từ việc huấn luyện trước bằng dữ liệu tĩnh bắt đầu bão hòa.Nhóm nghiên cứu từ ByteDance nhấn mạnh rằng việc học hỏi sau khi triển khai trong các môi trường phong phú xứng đáng nhận được sự đầu tư có hệ thống tương đương như giai đoạn huấn luyện ban đầu. Khả năng thích ứng này ngày càng trở nên quan trọng khi các tác nhân AI đang được tích hợp sâu vào nhiều kịch bản đời thực, từ phần mềm doanh nghiệp cho đến các dự án nghiên cứu khoa học và kỹ thuật.
Thay vì chỉ dựa vào lượng kiến thức tĩnh có sẵn từ trước, các công cụ này cần phải liên tục tự nâng cấp ngay trong quá trình làm việc để đáp ứng yêu cầu triển khai thực tế trên quy mô lớn.
Theo kết luận của các nhà nghiên cứu trên trang web chính thức của EdgeBench, khả năng tự học hỏi từ môi trường và cải thiện hiệu suất của tác nhân AI là yếu tố cốt lõi để triển khai các hệ thống AI trên quy mô lớn trong thế giới thực.