"Cha đẻ" TikTok tìm ra quy luật giúp AI tự học nhanh gấp đôi sau mỗi ba tháng

Kiều My · 09:50

Các nhà nghiên cứu tại ByteDance, công ty mẹ của TikTok tại Trung Quốc, vừa phát hiện ra một quy luật mở rộng mới mô tả tốc độ tự cải thiện của các tác nhân trí tuệ nhân tạo (AI agent) thông qua việc thực hiện các nhiệm vụ thực tế. Phát hiện này có thể giúp duy trì sự bùng nổ của AI trong bối cảnh các phương pháp phát triển truyền thống đang dần chạm giới hạn.

ByteDance, gã khổng lồ công nghệ Trung Quốc đứng sau ứng dụng TikTok nổi tiếng, cũng đang dẫn đầu trong nghiên cứu trí tuệ nhân tạo tại Trung Quốc. Ảnh: Reuters

Lối thoát khi phương pháp huấn luyện truyền thống gặp rào cản

Trong một báo cáo nghiên cứu được công bố vào thứ Năm, đội ngũ Seed AI của ByteDance tiết lộ rằng các tác nhân AI (phần mềm tự chủ thực hiện nhiệm vụ thay thế con người) có thể tăng gấp đôi tốc độ học hỏi sau mỗi ba tháng nhờ quá trình tương tác với môi trường thực tế trong thời gian dài.

Phát hiện này xuất hiện khi ngành công nghiệp AI toàn cầu đang tìm kiếm các phương thức mới để cải thiện mô hình. Trong nhiều năm qua, giới phát triển phụ thuộc vào việc nạp thêm dữ liệu và tăng cường sức mạnh tính toán trong giai đoạn huấn luyện ban đầu. Tuy nhiên, các nhân vật nổi bật trong ngành, bao gồm cả nhà đồng sáng lập OpenAI Andrej Karpathy, đã cảnh báo rằng cách tiếp cận thô sơ này không thể kéo dài mãi mãi.

Một phần nguyên nhân đến từ nguy cơ cạn kiệt dữ liệu. Viện nghiên cứu Epoch AI của Mỹ gần đây cảnh báo nguồn dữ liệu văn bản công khai do con người tạo ra trên internet có thể bị khai thác hết trong vòng sáu năm tới. Điều này khiến việc tìm kiếm các hướng đi thay thế để phát triển AI trở thành một trong những ưu tiên hàng đầu của toàn ngành.

Đánh giá qua thử nghiệm 38.000 giờ

Mặc dù các doanh nghiệp công nghệ đang chuyển hướng sang các hệ thống AI dạng tác nhân, các nhà nghiên cứu của ByteDance lưu ý trong báo cáo rằng cách các hệ thống tự chủ này tự học hỏi từ môi trường thực tế sau khi triển khai vẫn là điều chưa được hiểu rõ.

Để giải quyết vấn đề, nhóm nghiên cứu đã xây dựng bộ công cụ đánh giá mang tên EdgeBench, bao gồm 134 nhiệm vụ dài hạn phức tạp trải rộng trên nhiều lĩnh vực từ kỹ thuật phần mềm, khám phá khoa học cho đến toán học và công việc chuyên môn. Mỗi nhiệm vụ yêu cầu tác nhân AI phải vận hành liên tục ít nhất 12 giờ.

Các nhà nghiên cứu đã ghi nhận tổng cộng 38.000 giờ tương tác với môi trường để đánh giá năm mô hình hàng đầu hiện nay. Danh sách thử nghiệm bao gồm Claude Opus 4.8 của Anthropic, GPT 5.5 và GPT 5.4 của OpenAI, cùng các mô hình từ những đơn vị dẫn đầu tại Trung Quốc là Zhipu AI và DeepSeek.

AI tự tiến hóa sau khi triển khai thực tế

Dữ liệu thu được cho thấy hiệu suất của các tác nhân AI tuân theo một đường cong toán học có thể dự đoán được. Điều này đồng nghĩa với việc năng lực của AI vẫn tiếp tục tiến bộ một cách ổn định thông qua trải nghiệm thực tế, ngay cả khi những lợi ích từ việc huấn luyện trước bằng dữ liệu tĩnh bắt đầu bão hòa.

Nhóm nghiên cứu từ ByteDance nhấn mạnh rằng việc học hỏi sau khi triển khai trong các môi trường phong phú xứng đáng nhận được sự đầu tư có hệ thống tương đương như giai đoạn huấn luyện ban đầu. Khả năng thích ứng này ngày càng trở nên quan trọng khi các tác nhân AI đang được tích hợp sâu vào nhiều kịch bản đời thực, từ phần mềm doanh nghiệp cho đến các dự án nghiên cứu khoa học và kỹ thuật.

Thay vì chỉ dựa vào lượng kiến thức tĩnh có sẵn từ trước, các công cụ này cần phải liên tục tự nâng cấp ngay trong quá trình làm việc để đáp ứng yêu cầu triển khai thực tế trên quy mô lớn.

Theo kết luận của các nhà nghiên cứu trên trang web chính thức của EdgeBench, khả năng tự học hỏi từ môi trường và cải thiện hiệu suất của tác nhân AI là yếu tố cốt lõi để triển khai các hệ thống AI trên quy mô lớn trong thế giới thực.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

"Cha đẻ" TikTok tìm ra quy luật giúp AI tự học nhanh gấp đôi sau mỗi ba tháng

Kiều My

Thợ săn tin nóng

Kiều My

Lối thoát khi phương pháp huấn luyện truyền thống gặp rào cản

Đánh giá qua thử nghiệm 38.000 giờ

AI tự tiến hóa sau khi triển khai thực tế

AI đang thay đổi lưới điện: Không chỉ là lượng tiêu thụ, mà là cách thức vận hành

Alibaba "cấm cửa" AI của Anthropic sau nghi vấn theo dõi lập trình viên Trung Quốc

Kỹ sư phần mềm dễ bị AI 'thay thế': Huyền thoại Kent Beck chỉ ra điểm yếu chết người

Google "ngốn" điện kỷ lục 37% vì AI, phát thải carbon tổng thể vẫn tăng.

Trào lưu robot bạn đời gây sốt: Hàng loạt người thật hóa trang thành AI để kiếm tiền.

Z.ai: Công ty Trung Quốc ít người biết tới đang khiến OpenAI, Anthropic đứng ngồi không yên

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Tạm biệt OxygenOS, realmeUI: Điện thoại OnePlus và realme sẽ chuyển sang dùng ColorOS giống OPPO?

Đánh giá nổi bật

Chủ đề hot

Có thể bạn quan tâm

"Cha đẻ" TikTok tìm ra quy luật giúp AI tự học nhanh gấp đôi sau mỗi ba tháng

Thợ săn tin nóng

Lối thoát khi phương pháp huấn luyện truyền thống gặp rào cản​

Đánh giá qua thử nghiệm 38.000 giờ​

AI tự tiến hóa sau khi triển khai thực tế​

AI đang thay đổi lưới điện: Không chỉ là lượng tiêu thụ, mà là cách thức vận hành

Alibaba "cấm cửa" AI của Anthropic sau nghi vấn theo dõi lập trình viên Trung Quốc

Kỹ sư phần mềm dễ bị AI 'thay thế': Huyền thoại Kent Beck chỉ ra điểm yếu chết người

Google "ngốn" điện kỷ lục 37% vì AI, phát thải carbon tổng thể vẫn tăng.

Trào lưu robot bạn đời gây sốt: Hàng loạt người thật hóa trang thành AI để kiếm tiền.

Z.ai: Công ty Trung Quốc ít người biết tới đang khiến OpenAI, Anthropic đứng ngồi không yên

Lối thoát khi phương pháp huấn luyện truyền thống gặp rào cản

Đánh giá qua thử nghiệm 38.000 giờ

AI tự tiến hóa sau khi triển khai thực tế