myle.vnreview
Writer
Anthropic đã tiết lộ một thí nghiệm ấn tượng, trong đó các hệ thống AI đã hợp tác để xây dựng một trình biên dịch C hoàn chỉnh gần như hoàn toàn tự động. Dẫn đầu bởi nhà nghiên cứu Nicholas Carlini, dự án này cho thấy sự hợp tác tự động của AI đã tiến bộ đến mức nào trong phát triển phần mềm thực tế.
Cách thức thí nghiệm diễn ra
Trình biên dịch được phát triển trong hai tuần bằng cách sử dụng 16 tác nhân (agent) Claude Opus 4.6 độc lập. Mỗi tác nhân AI chạy bên trong một container Docker riêng, sao chép cùng một kho lưu trữ Git và hoạt động mà không cần bộ điều khiển trung tâm hoặc người quản lý (container là gói phần mềm nhẹ, độc lập, có thể thực thi). Các tác vụ được chọn tự động, xung đột được giải quyết thông qua Git và mã phần mềm được đẩy lên nguồn mà không cần giám sát. Tổng cộng, các tác nhân đã tạo ra khoảng 100.000 dòng mã Rust trong gần 2.000 phiên lập trình, với chi phí API khoảng 20.000 USD.
Những gì trình biên dịch có thể làm
Kết quả là một trình biên dịch C mã nguồn mở, hoàn chỉnh, được viết từ đầu. Nó có thể biên dịch thành công nhân Linux 6.9 cho các kiến trúc x86, ARM và RISC-V, và xử lý các dự án mã nguồn mở lớn như PostgreSQL, SQLite, Redis và FFmpeg. Trên bộ kiểm thử GCC Torture Test Suite đầy thách thức, trình biên dịch đó đạt tỷ lệ kiểm thử thành công là 99%. Như một cột mốc mang tính biểu tượng, trình biên dịch này thậm chí còn biên dịch và chạy Doom, một chuẩn mực lâu đời về khả năng của trình biên dịch.
Ý nghĩa của dự án
Dự án này chứng minh rằng các hệ thống AI hiện nay có thể tự phối hợp, quản lý các cơ sở mã lớn và cung cấp phần mềm cơ sở hạ tầng cấp độ sản xuất. Mặc dù trình biên dịch vẫn còn những hạn chế và chưa phải là sự thay thế hoàn toàn cho GCC, nhưng thí nghiệm này đánh dấu một bước tiến lớn hướng tới kỹ thuật phần mềm tự động, lâu dài do AI điều khiển.
Tác động đến tương lai của lập trình
Thí nghiệm này báo hiệu một sự thay đổi trong cách xây dựng phần mềm trong tương lai. Đối với các nhà phát triển, các tác nhân AI có thể xử lý các tác vụ lặp đi lặp lại, tái cấu trúc lớn, kiểm thử và sửa lỗi, cho phép con người tập trung hơn vào thiết kế, kiến trúc và giải quyết vấn đề. Đồng thời, nó đặt ra những câu hỏi mới về chất lượng mã, độ tin cậy và xác minh. Mặc dù các lập trình viên con người vẫn còn rất cần thiết, vai trò của họ có thể sẽ thay đổi từ việc viết từng dòng mã sang hướng dẫn, xem xét và xác nhận các hệ thống do AI xây dựng ngày càng tự động hơn.
Cách thức thí nghiệm diễn ra
Trình biên dịch được phát triển trong hai tuần bằng cách sử dụng 16 tác nhân (agent) Claude Opus 4.6 độc lập. Mỗi tác nhân AI chạy bên trong một container Docker riêng, sao chép cùng một kho lưu trữ Git và hoạt động mà không cần bộ điều khiển trung tâm hoặc người quản lý (container là gói phần mềm nhẹ, độc lập, có thể thực thi). Các tác vụ được chọn tự động, xung đột được giải quyết thông qua Git và mã phần mềm được đẩy lên nguồn mà không cần giám sát. Tổng cộng, các tác nhân đã tạo ra khoảng 100.000 dòng mã Rust trong gần 2.000 phiên lập trình, với chi phí API khoảng 20.000 USD.
Những gì trình biên dịch có thể làm
Kết quả là một trình biên dịch C mã nguồn mở, hoàn chỉnh, được viết từ đầu. Nó có thể biên dịch thành công nhân Linux 6.9 cho các kiến trúc x86, ARM và RISC-V, và xử lý các dự án mã nguồn mở lớn như PostgreSQL, SQLite, Redis và FFmpeg. Trên bộ kiểm thử GCC Torture Test Suite đầy thách thức, trình biên dịch đó đạt tỷ lệ kiểm thử thành công là 99%. Như một cột mốc mang tính biểu tượng, trình biên dịch này thậm chí còn biên dịch và chạy Doom, một chuẩn mực lâu đời về khả năng của trình biên dịch.
Ý nghĩa của dự án
Dự án này chứng minh rằng các hệ thống AI hiện nay có thể tự phối hợp, quản lý các cơ sở mã lớn và cung cấp phần mềm cơ sở hạ tầng cấp độ sản xuất. Mặc dù trình biên dịch vẫn còn những hạn chế và chưa phải là sự thay thế hoàn toàn cho GCC, nhưng thí nghiệm này đánh dấu một bước tiến lớn hướng tới kỹ thuật phần mềm tự động, lâu dài do AI điều khiển.
Tác động đến tương lai của lập trình
Thí nghiệm này báo hiệu một sự thay đổi trong cách xây dựng phần mềm trong tương lai. Đối với các nhà phát triển, các tác nhân AI có thể xử lý các tác vụ lặp đi lặp lại, tái cấu trúc lớn, kiểm thử và sửa lỗi, cho phép con người tập trung hơn vào thiết kế, kiến trúc và giải quyết vấn đề. Đồng thời, nó đặt ra những câu hỏi mới về chất lượng mã, độ tin cậy và xác minh. Mặc dù các lập trình viên con người vẫn còn rất cần thiết, vai trò của họ có thể sẽ thay đổi từ việc viết từng dòng mã sang hướng dẫn, xem xét và xác nhận các hệ thống do AI xây dựng ngày càng tự động hơn.