Bỉ Ngạn Hoa
Writer
OpenAI vừa công bố nghiên cứu về tác nhân (agent) viết phần mềm mới vào ngày 16/5, chính thức nhảy vào một trong những lĩnh vực có nhu cầu cao nhất đối với các công cụ trí tuệ nhân tạo.
Theo tờ WSJ, tác nhân mới của OpenAI, được gọi là Codex, sẽ có thể thực hiện nhiều tác vụ cùng lúc, bao gồm viết mã, sửa lỗi, chạy thử nghiệm và trả lời các câu hỏi về cơ sở mã của khách hàng, OpenAI cho biết.
Codex được xây dựng trên mô hình có tên là codex-1, một phiên bản của mô hình lý luận o3 của OpenAI được tối ưu hóa cho việc viết phần mềm và sẽ khả dụng cho người dùng ChatGPT Pro, Team và Enterprise.
OpenAI cho biết hiện họ đang tìm cách tập trung mạnh vào viết phần mềm, một lĩnh vực cực kỳ hot đã chứng kiến sự đầu tư ngày càng tăng từ Microsoft, Amazon, Google, Anthropic và các công ty khởi nghiệp như Anysphere, công ty đã phát triển công cụ phổ biến Cursor.
“Có rất nhiều hệ thống AI tốt ngoài kia”, Srinivas Narayanan, phó chủ tịch kỹ thuật tại OpenAI cho biết. “Rõ ràng là có sự cạnh tranh”.
OpenAI cũng đang đàm phán để mua lại công ty khởi nghiệp về viết phần mềm AI Windsurf với giá 3 tỷ USD, theo báo cáo của Bloomberg.
Mặc dù OpenAI là một gã khổng khi nói đến các chatbot AI hướng đến người tiêu dùng, nhưng công ty này lại không có cùng vị thế trong lĩnh vực viết phần mềm bằng AI, theo Wayne Chi và Valerie Chen, các nghiên cứu sinh tiến sĩ tại Đại học Carnegie Mellon, những người đã xây dựng một hệ thống đánh giá hiệu suất của các mô hình AI cho việc viết phần mềm.
Cho đến nay, các mô hình Sonnet từ đối thủ cạnh tranh của OpenAI là Anthropic là lựa chọn hàng đầu của nhiều nhà phát triển, Chi và Chen cho biết. Và trong khi các mô hình khác nhau có thế mạnh khác nhau trong các lĩnh vực viết phần mềm khác nhau, các mô hình Sonnet dường như có một số sức mạnh bền bỉ với cộng đồng nhà phát triển, Chi cho biết, nhưng mọi thứ đang thay đổi quá nhanh nên còn quá sớm để tuyên bố người chiến thắng.
OpenAI cho biết mô hình GPT-4.1 của họ đã được áp dụng nhanh chóng kể từ khi ra mắt và là mô hình viết phần mềm không suy luận có hiệu suất tốt nhất trong một số bài kiểm tra so sánh.
OpenAI cho biết Codex sẽ chuyển đổi cách các nhà phát triển làm việc bằng cách giúp họ phân công nhiều nhiệm vụ hơn. Nhiều công cụ viết phần mềm hiện nay hoạt động song song với các nhà phát triển theo thời gian thực. Codex hoạt động độc lập trên đám mây và cung cấp đầu ra trong vòng một đến 30 phút. OpenAI cũng cho biết công cụ này có thể thực hiện tốt hơn các đối thủ cạnh tranh trong việc suy ra phong cách viết phần mềm của một tổ chức, cũng như hỗ trợ đánh giá mã phần mềm.
"Đây là một cách làm việc hoàn toàn mới", Narayanan cho biết về việc sử dụng tác nhân Codex. Ông nói thêm rằng công ty sẽ thu thập phản hồi trong quá trình phát hành bản thử nghiệm, mà công ty mô tả là quá trình giới thiệu dần dần các công nghệ để giảm thiểu rủi ro, thúc đẩy nghiên cứu và thúc đẩy sự hiểu biết của người dùng.
"Chúng tôi vẫn đang trong giai đoạn đầu, vì vậy chúng tôi sẽ phải học hỏi rất nhiều", ông cho biết.

Theo tờ WSJ, tác nhân mới của OpenAI, được gọi là Codex, sẽ có thể thực hiện nhiều tác vụ cùng lúc, bao gồm viết mã, sửa lỗi, chạy thử nghiệm và trả lời các câu hỏi về cơ sở mã của khách hàng, OpenAI cho biết.
Codex được xây dựng trên mô hình có tên là codex-1, một phiên bản của mô hình lý luận o3 của OpenAI được tối ưu hóa cho việc viết phần mềm và sẽ khả dụng cho người dùng ChatGPT Pro, Team và Enterprise.
OpenAI cho biết hiện họ đang tìm cách tập trung mạnh vào viết phần mềm, một lĩnh vực cực kỳ hot đã chứng kiến sự đầu tư ngày càng tăng từ Microsoft, Amazon, Google, Anthropic và các công ty khởi nghiệp như Anysphere, công ty đã phát triển công cụ phổ biến Cursor.
“Có rất nhiều hệ thống AI tốt ngoài kia”, Srinivas Narayanan, phó chủ tịch kỹ thuật tại OpenAI cho biết. “Rõ ràng là có sự cạnh tranh”.
OpenAI cũng đang đàm phán để mua lại công ty khởi nghiệp về viết phần mềm AI Windsurf với giá 3 tỷ USD, theo báo cáo của Bloomberg.
Mặc dù OpenAI là một gã khổng khi nói đến các chatbot AI hướng đến người tiêu dùng, nhưng công ty này lại không có cùng vị thế trong lĩnh vực viết phần mềm bằng AI, theo Wayne Chi và Valerie Chen, các nghiên cứu sinh tiến sĩ tại Đại học Carnegie Mellon, những người đã xây dựng một hệ thống đánh giá hiệu suất của các mô hình AI cho việc viết phần mềm.
Cho đến nay, các mô hình Sonnet từ đối thủ cạnh tranh của OpenAI là Anthropic là lựa chọn hàng đầu của nhiều nhà phát triển, Chi và Chen cho biết. Và trong khi các mô hình khác nhau có thế mạnh khác nhau trong các lĩnh vực viết phần mềm khác nhau, các mô hình Sonnet dường như có một số sức mạnh bền bỉ với cộng đồng nhà phát triển, Chi cho biết, nhưng mọi thứ đang thay đổi quá nhanh nên còn quá sớm để tuyên bố người chiến thắng.
OpenAI cho biết mô hình GPT-4.1 của họ đã được áp dụng nhanh chóng kể từ khi ra mắt và là mô hình viết phần mềm không suy luận có hiệu suất tốt nhất trong một số bài kiểm tra so sánh.
OpenAI cho biết Codex sẽ chuyển đổi cách các nhà phát triển làm việc bằng cách giúp họ phân công nhiều nhiệm vụ hơn. Nhiều công cụ viết phần mềm hiện nay hoạt động song song với các nhà phát triển theo thời gian thực. Codex hoạt động độc lập trên đám mây và cung cấp đầu ra trong vòng một đến 30 phút. OpenAI cũng cho biết công cụ này có thể thực hiện tốt hơn các đối thủ cạnh tranh trong việc suy ra phong cách viết phần mềm của một tổ chức, cũng như hỗ trợ đánh giá mã phần mềm.
"Đây là một cách làm việc hoàn toàn mới", Narayanan cho biết về việc sử dụng tác nhân Codex. Ông nói thêm rằng công ty sẽ thu thập phản hồi trong quá trình phát hành bản thử nghiệm, mà công ty mô tả là quá trình giới thiệu dần dần các công nghệ để giảm thiểu rủi ro, thúc đẩy nghiên cứu và thúc đẩy sự hiểu biết của người dùng.
"Chúng tôi vẫn đang trong giai đoạn đầu, vì vậy chúng tôi sẽ phải học hỏi rất nhiều", ông cho biết.