OpenAI đang bí mật huấn luyện robot

myle.vnreview · 11:12

OpenAI đang âm thầm tiến vào lĩnh vực robot, báo hiệu rằng “khoảnh khắc robot hình người” được mong đợi từ lâu có thể đến gần hơn dự kiến. Mặc dù robot chưa phải là một phần trong sứ mệnh cốt lõi của OpenAI, nhưng công ty đã và đang xây dựng các năng lực giai đoạn đầu.

Ảnh do AI tạo ra để làm minh họa

Vào tháng 2 năm 2025, OpenAI thành lập một phòng thí nghiệm robot tại San Francisco. Phòng thí nghiệm này kể từ đó đã mở rộng gấp hơn bốn lần quy mô ban đầu và hiện hoạt động 24 giờ một ngày. Khoảng 100 người thu thập dữ liệu và ít nhất một chục kỹ sư robot điều khiển từ xa các cánh tay robot để tạo ra dữ liệu huấn luyện.

Trọng tâm chính là các cánh tay robot chi phí thấp, chứ không phải robot hình người hoàn chỉnh. Các nhân viên sử dụng bộ điều khiển in 3D có tên GELLO, trực tiếp ánh xạ các chuyển động tay của con người vào cánh tay robot. Những robot này đang được huấn luyện cho các nhiệm vụ hàng ngày như đặt bánh mì vào máy nướng bánh mì và gấp quần áo.

Chiến lược của OpenAI dựa trên việc thu thập một lượng lớn dữ liệu do con người tạo ra, tương tự như cách các mô hình ngôn ngữ ban đầu được huấn luyện. Các chuyên gia cho rằng thách thức lớn nhất trong lĩnh vực robot không phải là thuật toán, mà là dữ liệu chất lượng cao.

Một phòng thí nghiệm robot thứ hai đang được lên kế hoạch xây dựng ở California, cho thấy sự quan tâm lâu dài của OpenAI. Mặc dù robot hình người hoàn chỉnh vẫn là mục tiêu trong tương lai, OpenAI đang từng bước chuẩn bị nền tảng để đạt được điều đó.

Trước đây, OpenAI đã đầu tư vào một số công ty robot, bao gồm Figure, 1X và Physical Intelligence. Năm 2024, công ty hợp tác với Figure để phát triển "các mô hình AI robot hình người thế hệ tiếp theo", nhưng Giám đốc điều hành của Figure, Brett Adcock, đã thông báo vào tháng 2 năm 2025 rằng sự hợp tác này sẽ kết thúc.

Khi dự án robot đầu tiên của họ kết thúc vào năm 2020, nhiều người tin rằng OpenAI đã chuyển trọng tâm sang phát triển ChatGPT. Giờ đây, công ty đang thể hiện rõ ý định mở rộng sang lĩnh vực phần cứng, và cơ sở kiến thức ChatGPT tích lũy được có thể được sử dụng trong tương lai để huấn luyện robot hiểu và tương tác với thế giới thực.

Các dự án ban đầu sử dụng học tăng cường, một phương pháp cho phép robot tự học thông qua cơ chế thử và sai dựa trên phần thưởng. Giờ đây, công ty đã chuyển sang con đường huấn luyện robot dựa trên việc thu thập dữ liệu quy mô lớn.

"Tất cả các công ty đều đang nỗ lực tìm cách xây dựng các tập dữ liệu quy mô lớn," Jonathan Aitken, một chuyên gia về robot tại Đại học Sheffield, cho biết trong một cuộc phỏng vấn. "Chúng ta đã có các thuật toán AI có thể được huấn luyện trên dữ liệu lớn để hoàn thành các nhiệm vụ, nhưng thách thức cốt lõi luôn là làm thế nào để thu thập được các tập dữ liệu chất lượng cao."

Chiến lược thu thập dữ liệu của OpenAI khác biệt đáng kể so với mô hình phát triển robot của các công ty như Tesla và Figure. Cách tiếp cận của Figure bao gồm việc nhân viên sử dụng bộ đồ ghi lại chuyển động và tai nghe thực tế ảo để ghi lại chuyển động toàn thân và điều khiển robot hình người kích thước thật.

Cách tiếp cận thu thập dữ liệu của OpenAI trùng khớp với một nghiên cứu năm 2023 được công bố bởi các nhà nghiên cứu tại Đại học California, Berkeley. Nghiên cứu đó đề xuất một hệ thống thu thập dữ liệu cánh tay robot điều khiển từ xa chi phí thấp, có khả năng mở rộng. Theo LinkedIn, một trong những nhà nghiên cứu đã gia nhập OpenAI vào tháng 8 năm 2024 để dẫn dắt công việc liên quan đến "xây dựng trung tâm thông minh của robot".

Alan Fein, một chuyên gia về AI và robot tại Đại học bang Oregon, cho biết mô hình này là một tiêu chuẩn ngành, cho phép robot học hỏi bằng cách bắt chước chuyển động của người điều khiển. Aitken chỉ ra rằng chiến lược điều khiển GELLO của OpenAI có những lợi thế đáng kể so với các công ty AI sử dụng bộ đồ ghi hình chuyển động: không chỉ ít tốn kém hơn, mà vì mỗi bộ điều khiển được ánh xạ trực tiếp đến chuyển động của cánh tay robot, robot có thể dịch các hành động cụ thể của con người thành chuyển động cơ học của chính nó một cách trực quan hơn.

Theo các nguồn tin, phòng thí nghiệm San Francisco của OpenAI có hàng chục trạm làm việc hoạt động theo hệ thống ba ca, thu thập dữ liệu suốt ngày đêm. Camera đồng thời ghi lại hoạt động của người vận hành và robot, và tiêu chí đánh giá hiệu suất của nhân viên dựa trên thời lượng dữ liệu huấn luyện hiệu quả được tạo ra.

Mô hình này, dựa vào nhân viên thuê ngoài và được thúc đẩy bởi các chỉ số hiệu suất, hoàn toàn giống với thực tiễn của các công ty trí tuệ nhân tạo, bao gồm cả OpenAI, trong những năm đầu khi họ mở rộng kinh doanh gắn nhãn dữ liệu cho các mô hình ngôn ngữ lớn.

Fein tuyên bố, "Nhiều công ty hy vọng rằng một khi thu thập đủ dữ liệu, nó có thể được chuyển đổi thành các lệnh hành động cho robot, từ đó đạt được hiệu ứng quy mô tương tự như ChatGPT." Tuy nhiên, ông nói thêm, "Ý tưởng này vẫn chưa được chứng minh trong thực tế."

Các nguồn tin thân cận với vấn đề này tiết lộ rằng OpenAI đang nghiên cứu chế tạo một trạm làm việc robot hoàn toàn mới được trang bị cánh tay robot có khả năng mô phỏng sát hơn các chuyển động của tay chân người.

Ngoài ra, công ty còn sử dụng một số dữ liệu thu thập được để huấn luyện robot trong môi trường mô phỏng máy tính và thường xuyên kiểm tra hiệu suất thực tế của cánh tay robot.

Hiện vẫn chưa rõ OpenAI dự định chuyển đổi những kết quả dữ liệu này thành robot hình người hoàn chỉnh nhanh đến mức nào; liệu phương pháp nghiên cứu và phát triển của họ, dựa trên cánh tay robot và chi phí đầu tư thấp, có thể nổi bật so với các công ty đang đầu tư mạnh vào hệ thống robot hình người hoàn chỉnh hay không vẫn còn phải chờ xem.

Aitken nhận xét: "Hiện tại, công nghệ này rõ ràng vẫn đang ở giai đoạn rất sơ khai. Nhưng xét về mặt kỹ thuật, hệ thống này là một giao diện vận hành được thiết kế khéo léo và có thể cấu hình linh hoạt, có thể thích ứng với nhiều loại robot khác nhau."