NhatDuy
Intern Writer
Google DeepMind đã công bố mô hình ngôn ngữ mới mang tên Gemini Robotics On-Device. Đây là phiên bản có thể hoạt động trực tiếp trên robot mà không cần kết nối internet, đánh dấu bước tiến mới trong lĩnh vực trí tuệ nhân tạo điều khiển robot.
Dựa trên mô hình Gemini Robotics ra mắt hồi tháng 3, phiên bản On-Device cho phép robot thực hiện các hành vi vận động thông qua các lời nhắc bằng ngôn ngữ tự nhiên. Điều này giúp các nhà phát triển dễ dàng tùy chỉnh để phục vụ nhiều mục đích khác nhau. Theo Google, mô hình này có hiệu suất gần tương đương với phiên bản dựa trên đám mây và vượt trội hơn các mô hình trên thiết bị khác trong các bài kiểm tra chuẩn. Tuy nhiên, công ty không nêu cụ thể những mô hình được so sánh.
Trong các buổi trình diễn, những robot chạy mô hình địa phương có thể thực hiện các nhiệm vụ như mở khóa túi và gấp quần áo. Mô hình ban đầu được huấn luyện trên robot ALOHA, sau đó được điều chỉnh để hoạt động với robot hai tay Franka FR3 và robot hình người Apollo của Apptronik. Đáng chú ý, Franka FR3 có khả năng xử lý các vật thể và tình huống chưa từng gặp, ví dụ như các thao tác lắp ráp trên dây chuyền công nghiệp.
Lĩnh vực robot hiện đang thu hút sự quan tâm của nhiều tên tuổi lớn trong ngành công nghệ. Nvidia đang phát triển nền tảng tạo mô hình cơ bản cho robot hình người. Hugging Face tham gia bằng cách cung cấp mô hình và bộ dữ liệu mã nguồn mở, đồng thời cũng phát triển robot riêng. Tại Hàn Quốc, công ty khởi nghiệp RLWRLD nhận được đầu tư từ Future Assets và đang tập trung vào phát triển mô hình cơ bản cho robot. (sohu)

Dựa trên mô hình Gemini Robotics ra mắt hồi tháng 3, phiên bản On-Device cho phép robot thực hiện các hành vi vận động thông qua các lời nhắc bằng ngôn ngữ tự nhiên. Điều này giúp các nhà phát triển dễ dàng tùy chỉnh để phục vụ nhiều mục đích khác nhau. Theo Google, mô hình này có hiệu suất gần tương đương với phiên bản dựa trên đám mây và vượt trội hơn các mô hình trên thiết bị khác trong các bài kiểm tra chuẩn. Tuy nhiên, công ty không nêu cụ thể những mô hình được so sánh.
Trong các buổi trình diễn, những robot chạy mô hình địa phương có thể thực hiện các nhiệm vụ như mở khóa túi và gấp quần áo. Mô hình ban đầu được huấn luyện trên robot ALOHA, sau đó được điều chỉnh để hoạt động với robot hai tay Franka FR3 và robot hình người Apollo của Apptronik. Đáng chú ý, Franka FR3 có khả năng xử lý các vật thể và tình huống chưa từng gặp, ví dụ như các thao tác lắp ráp trên dây chuyền công nghiệp.
Google mở rộng hệ sinh thái robot với bộ công cụ Gemini Robotics SDK
Bên cạnh mô hình mới, Google DeepMind còn giới thiệu Gemini Robotics SDK. Đây là bộ công cụ giúp các nhà phát triển hướng dẫn robot thực hiện từ 50 đến 100 nhiệm vụ và sử dụng những dữ liệu đó để huấn luyện robot trong môi trường mô phỏng vật lý MuJoCo.Lĩnh vực robot hiện đang thu hút sự quan tâm của nhiều tên tuổi lớn trong ngành công nghệ. Nvidia đang phát triển nền tảng tạo mô hình cơ bản cho robot hình người. Hugging Face tham gia bằng cách cung cấp mô hình và bộ dữ liệu mã nguồn mở, đồng thời cũng phát triển robot riêng. Tại Hàn Quốc, công ty khởi nghiệp RLWRLD nhận được đầu tư từ Future Assets và đang tập trung vào phát triển mô hình cơ bản cho robot. (sohu)