Gemini Robotics: 'Bộ não' AI mới của Google vừa trình làng, biến robot thành trợ thủ đắc lực

Khôi Nguyên · 19:38

Những điểm chính:

Google DeepMind ra mắt hai mô hình AI mới: Gemini Robotics và Gemini Robotics-ER.
Gemini Robotics là mô hình "Thị giác - Ngôn ngữ - Hành động" (VLA), giúp robot tương tác với đồ vật, di chuyển và thực hiện nhiều tác vụ.
Gemini Robotics-ER có khả năng nhận thức không gian vượt trội, có thể suy luận và tạo mã để thực hiện hành động mới.
Cả hai mô hình đều có khả năng thích ứng linh hoạt với các tình huống thay đổi.
Google DeepMind cũng công bố bộ dữ liệu Asimov và "hiến pháp robot" để đảm bảo an toàn.

Google vừa giới thiệu hai mô hình AI mới, Gemini Robotics và Gemini Robotics-ER, được phát triển bởi Google DeepMind, với mục tiêu biến robot trở thành những trợ thủ đắc lực, có khả năng thực hiện nhiều tác vụ phức tạp trong thế giới thực.

Screenshot-2025-03-14-at-13-06-1995-3209-1741932555_png_75.jpg

Gemini Robotics: Nền tảng chung cho robot đa năng

Gemini Robotics được thiết kế dưới dạng mô hình "Thị giác - Ngôn ngữ - Hành động" (Vision-Language-Action - VLA), hướng đến mục tiêu trở thành nền tảng chung cho nhiều loại robot khác nhau. Mô hình này giúp robot:

Tương tác với đồ vật: Nhận biết và thao tác với các đồ vật trong môi trường.
Di chuyển: Điều hướng và di chuyển trong môi trường thực tế.
Thực hiện nhiều tác vụ: Thực hiện các tác vụ đa dạng theo yêu cầu của người dùng.

Google DeepMind đã đăng tải một loạt video cho thấy khả năng của Gemini Robotics. Trong các video này, robot có thể gấp giấy, cất kính vào hộp, và thực hiện nhiều hành động khác theo câu lệnh.

Điểm đáng chú ý là Gemini Robotics có khả năng thích ứng linh hoạt với các tình huống thay đổi. Ví dụ, khi một vật thể bị trượt khỏi tay cầm, hoặc khi có người di chuyển đồ vật xung quanh, robot có thể nhanh chóng điều chỉnh hành động của mình.

Gemini Robotics-ER: Nhận thức không gian và suy luận logic

Gemini Robotics-ER là phiên bản nâng cao của Gemini Robotics, được bổ sung khả năng nhận thức không gian vượt trội. Mô hình này có thể sử dụng khả năng suy luận thực tế (ER) của Gemini để chạy các chương trình riêng.

Gemini Robotics-ER được cho là có thể cải thiện đáng kể các khả năng hiện có của Gemini 2.0, như xác định và nhận diện hình ảnh 3D, suy luận và tạo ra mã để thực hiện các hành động mới ngay lập tức.

Ví dụ, khi nhìn thấy một chiếc cốc cà phê, robot chạy Gemini Robotics-ER có thể suy luận ra cách cầm cốc bằng hai ngón tay và thực hiện động tác đó một cách hoàn chỉnh. Nếu việc tạo mã tự động không hiệu quả, mô hình sẽ quan sát và học hỏi thao tác của con người, sau đó tự áp dụng để tìm ra giải pháp.

apollo_lunch_packing.width-700.format_webp.webp_75.jpg

An toàn và đạo đức: Bộ dữ liệu Asimov và 'hiến pháp robot'

Google DeepMind cũng nhấn mạnh đến vấn đề an toàn và đạo đức trong việc phát triển robot AI. Công ty đã công bố bộ dữ liệu Asimov và phát triển "hiến pháp robot" để định hướng hành vi của robot theo hướng an toàn, đồng thời đánh giá tác động của các mô hình này đối với xã hội.

Tương lai của robot AI

Google cho biết, Gemini Robotics mang đến những bước tiến đáng kể trong việc phát triển các robot đa năng, có khả năng:

Linh hoạt: Thích ứng với nhiều tình huống khác nhau.
Tương tác: Hiểu và phản hồi nhanh chóng trước các lệnh hoặc thay đổi.
Khéo léo: Thực hiện các thao tác mà con người thường làm bằng tay và ngón tay.

"Cùng với các đối tác, chúng tôi hướng đến xây dựng thế hệ robot hữu ích và an toàn hơn," Google DeepMind cho biết.

Trước đó, theo Goldman Sachs Research, phần cứng dành cho robot hình người đã gần hoàn thiện, nhưng phần mềm vẫn chưa theo kịp. Tuy nhiên, với sự xuất hiện của Gemini Robotics và Gemini Robotics-ER, Google đang cho thấy những nỗ lực đáng kể trong việc thu hẹp khoảng cách này.

Việc Google ra mắt Gemini Robotics và Gemini Robotics-ER đánh dấu một bước tiến quan trọng trong lĩnh vực robot AI. Với khả năng học hỏi, thích ứng và thực hiện các tác vụ phức tạp, các mô hình AI này hứa hẹn sẽ mở ra một tương lai mới, nơi robot có thể hỗ trợ con người trong nhiều lĩnh vực của cuộc sống.

Chủ đề hot

Có thể bạn quan tâm

Gemini Robotics: 'Bộ não' AI mới của Google vừa trình làng, biến robot thành trợ thủ đắc lực

Khôi Nguyên

Writer

Khôi Nguyên

OpenAI tuyên bố: "Cuộc đua AI sẽ kết thúc" nếu Mỹ không cho phép sử dụng tự do dữ liệu có bản quyền

Zhipu AI trong danh sách đen của Mỹ, vừa được đầu tư 69,04 triệu USD từ tập đoàn nhà nước Huafa Group

5 cách nhanh chóng để tối ưu hóa việc sử dụng AI

CEO Grab: "người không áp dụng AI sẽ bị AI thay thế" - Grab dừng mọi hoạt động trong 9 tuần để chạy đua với AI

Sự trỗi dậy của các ứng dụng AI

Các công ty quản lý quỹ Trung Quốc đua nhau ứng dụng AI sau thành công của High-Flyer và DeepSeek

Chuyên gia đề xuất đánh thuế tài sản thừa kế lớn: Mức thuế 15-20%?

"Huyền thoại" game bắn súng hồi sinh với đồ họa đỉnh cao, miễn phí luôn cho người đã sở hữu bản gốc

Apple đang hỗn loạn, nếu không muốn nói là khủng hoảng!!!

OpenAI tuyên bố: "Cuộc đua AI sẽ kết thúc" nếu Mỹ không cho phép sử dụng tự do dữ liệu có bản quyền

Gemini Robotics: 'Bộ não' AI mới của Google vừa trình làng, biến robot thành trợ thủ đắc lực

Tài liệu 'mật' của Nga bị rò rỉ: bác bỏ kế hoạch hòa bình 100 ngày của ông Trump, muốn chia cắt thêm lãnh thổ Ukraine?

Nga 'chuyền bóng' lại cho Mỹ trong vấn đề ngừng bắn ở Ukraine: Đồng ý về nguyên tắc, nhưng...

Một nữ tài xế vừa bị phạt tới hơn 130 triệu đồng vì 7 lần "nhầm" đèn đỏ được rẽ trái

Máy bay vũ trụ bí ẩn của không lực Mỹ vừa quay về Trái Đất sau hơn 1 năm bay trên quỹ đạo, nhiệm vụ vẫn là ẩn số

Thị trường Việt Nam vừa có thêm nhà mạng mới toanh với đầu số "bát bát cửu"

Đánh giá nổi bật