Tương lai chúng ta sẽ không phải gấp quần áo nữa!

Derpy
Derpy
Phản hồi: 0

Derpy

Intern Writer
Có vẻ như mỗi tuần lại có một video mới về robot gấp quần áo. Chúng ta đã chứng kiến nhiều màn trình diễn tuyệt vời, như video bán tự động từ Weave Robotics. Thật tuyệt vời, nhưng Weave không phải là công ty duy nhất sản xuất những video kiểu này. Figure 02 cũng đang gấp quần áo, và Figure 03 cũng vậy. Physical Intelligence đã ra mắt mô hình hành động ngôn ngữ hình ảnh hàng đầu của họ, pi0, với một video ấn tượng về robot gấp quần áo sau khi lấy đồ từ máy giặt. Bạn có thể xem robot gấp quần áo trực tiếp tại các triển lãm robot. Ngay cả trước đó, Google cũng đã trình diễn việc gấp quần áo trong công trình ALOHA Unleashed. 7X Tech thậm chí còn có kế hoạch bán robot để gấp quần áo!

Ngoài việc gấp quần áo thực sự, còn có những nhiệm vụ tương tự như gấp khăn ăn của Dyna, dẫn đến video robot mà mình yêu thích nhất trong năm, với 18 giờ gấp khăn liên tục. Vậy tại sao tất cả các công ty về thao tác robot này lại đột nhiên quan tâm đến việc gấp quần áo?

Lý do đầu tiên là trước đây chúng ta gần như không thể làm điều này. Có những công trình nghiên cứu từ hơn một thập kỷ trước cho thấy một số khả năng gấp quần áo của robot. Nhưng những màn trình diễn đó rất dễ bị hỏng, cực kỳ chậm và không hề sẵn sàng cho sản xuất. Các giải pháp trước đây (kể cả những giải pháp dựa trên học máy) đều phụ thuộc vào việc hiệu chỉnh camera chính xác hoặc các đặc điểm được thiết kế thủ công, có nghĩa là những màn trình diễn gấp quần áo này thường chỉ hoạt động trên một robot, trong một môi trường nhất định, và có thể chỉ hoạt động một lần duy nhất—đủ để ghi hình cho một video demo hoặc nộp bài nghiên cứu.

Mười năm sau, với dữ liệu trình diễn phù hợp, nhiều startup và phòng thí nghiệm nghiên cứu đã có thể thực hiện các màn trình diễn gấp quần áo; đây là điều mà chúng ta đã thấy từ nhiều người đam mê và startup, sử dụng các công cụ tương tự mà không cần chuyên môn hóa quá mức.

Lý do thứ hai là nó trông thật tuyệt và mọi người đều muốn điều đó! Nhiều người trong chúng ta làm việc trong lĩnh vực robot đều có một "ngôi sao phương Bắc" về một người giúp việc robot có thể làm tất cả những công việc mà chúng ta không muốn làm. Khi nhắc đến việc gấp quần áo, rất nhiều người sẽ nói rằng họ không bao giờ muốn gấp quần áo nữa và sẵn sàng chi một khoản tiền lớn để có được điều đó.

Điều này cũng quan trọng đối với các công ty liên quan. Các công ty như Figure và 1x đã huy động được số tiền lớn dựa trên ý tưởng rằng họ sẽ tự động hóa nhiều công việc khác nhau, nhưng ngày càng nhiều công ty dường như muốn bắt đầu từ trong nhà.

Và đó là phần kỳ diệu của những màn trình diễn này. Mặc dù chúng chậm và không hoàn hảo, nhưng mọi người đều có thể hình dung công nghệ này sẽ trở thành điều mà tất cả chúng ta mong muốn: một robot có thể tồn tại trong nhà và giảm bớt những phiền toái hàng ngày mà chúng ta phải đối mặt.

Lý do thứ ba là nó tránh được những gì mà robot vẫn còn kém. Những hành vi của robot này được sản xuất bởi các mô hình được đào tạo thông qua học bắt chước. Các phương pháp học bắt chước hiện đại như Diffusion Policy sử dụng các kỹ thuật lấy cảm hứng từ trí tuệ nhân tạo sinh để tạo ra các quỹ đạo robot phức tạp, dựa trên các ví dụ về hành vi con người chuyên gia đã được cung cấp cho chúng - và chúng thường cần rất nhiều quỹ đạo. Công trình ALOHA Unleashed của Google là một ví dụ tuyệt vời, cần khoảng 6.000 màn trình diễn để học cách, ví dụ, buộc dây giày. Đối với mỗi màn trình diễn này, một người đã điều khiển một cặp cánh tay robot trong khi thực hiện nhiệm vụ; tất cả dữ liệu này sau đó được sử dụng để đào tạo một chính sách.
1763686263928.png

Chúng ta cần nhớ rằng những gì khó khăn về những màn trình diễn này. Các màn trình diễn của con người không bao giờ hoàn hảo, cũng như không nhất quán; ví dụ, hai người trình diễn sẽ không bao giờ nắm cùng một phần của một vật thể với độ chính xác dưới một milimét. Điều này có thể là một vấn đề nếu bạn muốn vặn một nắp lên trên một máy mà bạn đang xây dựng, nhưng không phải là vấn đề đối với việc gấp quần áo, điều này khá dễ dàng. Điều này có hai tác động phụ:

Thứ nhất, dễ dàng hơn để thu thập các màn trình diễn cần thiết cho việc gấp quần áo, vì bạn không cần phải loại bỏ mọi màn trình diễn đào tạo mà lệch một milimét.

Thứ hai, bạn có thể sử dụng phần cứng rẻ hơn, ít lặp lại hơn để thực hiện cùng một nhiệm vụ, điều này rất hữu ích nếu bạn đột nhiên cần một đội robot thu thập hàng nghìn màn trình diễn, hoặc nếu bạn là một nhóm nhỏ với ngân sách hạn chế!

Vì lý do tương tự, thật tuyệt khi với việc gấp vải, bạn có thể cố định camera ở vị trí chính xác. Khi học một kỹ năng mới, bạn cần các ví dụ đào tạo với "độ phủ" của không gian môi trường mà bạn mong đợi sẽ thấy khi triển khai. Vì vậy, càng nhiều quyền kiểm soát bạn có, quá trình học sẽ càng hiệu quả - bạn sẽ cần ít dữ liệu hơn và dễ dàng hơn để có một màn trình diễn ấn tượng. Hãy nhớ điều này khi bạn thấy một robot gấp đồ trên một bàn phẳng hoặc với một nền cực kỳ sạch sẽ; đó không chỉ là khung hình đẹp, mà còn giúp robot rất nhiều!

Và vì chúng ta đã cam kết thu thập một lượng lớn dữ liệu - hàng chục giờ - để làm cho nhiệm vụ này hoạt động tốt, sẽ có những sai sót xảy ra. Do đó, rất hữu ích nếu dễ dàng khôi phục nhiệm vụ, tức là khôi phục nó về trạng thái mà bạn có thể thử lại. Nếu có điều gì đó sai khi gấp quần áo, không sao cả. Chỉ cần nhặt vải lên, thả nó xuống, và bạn đã sẵn sàng để bắt đầu lại. Điều này sẽ không hiệu quả nếu, chẳng hạn, bạn đang xếp ly để cất vào tủ, vì nếu bạn làm đổ chồng ly hoặc làm rơi một cái xuống sàn, bạn sẽ gặp rắc rối.

Việc gấp quần áo cũng tránh việc tiếp xúc mạnh mẽ với môi trường. Khi bạn đang tạo ra một áp lực lớn, mọi thứ có thể bị hỏng, nhiệm vụ có thể trở nên không thể khôi phục, và việc thu thập các màn trình diễn thường khó khăn hơn vì lực không dễ dàng quan sát được đối với chính sách. Và mọi biến thể (như lượng lực bạn đang tạo ra) sẽ yêu cầu nhiều dữ liệu hơn để mô hình có "độ phủ" của không gian mà nó dự kiến hoạt động.

Trong tương lai, chúng ta nên hy vọng thấy những robot có thể xử lý các tương tác khó khăn và năng động hơn với môi trường của chúng: di chuyển nhanh hơn, di chuyển các vật nặng hơn, và leo trèo hoặc xử lý địa hình bất lợi trong khi thực hiện các nhiệm vụ thao tác.

Nhưng hiện tại, hãy nhớ rằng các phương pháp học hiện đại sẽ đi kèm với những điểm mạnh và điểm yếu riêng. Có vẻ như, mặc dù không dễ dàng, việc gấp quần áo là loại nhiệm vụ rất phù hợp với những gì mà các mô hình của chúng ta có thể làm ngay bây giờ. Vì vậy, hãy mong đợi sẽ thấy nhiều hơn nữa về điều này.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL3R1b25nLWxhaS1jaHVuZy10YS1zZS1raG9uZy1waGFpLWdhcC1xdWFuLWFvLW51YS43NDI1Mi8=
Top