VnReview
Hà Nội

AI này được dạy để chơi tựa game khó nhất thế giới nhưng vẫn không thể phá kỷ lục của con người

Tựa game khó nhất bạn từng chơi là gì? Nếu đó không phải là QWOP, thì xin lỗi, bạn rõ ràng chưa biết một trò chơi điện tử có thể thực sự khó đến thế nào đâu!

Thoạt nhìn có vẻ đơn giản, tựa game điền kinh này "khó xơi" đến mức ngay cả một AI được huấn luyện bằng kỹ thuật học máy cũng chỉ lọt vào được top 10 người chơi có điểm cao nhất, chứ chưa nói đến chuyện phá vỡ kỷ lục trước đó.;

Nếu bạn chưa bao giờ chơi QWOP, bạn nên thử qua một lần tại đây để xem liệu có thể điều khiển anh chàng vận động viên vượt qua được vạch xuất phát hay không. Được phát triển bởi Bennett Foddy vào năm 2008, QWOP lấy cảm hứng từ một tựa game arcade hồi thập niên 1980 tên Track & Field, trong đó đòi hỏi người chơi phải điên cuồng nhấn các nút bấm để thắng cuộc đua. QWOP có chút biến tấu: bạn sẽ dùng 4 nút bấm để điều khiển chuyển động riêng rẽ của phần đùi và bắp chân của vận động viên - toàn bộ cơ thể anh chàng này chuyển động chẳng khác gì một con búp bê làm từ giẻ rách (rag doll) và chịu tác động bởi các hiệu ứng vật lý như trong thế giới thực, bao gồm trọng lực. Nghe có vẻ đơn giản, nhưng làm sao để ước chừng thời gian và nhịp nhấn phím cần để anh chàng kia tiến về phía trước lại là một vấn đề vô cùng nan giải.

Theo Gizmodo, lập trình viên Wesley Liao cảm thấy tò mò không biết liệu một công cụ như AI, vốn được huấn luyện để thực hiện những thứ như làm người trong các bức ảnh cũ chuyển động như thật, sẽ chơi QWOP khá đến mức nào. Sau khi tạo ra một adapter Javascript cho phép công cụ AI thực sự chơi và tương tác được với game, Liao đã thành công trong việc cho AI huấn luyện bằng học máy tự chơi tựa game này, và trong quá trình chơi sẽ dần học được những thao tác nào có thể cho ra những kết quả tích cực (chàng vận động viên tiến về phía trước với vận tốc mỗi lúc một cao hơn) và thao tác nào cho ra kết quả tiêu cực (phần thân trên của chàng vận động viên gập xuống quá gần mặt đất). Thông qua hướng tiếp cận này, AI đã học được một kỹ thuật gọi là "lê đầu gối", giúp nó điều khiển được nhân vật hoàn thành đường chạy 100 mét, nhưng chưa thể phá vỡ vận tốc kỷ lục của con người.

Nỗ lực tiếp theo của Liao nhằm huấn luyện mô hình AI là ghi lại các video gameplay thể hiện quá trình chơi game của nó, bao gồm thao tác vận dụng những bước sải chân dài hơn vốn là yếu tố hàng đầu để tăng tốc độ chạy và về đích trong thời gian chấp nhận được. Hướng tiếp cận này thành công hơn một chút, nhưng AI vẫn không thể thành thục một kỹ thuật đặc biệt được sử dụng bởi các game thủ sành sỏi QWOP, trong đó có các động tác như vung chân lên cao và về phía trước để tạo ra động lượng bổ sung.

Cuối cùng, Liao đã tìm đến một game thủ kỳ cựu với biệt danh Kurodo, một trong những người đạt tốc độ cao nhất trong game QWOP trên toàn thế giới, từng ghi lại 50 đoạn video về kỹ thuật chơi game này ở cấp độ chuyên gia. Nhưng dù đã được tiếp cận với những kỹ thuật chơi QWOP "xịn sò" nhất có thể, Liao nhận ra rằng kết quả tốt nhất chỉ có thể đạt được từ một quá trình huấn luyện học máy với 25 giờ tự chơi của AI, 15 giờ học từ dữ liệu do Kurodo cung cấp, và tiếp tục 25 giờ tự chơi nữa.

Ấy thế nhưng, dù nỗ lực rất nhiều, kết quả chạy 100 mét tốt nhất của AI chỉ là 1 phút 8 giây - lọt top 10. Theo trang Speedrung.com, kỷ lục thế giới chạy 100 mét hiện tại là 48 giây, vừa được thực hiện 1 tháng trước. Liao tự tin rằng càng huấn luyện nhiều và tạo ra một hệ thống khen thưởng khác (giúp AI biết khi nào nó đã làm đúng một điều gì đó), việc lập một kỷ lục thế giới trong trò QWOP chỉ là vấn đề thời gian mà thôi, dù rằng kỷ lục đó có thể không bao giờ được chính thức ghi nhận vì được thực hiện bởi một máy tính.

Minh.T.T (theo Gizmodo)

Chủ đề khác