VnReview
Hà Nội

OpenAI của Elon Musk tạo ra bot có khả năng “bán hành” cho game thủ trong Dota 2

Khi con người và trí tuệ nhân tạo đối mặt nhau trong game, như cờ vua hoặc Go, thông thường đó là những trận đấu đơn đầy căng thẳng. Mỗi người chơi, dù là người hay AI, chỉ cần tập trung vào một địch thủ duy nhất, trên một bàn đấu mà chỉ thay đổi khi người chơi thực hiện một nước đi.

Thế nhưng, OpenAI - tổ chức phi lợi nhuận chuyên về nghiên cứu AI do tỷ phú Elon Musk sáng lập - hôm qua, ngày 25/6, vừa công bố AI bot mới nhất có thể làm việc theo nhóm 5 nhằm đấu lại các nhóm game thủ 5 người khác trong game Dota 2, một tựa game multiplayer cực kỳ phổ biến trong giới e-Sport bởi độ phức tạp và sự cần thiết của việc phối hợp theo nhóm. Phòng nghiên cứu AI này hiện đang xem xét đưa những con bot này đến tham dự các trận đấu trong vòng chung kết Dota 2 diễn ra vào tháng 8 tới đây nhằm thử sức với các game thủ chuyên nghiệp.

Làm chủ Dota 2 là một thách thức không hề nhỏ đối với AI, đơn giản vì lượng quyết định mà một người chơi thông thường phải đưa ra. Một ván cờ vua thông thường có thể kết thúc chỉ trong 40 nước trở lại, còn một ván Go thì dưới 150 nước. Trong khi đó, chỉ trong 45 phút "cày" Dota 2, bot của OpenAI đã đưa ra đến 20.000 nước đi. Dù năm ngoái, Open AI đã cho thấy các con bot của họ có thể một chọi một với một game thủ chuyên nghiệp trong trò chơi nay, nhưng 5 vs 5 lại là một chuyện hoàn toàn khác.

Theo Greg Brockman, CTO của Open AI thì: "Miễn là AI có thể khám phá, nó sẽ học, cứ cho nó đủ thời gian là được".

Những con bot này được phát triển bằng cách cho tự chơi với nhau và học hỏi từ thành công lẫn thất bại của nhau. Bằng cách sử dụng một stack đồ gồm 256 GPU, 128.000 nhân xử lý, các nhà nghiên cứu đã có thể tăng tốc gameplay của AI để mỗi ngày chúng tập luyện sẽ thu được kinh nghiệm tương đương...180 năm! Một phiên bản của con bot này đã được huấn luyện trong 4 tuần, tức nó có kinh nghiệm ngang với một người chơi bình thường chơi suốt 5000 năm.

"Chúng tôi cứ chờ cho đến khi phép màu xuất hiện. Chúng tôi chờ sẽ gặp chướng ngại gì đấy, và chưa bao giờ có vẻ như có chướng ngại nào cả" - Brockman nói.

Cao thủ Dota 2 "Dendi" từng nhận thất bại cay đắng trước bot của OpenAI

OpenAI đã đầu tư rất nhiều thời gian vào việc hoàn thiện một dạng của AI gọi là "học tăng cường" - tức một bot sẽ được trao quyền đưa ra các lựa chọn và sau đó cho biết liệu những lựa chọn nó thực hiện dẫn đến kết quả tốt hay xấu. Trong nghiên cứu của OpenAI, biểu hiện của con bot ban đầu hoàn toàn ngẫu nhiên, và sau đó, nó hành động dựa trên các hành vi có khả năng giúp đạt được mục tiêu cuối cùng. Để một con robot học được cách xếp chồng các khối, kết quả tốt phải là một nhóm các khối được xếp chồng một cách hoàn hảo. Trong trường hợp của bot Dota 2 nêu trên, kết quả tốt là chiến thắng trong game.

Trong một trận đấu, đội OpenAI ban đầu cho mỗi con bot một mệnh lệnh để thực hiện, đồng thời nó cũng có thể tự mình đưa ra các quyết định, có nghĩa là những con bot này khi mới vào game sẽ...rất xấu tính, tìm cách "hôi của" (kill steal) lẫn nhau. Nhưng khi đặt ra một tiêu chuẩn đơn giản, một trọng số liên quan đến thành công của đội chơi, những con bot nhanh chóng bắt đầu làm việc cùng nhau và thực hiện những đợt tấn công đồng loạt nhanh hơn khả năng có thể của con người. Tiêu chuẩn này được OpenAI gọi là "tinh thần đồng đội".

"Chúng bắt đầu đưa ra nhiều đợt tấn công theo đội hơn, và cứu lẫn nhau, và cùng nhau phục kích nhằm tiến đến mục tiêu chung của nhóm" - Brooke Chan, một kỹ sư tại OpenAI nói.

Hiện tại, những con bot này chỉ có thể chơi một số nhân vật nhất định, không thể sử dụng một số món đồ nhất định như gậy phép dùng để thấy rõ bản đồ hay những địch thủ vô hình, hoặc triệu hồi các đơn vị quan khác để giúp chiến đấu với phép thuật. OpenAI hi vọng sẽ sớm gỡ bỏ được những giới hạn trên trước khi bước vào thi đấu trong tháng 8 tới.

Minh.T.T

Chủ đề khác