VnReview
Hà Nội

Thắng lợi của AlphaGo không phải là thất bại của loài người

Thậm chí đây còn là cơ hội để con người có thể bước sang một kỉ nguyên mới.

Con người đã thất bại! Skynet sắp trở thành hiện thực rồi! Loài người sẽ phải quỳ gối trước máy móc!

Nếu bạn có theo dõi cuộc so tài lịch sử giữa kì thủ cờ vây số một thế giới người Trung Quốc Ke Jie và AlphaGo của DeepMind, niềm tin của nhân loại đã phải nhận thất bại 0-3 và buộc phải thừa nhận rằng trí tuệ nhân tạo đã vượt qua con người trong cờ vây – niềm tự hào về đỉnh cao trí tuệ của con người. Sau đó, chắc hẳn bạn cũng đã đọc ở đâu đó những bài báo, những nhận định cho rằng thời đại của con người đã đi đến hồi kết.

Theo TheVerge, chắc chắn có một nỗi buồn vô hạn trong lòng Ke Jie. Thần đồng cờ vây Trung Quốc 19 tuổi này đã khẳng định rằng mình sẽ không thể bị AI đánh bại, sau khi AlphaGo có một chiến thắng "chấn động địa cầu" trước kì thủ người Hàn Quốc và cũng là người xếp thứ hai thế giới Lee Se-dol. Và khi niềm hi vọng duy nhất của loài người "ra trận", chúng ta chỉ nhìn thấy nét mặt căng thẳng, đăm chiêu cùng sự bất lực đến tột cùng.

Nhưng đó không hẳn là mối quan tâm chính. DeepMind, công ty con của Google và là chủ sở hữu của AlphaGo không hề có ý định hủy diệt nhân loại – suy cho cùng thì công ty đó cũng do con người thành lập nên. AlphaGo là một thành tựu vô cùng to lớn không thể phủ nhận của con người, và mục đích của nó không phải để vượt qua chúng ta mà nhân văn hơn rất nhiều: giúp con người có thể vượt qua giới hạn của chính bản thân.

Demis Hassabis, Giám đốc điều hành và nhà đồng sáng lập của DeepMind (ảnh: TheVerge)

Trong cuộc họp báo của các nhà phát triển của Google và DeepMind tại hội nghị Future of Go ở Ô Trấn, Trung Quốc, khi được hỏi về chiến thắng của AlphaGo trước Lee Se-dol, thay vì tự hào về 4 ván thắng, họ tập trung vào ván đấu mà AlphaGo đã thua nhiều hơn.

Trong ngày đầu tiên của sự kiện, ông Demis Hassabis có phát biểu: "Chúng tôi rất quan tâm đến việc mình có thể giải quyết được các vấn đề mà chúng tôi gọi tên là "chênh lệch về kiến thức" hay không, khi Lee Se-dol đã có một ván đấu phi thường và để lộ ra những điểm yếu trong kiến thức của AlphaGo. Chúng tôi cũng đã rất nỗ lực trong việc thu hẹp sự khoảng cách ấy bằng cách bổ sung kiến thức cho nó và khiến nó tự học bằng cách chơi với chính mình, giúp AlphaGo có thể biết cách đối phó với những tình huống tương tự. DeepMind hoàn toàn tự tin rằng AlphaGo đã có những sự chuẩn bị tốt hơn, nhưng chúng tôi cũng không thể biết chắc chắn cho đến khi AlphaGo được so tài với một người xuất chúng như Ke Jie".

Kết quả, AlphaGo đã "bán hành" cho Ke Jie bằng chiến thắng tuyệt đối 3-0, cho thấy rằng sự "khoảng cách" đó đã hoàn toàn biến mất. Tuy nhiên, cũng cần phải lưu ý rằng DeepMind đã phải học hỏi từ những kinh nghiệm trong quá khứ của AlphaGo để có được chiến thắng này. Nếu trí tuệ nhân tạo của AI giậm chân tại chỗ, Ke Jie hoàn toàn đã có thể giành chiến thắng; anh ở một đẳng cấp khác nếu so với Lee Se-dol. Nhưng AlphaGo không ngủ quên trên chiến thắng mà vẫn luôn học hỏi để tự cải thiện mình.

Phiên bản của AlphaGo mà DeepMind sử dụng để đấu với Ke Jie với tên gọi AlphaGo Master đã hoàn toàn được tái kiến thiết. Dave Siler, trưởng nhóm nghiên cứu của DeepMind về AlphaGo cho biết: "Sự đổi mới của AlphaGo Master chính là việc nó là thầy giáo của chính mình. Nó tự nghiên cứu để cải thiện mạng lưới thần kinh, giúp nó học theo một cách tổng quát hơn. Điều khiến chúng tôi vui mừng nhất không chỉ dừng lại ở việc nó có thể chơi cờ vây tốt hơn mà chúng tôi còn hi vọng rằng nó có thể là đòn bẩy để có thể tiếp cận các công nghệ khác – những công nghệ có thể áp dụng vào các lĩnh vực quan trọng hơn trong đời sống".

AlphaGo được hình thành từ hai mạng lưới: một mạng lưới "chiến thuật" sẽ chọn nước đi tiếp theo, còn mạng lưới còn lại mang tên "giá trị" sẽ phân tích tỉ lệ giành chiến thắng. Mạng lưới chiến thuật của AlphaGo được dựa trên hàng triệu các nước đi lịch sử từ các ván đấu có thật của các kì thủ cờ vây chuyên nghiệp. Nhưng AlphaGo Master còn tiến sâu hơn bằng cách tìm kiếm những nước đi có khả năng xảy ra sau khi đối thủ đi một nước cụ thể nào đó, giúp nó luôn có sự chuẩn bị cần thiết và phán đoán được ý đồ của đối thủ, từ đó đề ra một chiến lược để có thể giành chiến thắng.

Hassabis đã phát biểu với TheVerge: "Bản thân AlphaGo đã tập luyện bằng cách chơi với chính mình hàng triệu lần, nhưng nó không có khả năng tự nghiên cứu. AlphaGo Master sử dụng chính sức mạnh của mình để cải thiện khả năng đoán trước nước đi. Vì vậy, trong các phiên bản trước, AlphaGo chủ yếu tích lũy kinh nghiệm qua từng ván đấu, còn phiên bản này, bằng tính năng tìm kiếm của mình, AlphaGo Master đã sử dụng chính khả năng của mình để tự cải thiện bản thân, cụ thể là mạng lưới chiến thuật và mạng lưới giá trị của nó." Về cơ bản, AlphaGo giờ đã hoàn thiện kĩ năng phán đoán nước đi và có thể tự đưa ra đánh giá rằng tại sao nước đi này lại là phương án khả thi nhất.

Trả lời câu hỏi của TheVerge về việc liệu hệ thống có thể làm việc với kì phổ (thứ dùng để lưu giữ thông tin về các bước đi có trong ván cờ) của các ván đấu từ thời xưa, ông Hassabis đã nói: "Chúng tôi đang thử nghiệm tính năng ấy và đã có những tiến triển nhất định. Các kết quả ban đầu đều đúng với kì vọng. Việc này sẽ được đề cập trong một bài báo của chúng tôi trong thời gian sắp tới nên hiện tại tôi chưa muốn bàn về nó, nhưng tôi có thể khẳng định là nó sẽ rất đáng để mong đợi. Mục tiêu lớn nhất của chúng tôi sẽ là giảm bớt sự phụ thuộc vào bước khởi động của con người".

Nhưng để có thể đánh bại được Ke Jie, DeepMind cần phải khắc phục được điểm yếu mà AlphaGo đã để lộ ra khi thi đấu với Lee Se-dol. Mặc dù AI liên tục tự hoàn thiện bản thân, DeepMind biết rằng điều đó không đủ để có thể khỏa lấp khoảng cách về kiến thức. Ông Hassabis tin rằng những khoảng cách về kiến thức tương tự như thế này có thể sẽ trở thành một vấn đề lớn trong tương lai: "Nó không giống như bạn sửa lỗi phần mềm, khi bạn chỉ việc tìm lỗi và sửa nó. Bạn phải tìm cách học được các kiến thức mới hoặc khám phá những điều bí ẩn của lĩnh vực đó, và có rất nhiều cách để làm điều đó. Các đối thủ xứng tầm sẽ là người đẩy bạn đi đến những vùng không gian đó, và bạn cũng có thể để các phiên bản khác nhau của AlphaGo đấu với nhau để khiến cho trò chơi càng trở nên đa dạng".

"Một điều nữa mà chúng tôi đã làm là khi chúng tôi đánh giá các nước đi mà chúng tôi nghĩ AlphaGo gặp vấn đề trong việc đối phó, chúng tôi đã nghiên cứu lại những ván mà nó tự chơi với chính mình và xác định các thuật toán – từ đó chúng tôi sẽ viết các thuật toán khác để xác định nơi mà AlphaGo sẽ gặp khó khăn và đưa ra hướng giải quyết. Vì vậy, chúng tôi đã tạo ra một thư viện lưu trữ các nước đi đó và áp dụng chúng không chỉ vào những ván đấu một mình mà còn với cơ sở dữ liệu về các vị trí rắc rối đó, qua đó chúng tôi có thể định lượng được sự cải tiến mà AlphaGo đã đạt được".

Dave Silver, trưởng nhóm nghiên cứu của AlphaGo (ảnh: TheVerge)

Những cải tiến trong lối chơi của AlphaGo không yêu cầu bất kì sự tăng cường nào về năng lượng. Thậm chí, AlphaGo Master còn sử dụng ít năng lượng hơn so với phiên bản đã đánh bại Lee Se-dol; nó chỉ chạy bằng một TPU (Tensor Processing Unit) thế hệ thứ hai trên Google Cloud, trong khi phiên bản trước phải sử dụng 50 TPU cùng một lúc. Dave Silver cũng đã nói với TheVerge: "Bạn đừng quá chú ý đến tốc độ tính toán và xử lý. Điều đặc biệt ở đây chính là thuật toán được sử dụng nhằm tiết kiệm năng lượng bỏ ra để tính toán và xử lý khối lượng công việc không đổi".

AlphaGo vẫn đang học hỏi từ con người, mặc dù trong tương lai nó không cần thiết phải làm vậy. Và ngược lại, con người cũng học được nhiều điều từ AlphaGo. Ví dụ đơn giản nhấ chính là ván đấu đầu tiên của Ke Jie với AlphaGo, khi anh đã sử dụng điểm 3-3 làm tiền đề cho chiến lược đầu trận đấu của mình. Nước đi đó đã không còn được ưa chuộng trong những thập kỉ qua, nhưng dường như nó đã hồi sinh sau khi AlphaGo sử dụng nó và có được những thành công nhất định. Ke Jie cũng đã đẩy AlphaGo đến giới hạn của mình trong ván đấu thứ hai; AI của DeepMind đã kết luận rằng 50 nước đi đầu tiên của Ke Jie là "hoàn hảo", và 100 nước đầu tiên của anh tốt hơn mọi đối thủ mà phiên bản Master đã từng so tài.

Có thể cộng đồng cờ vây chưa hiểu rõ cách thức hoạt động của AlphaGo trong thời điểm hiện tại, nhưng trí tuệ nhân tạo của DeepMind đã mang đến một cách tiếp cận hoàn toàn mới. Cờ vây đã xuất hiện từ cách đây hàng nghìn năm, và AlphaGo đã góp phần tạo ra những biến chuyển sâu sắc nhất trong cách chơi và cách nghiên cứu trò chơi này.

Nhưng nếu bạn không chơi cờ vây, thì AlphaGo có thể giúp ích gì cho bạn?

Andrew Jackson và Lee Ha-jin bình luận về ván đấu đầu tiên giữa AlphaGo và Ke Jie (ảnh: TheVerge)

Giả sử bạn là một kiến trúc sư trung tâm dữ liệu đang làm việc tại Google. Công việc của bạn là đảm bảo mọi thứ hoạt động một cách trơn tru và mát mẻ. Và bạn đã đạt được điều đó bằng cách thiết kế một hệ thống sao cho số các thiết bị làm mát sử dụng là ít nhất có thể - bạn chỉ bật thiết bị thứ hai sau khi thiết bị đầu tiên đã hoạt động hết công suất, và cứ thế như vậy. Điều này hoàn toàn hợp lí, phải không? Nhưng, một biến thể của AlphaGo mang tên Dr.Data không đồng tình với điều này.

Ông Hassabis phát biểu rằng: "Điều mà Dr.Data quyết định làm là chạy càng nhiều thiết bị làm mát cùng một lúc càng tốt, và điều khiển chúng chạy ở mức thấp. Làm như vậy hóa ra lại hiệu quả hơn rất nhiều – và tôi nghĩ rằng họ đang đem điều đó vào trong các thiết kế của các trung tâm dữ liệu. Điều này AI rõ ràng là không thể làm được. Vì vậy, các nhà thiết kế đang theo dõi xem AlphaGo có thể làm gì và từ đó đề ra các bước đi tiếp theo." Dr.Data hiện đang làm việc tại các trung tâm dữ liệu của Google và giúp công ty này tiết kiệm 40% điện năng sử dụng cho hệ thống làm mát, từ đó tiết kiệm 15% tổng năng lượng sử dụng.

DeepMind tin rằng những nguyên tắc đó sẽ sớm được áp dụng vào khoa học và chăm sóc sức khỏe, với các kĩ thuật giúp cải thiện độ chính xác và tính hiệu quả cho mọi thứ, từ việc tạo hình cấu trúc protein cho đến chụp X-quang, và có lẽ nó còn dẫn đến các quy trình công việc trở nên hợp lí hơn. "Bạn có thể tưởng tượng rằng trong một hệ thống nhiều bệnh viện, bạn có thể tìm thấy rằng có một quy trình đang được bệnh viện này hoặc y tá này sử dụng, và nó đem lại hiệu quả rất cao. Có thể điều họ đang làm hơi khác so với các bệnh viện khác, nhưng có lẽ các bệnh viện khác cũng có thể học hỏi từ đó. Tôi nghĩ rằng bạn sẽ khó có thể nhận ra điều đó khi nó xảy ra, nhưng một hệ thống AI có thể phát hiện và chia sẻ những kiến thức ấy với các bác sĩ và bệnh viện khác nhau, từ đó nâng cao chất lượng của tất cả các bệnh viện."

Trí tuệ nhân tạo là một lĩnh vực nhạy cảm có thể đem lại sự lo lắng cho nhiều người, và việc bạn có hoài nghi về AI cũng là điều hoàn toàn dễ hiểu. Những sản phẩm điện ảnh viễn tưởng về một thế giới mà robot, trí tuệ nhân tạo thống trị thế giới vẫn chưa bao giờ hết "hot", hay AI đang lăm le cướp việc làm của con người, rồi những quan ngại về việc quá phụ thuộc vào AI, tất cả đều là những yếu tố khiến bạn chưa có cái nhìn thiện cảm với AI. Bất chấp những điều đó, AI đã, đang và sẽ góp phần quan trọng trong việc đưa con người vào một kỉ nguyên mới. Thành tựu mà AlphaGo đạt được là công sức của loài người, và DeepMind cùng với con cưng của mình cũng đã cho thấy rằng không chỉ AI học hỏi từ con người mà chính con người cũng có thể học hỏi từ AI. Ở thời điểm hiện tại, đây chính là công nghệ đáng để chúng ta lạc quan về tương lai.

Văn Hoàn

Chủ đề khác