Google vừa giới thiệu Titans, kiến trúc được xem như người kế nhiệm Transformer và cũng là bước tiến lớn nhất của hãng trong tám năm qua. Sự xuất hiện của Titans cho thấy Google đang tìm cách vượt qua giới hạn của Transformer và đẩy nhanh hành trình tiến tới AGI.
Tại hội nghị NeurIPS 2025, Google DeepMind không chỉ công bố Titans mà còn đưa ra dự báo mới về tương lai của trí tuệ nhân tạo. CEO Demis Hassabis khẳng định rằng AGI rất có thể xuất hiện vào khoảng năm 2030. Theo ông, để đạt tới mức trí tuệ tương đương con người, thế giới vẫn cần thêm một hoặc hai đột phá công nghệ nữa ở tầm vóc của Transformer hoặc AlphaGo.
Hassabis đưa ra năm xu hướng nổi bật sẽ định hình AI trong 12 tháng tới. AI đa phương thức sẽ mở rộng toàn diện, đặc biệt là khả năng hiểu hình ảnh giống con người, sự hòa trộn sâu giữa ngôn ngữ và video, sự trỗi dậy của mô hình thế giới và sự trưởng thành của các tác nhân AI có thể sử dụng tin cậy. Ông tin rằng việc mở rộng quy mô các hệ thống hiện tại vẫn là yếu tố cốt lõi tạo nên AGI và có thể chính chúng sẽ trở thành nền móng quan trọng nhất của trí tuệ nhân tạo tương lai.
Bên cạnh tầm nhìn lạc quan, Hassabis cũng thừa nhận rủi ro đang tăng lên. Mối đe dọa từ AI bị lạm dụng, đặc biệt trong các hệ thống năng lượng hay hạ tầng thiết yếu, không còn mang tính giả thuyết. Ông cho rằng nguy cơ nghiêm trọng nhất là rủi ro tồn vong của loài người và miễn là xác suất đó không bằng không thì nhân loại phải đối xử với nó một cách nghiêm túc.
Về mặt năng lực mô hình, Hassabis cho biết khả năng quan sát và suy luận từ video vẫn đang bị đánh giá thấp. Gemini đã cho thấy dấu hiệu của tư duy trừu tượng, thậm chí phần nào có yếu tố siêu nhận thức. Tuy nhiên, ông cũng thừa nhận rằng ngay cả những mô hình lớn nhất hiện nay vẫn thiếu nhiều kỹ năng quan trọng như học liên tục, học trực tuyến, lập kế hoạch dài hạn và suy luận nhiều bước. Đó là những thành phần không thể thiếu để đạt tới một AGI thật sự cân bằng và ổn định.
Trong bối cảnh đó, kiến trúc Titans được xem là đột phá lớn nhất của Google kể từ Transformer. Titans kết hợp tốc độ phản hồi cực nhanh của RNN với độ chính xác mạnh mẽ của Transformer. Nhờ cấu trúc bộ nhớ dài hạn và cơ chế tóm tắt thông minh, Titans xử lý được những tài liệu có độ dài lên đến hàng triệu token mà vẫn giữ được độ chính xác cao. Thay vì chỉ lưu trữ thông tin một cách thụ động, Titans chủ động học, cập nhật và duy trì những mối liên kết khái niệm quan trọng, giống như cách trí nhớ ngắn hạn và dài hạn của con người hoạt động.
Song song với Titans, Google giới thiệu khung MIRAS, một cấu trúc lý thuyết thống nhất cho các mô hình trình tự. MIRAS xem mọi kiến trúc AI như những cách tiếp cận khác nhau để giải quyết cùng một vấn đề cốt lõi: làm sao hòa trộn thông tin mới với ký ức cũ mà không làm mất đi các điểm trọng yếu. Từ khung này, Google xây dựng thêm nhiều mô hình không dùng cơ chế chú ý truyền thống nhưng vẫn đạt hiệu suất cao, như MONETA, YAAD và MEMORA.
Các bài kiểm tra trên chuẩn BABILong cho thấy Titans vượt trội so với các mô hình hiện đại như GPT 4 dù sử dụng ít tham số hơn. Ở phạm vi hai triệu token, Titans vẫn giữ tốc độ và độ chính xác ổn định, cho thấy khả năng mở rộng vượt xa các kiến trúc hiện tại.
Sự kết hợp giữa Titans và MIRAS cùng với năng lực đa phương thức ngày càng cải thiện của Gemini khiến cả cộng đồng công nghệ kỳ vọng rằng Google đang tiến rất gần tới một bước nhảy vọt mới. Nếu dự đoán của Hassabis là đúng, AGI đang tăng tốc và có thể xuất hiện sớm hơn nhiều người nghĩ.
Tại hội nghị NeurIPS 2025, Google DeepMind không chỉ công bố Titans mà còn đưa ra dự báo mới về tương lai của trí tuệ nhân tạo. CEO Demis Hassabis khẳng định rằng AGI rất có thể xuất hiện vào khoảng năm 2030. Theo ông, để đạt tới mức trí tuệ tương đương con người, thế giới vẫn cần thêm một hoặc hai đột phá công nghệ nữa ở tầm vóc của Transformer hoặc AlphaGo.
Hassabis đưa ra năm xu hướng nổi bật sẽ định hình AI trong 12 tháng tới. AI đa phương thức sẽ mở rộng toàn diện, đặc biệt là khả năng hiểu hình ảnh giống con người, sự hòa trộn sâu giữa ngôn ngữ và video, sự trỗi dậy của mô hình thế giới và sự trưởng thành của các tác nhân AI có thể sử dụng tin cậy. Ông tin rằng việc mở rộng quy mô các hệ thống hiện tại vẫn là yếu tố cốt lõi tạo nên AGI và có thể chính chúng sẽ trở thành nền móng quan trọng nhất của trí tuệ nhân tạo tương lai.
Bên cạnh tầm nhìn lạc quan, Hassabis cũng thừa nhận rủi ro đang tăng lên. Mối đe dọa từ AI bị lạm dụng, đặc biệt trong các hệ thống năng lượng hay hạ tầng thiết yếu, không còn mang tính giả thuyết. Ông cho rằng nguy cơ nghiêm trọng nhất là rủi ro tồn vong của loài người và miễn là xác suất đó không bằng không thì nhân loại phải đối xử với nó một cách nghiêm túc.
Về mặt năng lực mô hình, Hassabis cho biết khả năng quan sát và suy luận từ video vẫn đang bị đánh giá thấp. Gemini đã cho thấy dấu hiệu của tư duy trừu tượng, thậm chí phần nào có yếu tố siêu nhận thức. Tuy nhiên, ông cũng thừa nhận rằng ngay cả những mô hình lớn nhất hiện nay vẫn thiếu nhiều kỹ năng quan trọng như học liên tục, học trực tuyến, lập kế hoạch dài hạn và suy luận nhiều bước. Đó là những thành phần không thể thiếu để đạt tới một AGI thật sự cân bằng và ổn định.
Trong bối cảnh đó, kiến trúc Titans được xem là đột phá lớn nhất của Google kể từ Transformer. Titans kết hợp tốc độ phản hồi cực nhanh của RNN với độ chính xác mạnh mẽ của Transformer. Nhờ cấu trúc bộ nhớ dài hạn và cơ chế tóm tắt thông minh, Titans xử lý được những tài liệu có độ dài lên đến hàng triệu token mà vẫn giữ được độ chính xác cao. Thay vì chỉ lưu trữ thông tin một cách thụ động, Titans chủ động học, cập nhật và duy trì những mối liên kết khái niệm quan trọng, giống như cách trí nhớ ngắn hạn và dài hạn của con người hoạt động.
Song song với Titans, Google giới thiệu khung MIRAS, một cấu trúc lý thuyết thống nhất cho các mô hình trình tự. MIRAS xem mọi kiến trúc AI như những cách tiếp cận khác nhau để giải quyết cùng một vấn đề cốt lõi: làm sao hòa trộn thông tin mới với ký ức cũ mà không làm mất đi các điểm trọng yếu. Từ khung này, Google xây dựng thêm nhiều mô hình không dùng cơ chế chú ý truyền thống nhưng vẫn đạt hiệu suất cao, như MONETA, YAAD và MEMORA.
Các bài kiểm tra trên chuẩn BABILong cho thấy Titans vượt trội so với các mô hình hiện đại như GPT 4 dù sử dụng ít tham số hơn. Ở phạm vi hai triệu token, Titans vẫn giữ tốc độ và độ chính xác ổn định, cho thấy khả năng mở rộng vượt xa các kiến trúc hiện tại.
Sự kết hợp giữa Titans và MIRAS cùng với năng lực đa phương thức ngày càng cải thiện của Gemini khiến cả cộng đồng công nghệ kỳ vọng rằng Google đang tiến rất gần tới một bước nhảy vọt mới. Nếu dự đoán của Hassabis là đúng, AGI đang tăng tốc và có thể xuất hiện sớm hơn nhiều người nghĩ.