Ngày 19/11, theo giờ VN, Google chính thức ra mắt thế hệ mới nhất của mô hình trí tuệ nhân tạo Gemini 3. Sản phẩm mà Giám đốc điều hành Sundar Pichai gọi là "mô hình thông minh nhất", đã tạo ra làn sóng trong ngành ngay từ tháng Mười và cuối cùng cũng được công bố.
So với "những bước nhỏ và chạy nhanh" dự kiến ban đầu, việc phát hành Gemini 3 là một minh chứng toàn diện về sự chuẩn bị đầy đủ. "Nó không chỉ là mô hình hiểu biết đa phương thức hàng đầu thế giới, mà còn là mô hình mã hóa tác nhân và rung cảm mạnh mẽ nhất cho đến nay - và tất cả đều được xây dựng dựa trên khả năng đẩy tiên tiến nhất”, Pichai nói.
Cư dân mạng đã xem màn trình diễn của các bài đánh giá Gemini 3 và không khỏi thốt lên: thần chứng khoán Buffett không hổ danh khi đã đặt cược vào Google (gần đây công ty đầu tư Berkshare của Warren Buffet đã giảm cổ phiếu nắm giữ ở Apple và tăng cường mua vào cổ phiếu Google).
Đừng cho đối thủ cơ hội và dẫn trước để giành lại ngai vàng
Ngay khi ra mắt, Gemini 3 đã thống trị gần như tất cả các bộ đánh giá, giành lại vị trí đầu tiên trong đấu trường mô hình lớn LMArena với số điểm 1501 điểm, vượt qua mô hình Grok 4.1 do Musk xAI công bố hôm qua. Bạn xem chụp màn hình dưới đây:
Không khó để nhận thấy từ kết quả thử nghiệm rằng với khả năng suy luận hàng đầu và khả năng đa phương thức mạnh mẽ, hiệu năng của Gemini 3 Pro vượt trội đáng kể so với phiên bản thế hệ trước của mẫu Gemini 2.5 Pro, và nó được "nghiền nát" trước mẫu GPT-5.1 mới nhất của OpenAI.
Trong số đó, trong "Ultimate Human Exam", Gemini 3 Pro đạt 37,5% mà không cần sử dụng bất kỳ công cụ nào. Trong điểm chuẩn GPQA Diamond, Gemini 3 Pro chính xác tới 91,9%. Trong bài kiểm tra toán học "Chế độ địa ngục" MathArena Apex, nó đã đạt đến cấp độ tiên tiến nhất với 23,4%, thiết lập một tiêu chuẩn mới cho các mô hình tiên tiến trong toán học.
Ngoài khả năng văn bản, Gemini 3 Pro đạt được 81% trên MMMU-Pro và 87.6% trên Video-MMMU. Đồng thời, mô hình cũng đạt được số điểm hiện đại là 72,1% trong điểm chuẩn SimpleQA Verified, chứng minh những cải tiến đáng kể về độ chính xác thực tế. Điều này có nghĩa là Gemini 3 Pro được trang bị để giải quyết hiệu quả các vấn đề phức tạp trải dài trên nhiều chủ đề, bao gồm cả khoa học và toán học.
Trong bài kiểm tra Turing "ARC-AGI-2" trong thế giới AI, Gemini 3 Pro đạt 31,1%, vượt xa 17,6% của GPT-5.1. Điều này có nghĩa là AI đang bắt đầu thể hiện một trí thông minh và cách suy nghĩ gần giống con người, có khả năng suy luận trong một chế độ nhiệm vụ chưa từng thấy trước đây thay vì dựa vào việc ghi nhớ học vẹt.
Đồng sáng lập kiêm Giám đốc điều hành OpenAI Sam Altman và người sáng lập kiêm Giám đốc điều hành xAI Elon Musk đã ca ngợi mô hình mới nhất của Google. Altman đã tweet rằng "Gemini 3 trông rất tốt", và Musk nói "làm tốt lắm".
Từ nay, Gemini được tích hợp đầy đủ vào hệ sinh thái sản phẩm của Google, đây cũng là lần đầu tiên Google đưa Gemini vào tìm kiếm trong ngày ra mắt sản phẩm. Ngoài ra, Gemini 3 cũng đang triển khai cho người dùng ứng dụng Gemini, nhà phát triển AI Studio và Vertex AI, và Google Antigravity, một nền tảng phát triển tác nhân mới, hôm nay.
Điều này đủ để thấy tham vọng cấp nền tảng - sử dụng AI để xác định mọi điểm tựa của toàn bộ hệ sinh thái Google.
Phiên bản tư duy sâu sắc của Gemini 3 Pro vẫn chưa được phát hành đầy đủ, nhưng có thể thấy từ hiệu suất thử nghiệm rằng mức điểm chuẩn của nó cao hơn một bậc so với Gemini 3 Pro. Google cho biết nó sẽ có sẵn cho người đăng ký Google AI Ultra trong những tuần tới và vẫn đang được đánh giá bảo mật.
Về việc phát hành Gemini 3, Pichai tự tin tin rằng "đây là một mô hình có thể biến bất kỳ ý tưởng nào của người dùng thành hiện thực".
Học kiến thức, huấn luyện thể thao, phát triển trò chơi đều có sẵn
Qua kết quả thử nghiệm, chúng ta hãy xem Gemini 3 có thể làm được gì.
Gemini 3 có thể lập trình để mô phỏng dòng plasma trong lò phản ứng tokamak, đồng thời cũng có thể sáng tác một bài thơ để giải thích các khái niệm vật lý về nhiệt hạch.
Nếu người dùng muốn học một món ăn truyền thống của gia đình, Gemini 3 có thể phiên dịch và dịch các công thức nấu ăn viết tay bằng các ngôn ngữ khác nhau để tạo ra các công thức nấu ăn có thể chia sẻ với các thành viên trong gia đình.
Nếu người dùng muốn tìm hiểu một kiến thức miền mới, họ có thể cung cấp cho Gemini 3 các bài báo học thuật, video bài giảng và các tài liệu khác, có thể tạo thẻ nhớ tương tác, hình ảnh trực quan hoặc các định dạng mã khác để giúp nắm vững kiến thức liên quan.
Gemini 3 thậm chí có thể hoạt động như một huấn luyện viên, xem video chơi thể thao để chỉ ra những điểm cần cải thiện và lập kế hoạch đào tạo.
Ở chế độ tìm kiếm, Gemini 3 hiện cho phép trải nghiệm giao diện người dùng tổng quát mới, chẳng hạn như bố cục trực quan sống động, công cụ tương tác và mô phỏng, tất cả đều được tạo nhanh chóng dựa trên các truy vấn.
Ngoài ra, Gemini 3 còn có thể viết các trò chơi tàu vũ trụ 3D với giao diện hình ảnh phong phú và khả năng tương tác, thế giới khoa học viễn tưởng có thể chơi được, các trang web thực tế hơn, v.v.
Trên diễn đàn geek, một nhóm các nhà phát triển front-end than thở, "Gemini 3 không chỉ có thể viết mã hiệu quả mà còn hiểu tính thẩm mỹ và hiệu ứng hoạt hình vừa phải, điều này thực sự đáng sợ."
Một nền tảng phát triển agent mới đã được công bố và một vòng cạnh tranh mới bắt đầu
Vào năm 2025, sự bùng nổ "mô hình như tác nhân" của ngành công nghiệp AI sẽ càn quét thế giới, nâng cấp các mô hình lớn từ "công cụ dự đoán" thụ động lên "thực thể hành động" chủ động, mang lại cho các mô hình khả năng đưa ra quyết định tự động và thực hiện.
Tuy nhiên, bất chấp sự gia nhập của người chơi, các sản phẩm agent C thường phải đối mặt với tình thế tiến thoái lưỡng nan là "vỗ tay nhưng không phổ biến", và rất ít sản phẩm có thể đạt được trải nghiệm người dùng đáng tin cậy và dễ sử dụng, kiểm tra sức mạnh cứng toàn diện của lý luận mô hình cơ bản, sử dụng công cụ và lập kế hoạch nhiệm vụ.
Gemini 3 có thể nói là sản phẩm đầu tiên hoàn thành đột phá, trở thành sản phẩm đầu tiên tích hợp khả năng tổng tác nhân vào giao diện mô hình và hỗ trợ nhiều tác vụ phức tạp.
"Khả năng sử dụng công cụ của Gemini 3 đã được cải thiện 30% so với 2.5 Pro, điều đó không chỉ có nghĩa là nó có thể chọn chính xác hơn các công cụ phù hợp để sử dụng mà quan trọng hơn, nó có thể hiểu khi nào cần kết hợp các công cụ khác nhau để hoàn thành các nhiệm vụ phức tạp." ”
Trong bản phát hành này, Google cũng mang đến một nền tảng phát triển agent mới - Google Antigravity.
Với khả năng suy luận nâng cao, cách sử dụng công cụ và khả năng mã hóa thông minh của Gemini 3, Google Antigravity biến sự hỗ trợ của AI từ một công cụ trong bộ công cụ của nhà phát triển thành một người bạn đồng hành tích cực.
Mặc dù cốt lõi của Google Antigravity vẫn dựa trên Môi trường phát triển tích hợp AI (IDE) quen thuộc, nhưng các tác nhân của nó đã được nâng lên một giao diện chuyên dụng với quyền truy cập trực tiếp vào trình chỉnh sửa, thiết bị đầu cuối và trình duyệt. Giờ đây, các tác nhân có thể tự lập kế hoạch và thực hiện các tác vụ phần mềm đầu cuối phức tạp thay mặt cho các nhà phát triển, tự xác thực mã trong quy trình.
Google đã đề cập rằng Gemini 3 cho đến nay là mô hình an toàn nhất và đã nhận được bộ đánh giá bảo mật toàn diện nhất trong số các mô hình AI của Google. Mô hình thể hiện sự tâng bốc thấp hơn, khả năng tiêm chống nhanh chóng cao hơn và tăng cường bảo vệ chống lại lạm dụng tấn công mạng.
Một điều đáng nói nữa về chiến thắng của Gemini 3 là quá trình đào tạo hoàn toàn dựa trên TPU của chính nó và trong khi các công ty AI trên khắp thế giới đang chờ đợi GPU NVIDIA xuất xưởng, Gemini có sự tự tin để mở rộng các thông số của mình một cách bừa bãi.
Với việc Gemini 3 tham gia mô hình "đấu trường đấu sĩ", Google đã công bố sự trở lại của vị vua trên thế giới, đồng thời cũng khiến AI thực sự có một bước tiến quan trọng theo hướng mà mọi người mong đợi. Rõ ràng, một vòng cạnh tranh mới xung quanh các mẫu xe lớn đã được tung ra đầy đủ. #Gemini3ramắt
>> Google Antigravity là gì? Cách sử dụng Antigravity thế nào?