Khôi Nguyên
Writer
Google cho biết mô hình Gemini 2.5 Pro cao cấp đã chính thức ra mắt phiên bản ổn định (General Availability), sẵn sàng cho các nhà phát triển xây dựng ứng dụng. Đồng thời, hãng cũng giới thiệu Gemini 2.5 Flash-Lite, một mô hình mới có chi phí cực thấp cho các tác vụ AI khối lượng lớn.
Trong khi đó, Google cũng mang đến một cái nhìn mới về mô hình hiệu quả cao sắp tới của mình, được gọi là Gemini 2.5 Flash-Lite.
Những động thái này cho thấy nỗ lực không ngừng của Google trong việc củng cố vị thế của mình, nhằm cạnh tranh sòng phẳng hơn với OpenAI và các mô hình GPT nổi tiếng của họ.
Hôm nay, cả hai mô hình Gemini 2.5 Flash (vốn đã rời giai đoạn xem trước tại sự kiện I/O) và Gemini 2.5 Pro đều đã chính thức đạt đến trạng thái GA. Phiên bản được chọn cho Gemini 2.5 Pro là bản dựng 06-05, một phiên bản đã được cải tiến gần đây nhằm giải quyết một số vấn đề đã xuất hiện trong bản dựng được giới thiệu tại Google I/O.
Tất cả các mô hình Gemini 2.5 đều bao gồm một tính năng "ngân sách suy nghĩ có thể điều chỉnh" (adjustable thinking budgets), một tính năng rất hấp dẫn đối với các nhà phát triển muốn có nhiều quyền kiểm soát hơn đối với chi phí vận hành.
So với phiên bản 2.5 Flash thông thường, Flash-Lite chỉ tốn một phần ba chi phí cho các đầu vào (văn bản, hình ảnh và video) và chưa đến một phần sáu chi phí cho các token đầu ra. Tuy nhiên, gần như chắc chắn rằng biến thể này của Gemini sẽ không được đưa vào ứng dụng dành cho người dùng thông thường, bởi vì nó có khả năng kém hơn so với 2.5 Flash và chỉ thực sự có ý nghĩa khi bạn đang trả tiền theo từng token sử dụng.
Google thường cố gắng sử dụng mô hình phù hợp nhất cho từng truy vấn. Do đó, các tìm kiếm phức tạp trong Chế độ AI sẽ sử dụng Gemini 2.5 Pro, nhưng những truy vấn đơn giản hơn có thể sẽ chỉ dựa vào Flash hoặc thậm chí là Flash-Lite cho các tìm kiếm rất cơ bản.
Đối với những người dùng ứng dụng Gemini, bạn sẽ không thấy bất kỳ thay đổi lớn nào về mặt chức năng, vì các mô hình 2.5 Pro và 2.5 Flash cuối cùng thực chất đã được triển khai trong ứng dụng từ trước. Thay đổi duy nhất mà bạn có thể nhận thấy là nhãn "preview" (xem trước) trên biến thể Pro sẽ được gỡ bỏ.
Các mức độ truy cập vẫn được giữ nguyên:

Google củng cố "đế chế" AI với loạt cập nhật Gemini
Hôm nay, Google đã công bố một đợt mở rộng lớn cho gia đình mô hình Trí tuệ Nhân tạo (AI) Gemini của mình. Sau nhiều tháng tinh chỉnh và thử nghiệm, mô hình hiệu năng cao Gemini 2.5 Pro đã chính thức rời khỏi giai đoạn xem trước (preview) và đạt đến trạng thái "sẵn sàng cho sử dụng chung" (General Availability), báo hiệu sự ổn định để các nhà phát triển có thể tự tin xây dựng các ứng dụng dài hạn trên đó.Trong khi đó, Google cũng mang đến một cái nhìn mới về mô hình hiệu quả cao sắp tới của mình, được gọi là Gemini 2.5 Flash-Lite.
Những động thái này cho thấy nỗ lực không ngừng của Google trong việc củng cố vị thế của mình, nhằm cạnh tranh sòng phẳng hơn với OpenAI và các mô hình GPT nổi tiếng của họ.

Sự ổn định cho các nhà phát triển
Việc một mô hình AI đạt đến trạng thái "sẵn sàng cho sử dụng chung" (General Availability - GA) là một cột mốc quan trọng. Nó có nghĩa là mô hình đó đã đủ ổn định để các nhà phát triển có thể sử dụng cho các công việc phát triển dài hạn mà không phải lo lắng về những thay đổi lớn có thể xảy ra.Hôm nay, cả hai mô hình Gemini 2.5 Flash (vốn đã rời giai đoạn xem trước tại sự kiện I/O) và Gemini 2.5 Pro đều đã chính thức đạt đến trạng thái GA. Phiên bản được chọn cho Gemini 2.5 Pro là bản dựng 06-05, một phiên bản đã được cải tiến gần đây nhằm giải quyết một số vấn đề đã xuất hiện trong bản dựng được giới thiệu tại Google I/O.
Tất cả các mô hình Gemini 2.5 đều bao gồm một tính năng "ngân sách suy nghĩ có thể điều chỉnh" (adjustable thinking budgets), một tính năng rất hấp dẫn đối với các nhà phát triển muốn có nhiều quyền kiểm soát hơn đối với chi phí vận hành.

Gemini 2.5 Flash-Lite: Lựa chọn siêu tiết kiệm cho các tác vụ lớn
Đối với những nhà phát triển nhạy cảm nhất về mặt chi phí, Google cũng đang giới thiệu Gemini 2.5 Flash-Lite, một mô hình trước đây chỉ ở dạng thử nghiệm. Mô hình này hiện đã ở trong giai đoạn xem trước (preview), cung cấp một phương thức để có thể chạy các khối lượng công việc AI rất lớn mà không phải chịu chi phí đáng kể.So với phiên bản 2.5 Flash thông thường, Flash-Lite chỉ tốn một phần ba chi phí cho các đầu vào (văn bản, hình ảnh và video) và chưa đến một phần sáu chi phí cho các token đầu ra. Tuy nhiên, gần như chắc chắn rằng biến thể này của Gemini sẽ không được đưa vào ứng dụng dành cho người dùng thông thường, bởi vì nó có khả năng kém hơn so với 2.5 Flash và chỉ thực sự có ý nghĩa khi bạn đang trả tiền theo từng token sử dụng.
Tác động đến Google Search và người dùng cuối
Mặc dù những cập nhật này chủ yếu nhắm đến các nhà phát triển, chúng cũng có những tác động trực tiếp đến trải nghiệm của người dùng cuối. Một phát ngôn viên của Google đã nói với trang Ars Technica rằng các phiên bản tùy chỉnh của Google Flash và Flash-Lite hiện đã được kích hoạt trong các tính năng AI Overviews và AI Mode của công cụ tìm kiếm Google.Google thường cố gắng sử dụng mô hình phù hợp nhất cho từng truy vấn. Do đó, các tìm kiếm phức tạp trong Chế độ AI sẽ sử dụng Gemini 2.5 Pro, nhưng những truy vấn đơn giản hơn có thể sẽ chỉ dựa vào Flash hoặc thậm chí là Flash-Lite cho các tìm kiếm rất cơ bản.
Đối với những người dùng ứng dụng Gemini, bạn sẽ không thấy bất kỳ thay đổi lớn nào về mặt chức năng, vì các mô hình 2.5 Pro và 2.5 Flash cuối cùng thực chất đã được triển khai trong ứng dụng từ trước. Thay đổi duy nhất mà bạn có thể nhận thấy là nhãn "preview" (xem trước) trên biến thể Pro sẽ được gỡ bỏ.
Các mức độ truy cập vẫn được giữ nguyên:
- Người dùng miễn phí có quyền truy cập giới hạn vào 2.5 Pro.
- Người đăng ký gói Pro có giới hạn cao hơn là 100 câu lệnh mỗi ngày.
- Người đăng ký gói AI Ultra có mức độ truy cập cao nhất vào Gemini 2.5 Pro.