From Beijing with Love
Cháu đã lớn thế này rồi à. Lại đây chú ôm cái coi.
Sáng 20/5 theo giờ Bắc Kinh, Google I/O 2026 khai màn tại Mountain View, California. Và lần này, CEO Sundar Pichai không nói vòng vo. Ông tuyên bố thẳng: Google đã chính thức bước vào kỷ nguyên của AI đại lý (agentic AI), tức là AI không chỉ trả lời mà còn chủ động hành động thay người dùng.
Đây không còn là buổi ra mắt sản phẩm thông thường. Google gọi đây là một cuộc tấn công toàn diện nhằm vào OpenAI và Anthropic, kéo theo toàn bộ hệ sinh thái tìm kiếm, Android và điện toán đám mây vào một trận chiến duy nhất.
Tiền rót vào nhiều đến mức nào?
Pichai công bố con số không nhỏ: chi phí vốn của Google năm 2022 là 31 tỷ USD, dự kiến tăng lên khoảng 180 đến 190 tỷ USD vào năm 2026, tức tăng gần 6 lần trong vòng bốn năm. Phần lớn khoản đầu tư này đổ vào chip TPU do chính Google tự phát triển. Thế hệ TPU thứ tám vừa ra mắt chia làm hai dòng, một dòng chuyên huấn luyện mô hình và một dòng chuyên suy luận, với sức mạnh tính toán gấp gần 3 lần thế hệ trước.
Mục tiêu rõ ràng: Google muốn không còn phụ thuộc vào chip bên ngoài, tự xây rào cản phần cứng để kiểm soát cuộc chơi từ gốc rễ.
Số liệu người dùng cũng ấn tượng không kém. Lượng token mà Google xử lý mỗi tháng tăng từ 9,7 nghìn tỷ hai năm trước lên 3.200 nghìn tỷ hiện tại. Người dùng hoạt động hàng tháng của Gemini vượt 900 triệu người. Chế độ AI trong Search, ra mắt được một năm, đã chạm mốc hơn 1 tỷ người dùng hàng tháng.
Ba mô hình lớn, ba vai trò khác nhau
Google công bố đồng thời ba mô hình chính. Gemini 3.5 Flash được định vị là mô hình nhẹ nhưng mạnh, vượt qua Gemini 3.1 Pro trước đó về lập trình và suy luận, đồng thời nhanh hơn GPT-4o bốn lần. Mô hình này sẽ là công cụ mặc định cho AI Search của Google, phủ đến hàng tỷ người dùng.
Spark là tác nhân chạy nền trên Google Cloud 24/7, không cần mở ứng dụng, không cần người dùng ra lệnh từng bước. Trong bản demo, Spark tự xử lý việc chuẩn bị đám cưới xuyên suốt Gmail, lịch và tài liệu mà không cần can thiệp thủ công. Pichai gọi đây không phải chatbot mà là "trợ lý kỹ thuật số chủ động".
Gemini Omni là mô hình tham vọng nhất, kết hợp suy luận của Gemini với công nghệ tạo video Veo và chỉnh sửa hình ảnh, cho phép chuyển đổi liền mạch giữa văn bản, hình ảnh, video và âm thanh. Trong bản demo trực tiếp, người dùng tải lên phác thảo vẽ tay kèm mô tả, Omni tạo ra ngay một MV hoàn chỉnh. Omni đã mở cho người dùng trả phí từ hôm nay.
Google Search thay đổi lần đầu kể từ 1998
Pichai nói đây là bản nâng cấp lớn nhất của Google Search kể từ khi ra mắt năm 1998. Công cụ tìm kiếm giờ không còn khớp từ khóa mà đáp ứng ngôn ngữ tự nhiên. Hộp tìm kiếm mới nhận cả văn bản dài, hình ảnh, video và tệp đính kèm. AI sắp xếp câu trả lời trực tiếp thay vì chỉ liệt kê đường dẫn.
Trong hai năm qua, Google bị gắn nhãn chậm chạp trong khi OpenAI dẫn sóng với ChatGPT. Nhưng Google không chạy theo cuộc đua cập nhật mô hình liên tục mà âm thầm tích lũy, chờ đến thời điểm có thể tung toàn bộ hệ sinh thái vào một đòn duy nhất.
Đó chính xác là những gì đang diễn ra tại I/O 2026.
Đây không còn là buổi ra mắt sản phẩm thông thường. Google gọi đây là một cuộc tấn công toàn diện nhằm vào OpenAI và Anthropic, kéo theo toàn bộ hệ sinh thái tìm kiếm, Android và điện toán đám mây vào một trận chiến duy nhất.
Tiền rót vào nhiều đến mức nào?
Pichai công bố con số không nhỏ: chi phí vốn của Google năm 2022 là 31 tỷ USD, dự kiến tăng lên khoảng 180 đến 190 tỷ USD vào năm 2026, tức tăng gần 6 lần trong vòng bốn năm. Phần lớn khoản đầu tư này đổ vào chip TPU do chính Google tự phát triển. Thế hệ TPU thứ tám vừa ra mắt chia làm hai dòng, một dòng chuyên huấn luyện mô hình và một dòng chuyên suy luận, với sức mạnh tính toán gấp gần 3 lần thế hệ trước.
Mục tiêu rõ ràng: Google muốn không còn phụ thuộc vào chip bên ngoài, tự xây rào cản phần cứng để kiểm soát cuộc chơi từ gốc rễ.
Số liệu người dùng cũng ấn tượng không kém. Lượng token mà Google xử lý mỗi tháng tăng từ 9,7 nghìn tỷ hai năm trước lên 3.200 nghìn tỷ hiện tại. Người dùng hoạt động hàng tháng của Gemini vượt 900 triệu người. Chế độ AI trong Search, ra mắt được một năm, đã chạm mốc hơn 1 tỷ người dùng hàng tháng.
Ba mô hình lớn, ba vai trò khác nhau
Google công bố đồng thời ba mô hình chính. Gemini 3.5 Flash được định vị là mô hình nhẹ nhưng mạnh, vượt qua Gemini 3.1 Pro trước đó về lập trình và suy luận, đồng thời nhanh hơn GPT-4o bốn lần. Mô hình này sẽ là công cụ mặc định cho AI Search của Google, phủ đến hàng tỷ người dùng.
Spark là tác nhân chạy nền trên Google Cloud 24/7, không cần mở ứng dụng, không cần người dùng ra lệnh từng bước. Trong bản demo, Spark tự xử lý việc chuẩn bị đám cưới xuyên suốt Gmail, lịch và tài liệu mà không cần can thiệp thủ công. Pichai gọi đây không phải chatbot mà là "trợ lý kỹ thuật số chủ động".
Gemini Omni là mô hình tham vọng nhất, kết hợp suy luận của Gemini với công nghệ tạo video Veo và chỉnh sửa hình ảnh, cho phép chuyển đổi liền mạch giữa văn bản, hình ảnh, video và âm thanh. Trong bản demo trực tiếp, người dùng tải lên phác thảo vẽ tay kèm mô tả, Omni tạo ra ngay một MV hoàn chỉnh. Omni đã mở cho người dùng trả phí từ hôm nay.
Google Search thay đổi lần đầu kể từ 1998
Pichai nói đây là bản nâng cấp lớn nhất của Google Search kể từ khi ra mắt năm 1998. Công cụ tìm kiếm giờ không còn khớp từ khóa mà đáp ứng ngôn ngữ tự nhiên. Hộp tìm kiếm mới nhận cả văn bản dài, hình ảnh, video và tệp đính kèm. AI sắp xếp câu trả lời trực tiếp thay vì chỉ liệt kê đường dẫn.
Trong hai năm qua, Google bị gắn nhãn chậm chạp trong khi OpenAI dẫn sóng với ChatGPT. Nhưng Google không chạy theo cuộc đua cập nhật mô hình liên tục mà âm thầm tích lũy, chờ đến thời điểm có thể tung toàn bộ hệ sinh thái vào một đòn duy nhất.
Đó chính xác là những gì đang diễn ra tại I/O 2026.