Google khiến cộng đồng số bất ngờ vì AI cuối cùng đã viết đúng chữ trong ảnh

Nguyễn Hoàng · 15:45 Hôm qua

Nếu một ngày bạn có thể tạo ảnh kèm chữ tiếng Việt rõ ràng ngay trong vài chục giây, bạn sẽ làm gì đầu tiên, poster quảng cáo, slide giảng dạy hay infographic cho học sinh?

Khi AI cuối cùng viết đúng chữ trong ảnh

Một hạn chế rất khó chịu của đa số mô hình tạo ảnh trước đây là viết chữ không ra chữ, nét sai, câu vô nghĩa. Google vừa đưa ra Nano Banana Pro, một công cụ mới dựa trên nền tảng Gemini 3 Pro, và điều thú vị là nó thực sự tạo được hình ảnh có chữ rõ ràng, tiếng Việt hiển thị chuẩn, đọc được ngay trong ảnh.

Cách tiếp cận của Google khá đơn giản, tận dụng khả năng lập luận của Gemini và kho tri thức có sẵn từ tìm kiếm của Google. Nhờ vậy công cụ không chỉ hiểu câu lệnh, mà còn trực quan hóa thành hình ảnh cùng nội dung văn bản chính xác theo ngôn ngữ người dùng yêu cầu. Trong thử nghiệm, công cụ có thể tạo infographic, biển quảng cáo, sơ đồ, công thức nấu ăn hay thậm chí hướng dẫn cho trẻ nhỏ bằng tiếng Việt rõ ràng.

Tạo ảnh từ nhiều nguồn và giữ tính nhất quán

Nano Banana Pro cho phép nhập nhiều ảnh tham khảo, tối đa 14 hình, để yêu cầu AI tổng hợp thành một thiết kế thống nhất. Ngoài ra công cụ còn có thể ghi nhớ và tái hiện đồng nhất tối đa 5 nhân vật trong nhiều hình khác nhau. Đầu ra có thể đạt chất lượng 2K hoặc 4K và thường mất gần một phút để hoàn thành. Với yêu cầu phức tạp, AI có thể hiển thị quá trình từng bước để hỏi lại người dùng cho chính xác.

Việc sử dụng không phức tạp, chỉ cần mở Gemini trên điện thoại hoặc máy tính, vào mục tạo hình và nhập câu lệnh. Tuy nhiên trong thực tế thỉnh thoảng công cụ chưa xử lý yêu cầu, người dùng cần làm lại.

Bảo vệ bản quyền và nhận diện nội dung AI

Google cũng chuẩn bị cho lo lắng quen thuộc, nội dung AI bị lợi dụng hoặc khó phân biệt thật giả. Mọi hình ảnh do công cụ tạo đều có gắn ký hiệu SynthID ẩn. Người dùng có thể tải ảnh lên Gemini và hỏi để xác minh nguồn gốc. Ngoài ra bản miễn phí và gói Google AI Pro vẫn có watermark nhạt trong ảnh, còn gói cao cấp Google AI Ultra thì không đặt watermark.

Nếu AI tạo ảnh có chữ chính xác được dùng rộng rãi, thị trường nội dung sẽ phát triển nhanh nhưng cũng đòi hỏi người dùng cẩn trọng với xác minh nguồn gốc. Các dấu nhận diện như SynthID rất quan trọng vì có thể giúp cơ quan quản lý, báo chí, doanh nghiệp và thậm chí người dùng cá nhân bảo vệ mình khỏi bị dẫn dắt bởi hình ảnh bị chỉnh sửa tinh vi. Đây là bước tiến cần thiết để AI phát triển bền vững tại Việt Nam. (vnexpress)