Mẫn Nhi
Admin xinh gái
OpenAI vừa chính thức công bố ChatGPT Images 2.0, một bản nâng cấp quan trọng trong công nghệ tạo hình ảnh bằng trí tuệ nhân tạo. Động thái này diễn ra sau chuỗi thành công của các mô hình trước đó vào năm 2025, nhằm mục tiêu cạnh tranh trực tiếp với dòng Gemini Nano Banana của Google, cụ thể là phiên bản Nano Banana 2 (còn gọi là Gemini 3.1 Flash Image).
Thử nghiệm của người viết với prompt rất đơn giản: Tạo một hướng dẫn chi tiết cách nấu phở Hà Nội
Cải tiến vượt trội về độ chi tiết và hiển thị văn bản
Trong buổi livestream ra mắt, CEO Sam Altman cùng đội ngũ OpenAI đã trình diễn khả năng của ChatGPT Images 2.0. Điểm nhấn lớn nhất là khả năng hiển thị văn bản trong ảnh một cách chính xác, khắc phục điểm yếu của các thế hệ trước. Người dùng hiện có thể tạo ra các hình ảnh phức tạp như cửa sổ hệ điều hành macOS hoặc giao diện ứng dụng với các ký tự được kết xuất rõ ràng. Mô hình mới tuân thủ chặt chẽ các chỉ dẫn, bảo tồn chi tiết yêu cầu và xử lý tốt các yếu tố nhỏ như biểu tượng (iconography), thành phần giao diện người dùng (UI) và các bố cục dày đặc. ChatGPT Images 2.0 hỗ trợ độ phân giải lên đến 2K với nhiều tỷ lệ khung hình linh hoạt, từ siêu rộng 3:1 đến siêu cao 1:3.
Thử nghiệm của người viết với prompt rất đơn giản: Tạo một hướng dẫn chi tiết cách nấu phở Hà Nội