OpenAI ra mắt ChatGPT Images 2.0, mô hình tạo ảnh xóa nhòa ranh giới giữa thực và ảo

Mẫn Nhi · 07:04

OpenAI vừa chính thức công bố ChatGPT Images 2.0, một bản nâng cấp quan trọng trong công nghệ tạo hình ảnh bằng trí tuệ nhân tạo. Động thái này diễn ra sau chuỗi thành công của các mô hình trước đó vào năm 2025, nhằm mục tiêu cạnh tranh trực tiếp với dòng Gemini Nano Banana của Google, cụ thể là phiên bản Nano Banana 2 (còn gọi là Gemini 3.1 Flash Image).

Cải tiến vượt trội về độ chi tiết và hiển thị văn bản

Trong buổi livestream ra mắt, CEO Sam Altman cùng đội ngũ OpenAI đã trình diễn khả năng của ChatGPT Images 2.0. Điểm nhấn lớn nhất là khả năng hiển thị văn bản trong ảnh một cách chính xác, khắc phục điểm yếu của các thế hệ trước. Người dùng hiện có thể tạo ra các hình ảnh phức tạp như cửa sổ hệ điều hành macOS hoặc giao diện ứng dụng với các ký tự được kết xuất rõ ràng. Mô hình mới tuân thủ chặt chẽ các chỉ dẫn, bảo tồn chi tiết yêu cầu và xử lý tốt các yếu tố nhỏ như biểu tượng (iconography), thành phần giao diện người dùng (UI) và các bố cục dày đặc. ChatGPT Images 2.0 hỗ trợ độ phân giải lên đến 2K với nhiều tỷ lệ khung hình linh hoạt, từ siêu rộng 3:1 đến siêu cao 1:3.

Thử nghiệm của người viết với prompt rất đơn giản: Tạo một hướng dẫn chi tiết cách nấu phở Hà Nội

Hai phiên bản chuyên biệt và khả năng đa ngôn ngữ

OpenAI giới thiệu hai biến thể: ChatGPT Images 2.0 "instant" và "thinking". Trong đó, phiên bản "thinking" có khả năng tham chiếu thông tin từ web theo thời gian thực để đảm bảo tính chính xác của hình ảnh so với thực tế. Nó cũng có thể tạo ra nhiều hình ảnh khác biệt từ một câu lệnh duy nhất và tự kiểm tra lại kết quả đầu ra của chính mình. Một cải tiến đáng chú ý khác là khả năng hiểu đa ngôn ngữ mạnh mẽ hơn. Mô hình hiện đã xử lý tốt các loại văn bản không thuộc hệ chữ Latinh, bao gồm tiếng Nhật, tiếng Hàn, tiếng Trung, tiếng Hindi và tiếng Bengali.

Chính sách giá API và tính khả dụng

Đối với các nhà phát triển, mô hình gpt-image-2 đã có mặt trên API với cấu trúc giá cụ thể: 8,00 USD cho đầu vào (input), 2,00 USD cho đầu vào được lưu bộ nhớ đệm (cached input) và 30,00 USD cho đầu ra (output). Về phía người dùng cuối, phiên bản ChatGPT Images 2.0 "instant" hiện đã sẵn sàng cho tất cả người dùng ChatGPT và Codex. Ngược lại, phiên bản "thinking" cao cấp hơn sẽ được dành riêng cho các tài khoản đăng ký gói ChatGPT Plus, Pro và Business.

Kết luận

Với việc ra mắt ChatGPT Images 2.0, OpenAI không chỉ nâng cao tiêu chuẩn về chất lượng hình ảnh AI mà còn trực tiếp thách thức vị thế của Google trong cuộc đua công nghệ hình ảnh thế hệ mới.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

OpenAI ra mắt ChatGPT Images 2.0, mô hình tạo ảnh xóa nhòa ranh giới giữa thực và ảo

Mẫn Nhi

Admin xinh gái

Mẫn Nhi

Cải tiến vượt trội về độ chi tiết và hiển thị văn bản

Hai phiên bản chuyên biệt và khả năng đa ngôn ngữ

Chính sách giá API và tính khả dụng

Kết luận

Starbucks thử nghiệm ứng dụng trên ChatGPT, tùy biến công thức đồ uống theo sở thích của khách

Vấn nạn mới: Nghe nhạc online giờ toàn "ca sĩ" AI hát!

"AI làm hết rồi": Giới lập trình và văn phòng đứng trước vách núi

Trung Quốc có thể từ bỏ AI mã nguồn mở không? Câu trả lời không đơn giản như bạn nghĩ.

Một mô hình AI "biết hack" vừa xuất hiện. Chúng ta có nên sợ nó hay không?

3 bí mật các big tech như OpenAI sử dụng đào tạo AI thôi nói bừa từ vụ rò rỉ tài liệu nội bộ

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

CATL vừa tung ra một thông tin gây chấn động khiến toàn bộ ngành xe điện phải “xem lại luật chơi”

Đánh giá nổi bật

Chủ đề hot

Có thể bạn quan tâm

OpenAI ra mắt ChatGPT Images 2.0, mô hình tạo ảnh xóa nhòa ranh giới giữa thực và ảo

Admin xinh gái

Cải tiến vượt trội về độ chi tiết và hiển thị văn bản​

Hai phiên bản chuyên biệt và khả năng đa ngôn ngữ​

Chính sách giá API và tính khả dụng​

Kết luận​

Starbucks thử nghiệm ứng dụng trên ChatGPT, tùy biến công thức đồ uống theo sở thích của khách

Vấn nạn mới: Nghe nhạc online giờ toàn "ca sĩ" AI hát!

"AI làm hết rồi": Giới lập trình và văn phòng đứng trước vách núi

Trung Quốc có thể từ bỏ AI mã nguồn mở không? Câu trả lời không đơn giản như bạn nghĩ.

Một mô hình AI "biết hack" vừa xuất hiện. Chúng ta có nên sợ nó hay không?

3 bí mật các big tech như OpenAI sử dụng đào tạo AI thôi nói bừa từ vụ rò rỉ tài liệu nội bộ

Cải tiến vượt trội về độ chi tiết và hiển thị văn bản

Hai phiên bản chuyên biệt và khả năng đa ngôn ngữ

Chính sách giá API và tính khả dụng

Kết luận