Sóng AI
Writer

OpenAI vừa phát hành bộ tạo hình ảnh mới được tích hợp vào mô hình GPT-4o, thay thế phiên bản DALL-E cũ.
Công cụ mới được thiết kế ít tập trung vào nghệ thuật siêu thực mà chú trọng vào việc tạo hình ảnh thực tế, có thể kiểm soát cao, phù hợp cho lĩnh vực quảng cáo và thiết kế đồ họa.
Bộ tạo hình ảnh mới giải quyết vấn đề "binding" - khả năng nhận diện và đặt đúng vị trí các đối tượng, như biển hiệu "hot dogs" được đặt chính xác phía trên xe đẩy thức ăn.
Mô hình có thể tạo ra 12 hình ảnh đồ họa riêng biệt trong một hình ảnh duy nhất và sắp xếp chúng theo thứ tự phù hợp.
Công cụ có khả năng tạo ra các hình ảnh cocktail kèm theo thẻ công thức có văn bản rõ ràng, dễ đọc, truyện tranh với bong bóng chữ, quảng cáo mẫu và sơ đồ hướng dẫn.
Người dùng có thể tải lên hình ảnh để chỉnh sửa, và công nghệ này sẽ có sẵn trong bộ tạo video Sora cũng như trong GPT-4o.
Gabe Goh, nhà thiết kế chính của bộ tạo hình ảnh tại OpenAI, gọi đây là "công cụ mới cho giao tiếp", trong khi Kenji Hata, nhà nghiên cứu tại OpenAI, nhấn mạnh rằng họ đang "rời xa khỏi nghệ thuật đẹp" để tạo ra những thứ hữu ích hơn.
OpenAI đang định vị công cụ này để phục vụ các chuyên gia sáng tạo: nhà thiết kế đồ họa, công ty quảng cáo, người quản lý mạng xã hội hoặc họa sĩ minh họa.
Công ty đối mặt với hai thách thức: cạnh tranh với Adobe Photoshop, đang đầu tư mạnh vào công cụ AI, hoặc nhắm đến các nhà thiết kế không chuyên đang sử dụng công cụ như Canva.
David Raskino, đồng sáng lập và giám đốc kỹ thuật của Irreverent Labs, nhận xét rằng "Adobe thực sự nắm giữ thị trường này, và họ đang phát triển đủ nhanh đến mức tôi không biết việc chuyển đổi có hấp dẫn đến mức nào".
Để vượt qua các rào cản kỹ thuật, OpenAI có thể đã sử dụng hàng triệu hình ảnh có văn bản được hiển thị đúng ở nhiều góc độ và định hướng khác nhau.

Nguồn: Songai.vn