OpenAI phát hành phiên bản thứ ba của DALL-E

DALL-E 3 tích hợp với ChatGPT nên người dùng không cần phải nghĩ tới lời nhắc nữa.
OpenAI phát hành phiên bản thứ ba của DALL-E
OpenAI đã công bố phiên bản thứ ba của nền tảng nghệ thuật thị giác AI tổng quát DALL-E, hiện cho phép người dùng sử dụng ChatGPT để tạo lời nhắc và bao gồm nhiều tùy chọn an toàn hơn.
DALL-E chuyển đổi lời nhắc văn bản thành hình ảnh. Nhưng ngay cả DALL-E 2 cũng mắc lỗi, thường bỏ qua cách diễn đạt cụ thể. Các nhà nghiên cứu OpenAI cho biết phiên bản mới nhất hiểu ngữ cảnh tốt hơn nhiều.
Một tính năng mới của DALL-E 3 là tích hợp với ChatGPT. Bằng cách sử dụng ChatGPT, ai đó không cần phải đưa ra lời nhắc chi tiết của riêng mình để hướng dẫn DALL-E 3; họ chỉ cần yêu cầu ChatGPT đưa ra lời nhắc và chatbot sẽ viết ra một đoạn văn (DALL-E hoạt động tốt hơn với các câu dài hơn) để DALL-E 3 làm theo. Những người dùng khác vẫn có thể sử dụng lời nhắc của riêng họ nếu họ có ý tưởng cụ thể về DALL-E.
Trong bản demo cho The Verge, Aditya Ramesh, nhà nghiên cứu chính và người đứng đầu nhóm DALL-E, đã đề nghị ChatGPT giúp anh ấy nghĩ ra logo cho một nhà hàng ramen trên núi. ChatGPT sau đó đã viết một lời nhắc dài hơn và DALL-E đưa ra bốn tùy chọn. Yêu thích của tôi là hình ảnh một ngọn núi với mì ramen phủ tuyết, nước dùng chảy xuống như thác nước và trứng muối trên mặt đất như những viên đá trong vườn - mặc dù nó trông giống một hình minh họa cho một món hàng đẹp nào đó hơn là một logo nhà hàng thông thường. OpenAI cho biết, kết nối này với chatbot cho phép nhiều người hơn tạo ra nghệ thuật AI vì họ không cần phải giỏi đưa ra lời nhắc.
DALL-E, được phát hành lần đầu tiên vào tháng 1 năm 2021, xuất hiện trước các nền tảng nghệ thuật AI tạo văn bản thành hình ảnh khác của Stability AI và Midjourney. Vào thời điểm DALL-E 2 được phát hành vào năm 2022, OpenAI đã mở một danh sách chờ để kiểm soát ai có quyền sử dụng nền tảng này sau những lời chỉ trích rằng DALL-E có thể tạo ra hình ảnh rõ ràng như ảnh chân thực và thể hiện sự thiên vị khi tạo ảnh. Công ty đã xóa danh sách chờ vào tháng 9 năm ngoái và mở DALL-E 2 ra công chúng.
Phiên bản DALL-E mới này sẽ được phát hành lần đầu tiên cho người dùng ChatGPT Plus và ChatGPT Enterprise vào tháng 10, sau đó là các phòng thí nghiệm nghiên cứu và dịch vụ API của nó vào mùa thu. OpenAI có kế hoạch trì hoãn việc phát hành DALL-E 3 nhưng không cam kết khi nào phiên bản công khai miễn phí sẽ được phát hành.
OpenAI tuyên bố họ tập trung rất nhiều công việc vào DALL-E 3 trong việc tạo ra các biện pháp an toàn mạnh mẽ để ngăn chặn việc tạo ra các hình ảnh *** dục hoặc có khả năng gây thù hận. OpenAI cho biết họ đã làm việc với các nhóm đỏ bên ngoài – một nhóm cố tình phá vỡ hệ thống để kiểm tra độ an toàn của nó – và dựa vào các bộ phân loại đầu vào, một cách dạy các mô hình ngôn ngữ bỏ qua một số từ nhất định để tránh những lời nhắc rõ ràng hoặc bạo lực. DALL-E 3 cũng sẽ không thể tạo lại hình ảnh của các nhân vật của công chúng - miễn là lời nhắc đề cập cụ thể đến một cái tên.
Sandhini Agarwal, một nhà nghiên cứu chính sách của công ty, cho biết cô “rất tin tưởng” vào các biện pháp an toàn của mình nhưng cũng nói rõ rằng mô hình này liên tục được cải tiến và không hoàn hảo. Đại diện OpenAI cho biết trong email rằng DALL-E 3 đã được đào tạo để từ chối tạo ra những hình ảnh theo phong cách nghệ sĩ sống. Không giống như DALL-E 2, khi được nhắc, có thể bắt chước nghệ thuật theo phong cách của một số nghệ sĩ nhất định.
OpenAI, có thể để tránh các vụ kiện, cũng sẽ cho phép các nghệ sĩ loại tác phẩm của họ ra khỏi các phiên bản tương lai của mô hình AI chuyển văn bản thành hình ảnh. Người sáng tạo có thể gửi hình ảnh mà họ sở hữu quyền và yêu cầu xóa hình ảnh đó theo biểu mẫu trên trang web của mình. Sau đó, phiên bản tương lai của DALL-E có thể chặn các kết quả trông giống với hình ảnh và phong cách của nghệ sĩ. Các nghệ sĩ đã kiện các đối thủ cạnh tranh của DALL-E Stability AI và Midjourney, cùng với trang web nghệ thuật DeviantArt, vì bị cáo buộc sử dụng tác phẩm có bản quyền của họ để đào tạo các mô hình chuyển văn bản thành hình ảnh của họ.
 


Đăng nhập một lần thảo luận tẹt ga

Gợi ý cộng đồng

Top