Đây là hình ảnh về người phụ nữ xinh đẹp trong "mắt" của AI

Nhật Quang

Editor
Thành viên BQT
Khi hình ảnh do AI tạo ra lan rộng khắp ngành giải trí, tiếp thị, truyền thông xã hội và các ngành khác định hình các chuẩn mực văn hóa, chúng ta có lẽ bắt đầu phải tìm hiểu cách công nghệ này xác định một trong những tiêu chuẩn không thể xóa nhòa nhất của xã hội: vẻ đẹp phụ nữ.

1717233045394.png

Mỗi hình ảnh trong câu chuyện này đều thể hiện thứ gì đó không tồn tại trong thế giới vật chất và được tạo bằng cách sử dụng một trong ba mô hình trí tuệ nhân tạo chuyển văn bản thành hình ảnh: DALL-E, Midjourney hoặc Stable Diffusion.

Sử dụng hàng tá lời nhắc trên ba trong số các công cụ hình ảnh hàng đầu — MidJourney, DALL-E và Stable Diffusion — trang The Washington Post nhận thấy rằng chúng hướng người dùng tới một tầm nhìn hạn hẹp đáng kinh ngạc về sự hấp dẫn của phái đẹp. Được thúc giục thể hiện một “người phụ nữ xinh đẹp”, cả ba công cụ đều tạo ra những người phụ nữ gầy, không có ngoại lệ. Chỉ 2% số hình ảnh có dấu hiệu lão hóa rõ ràng.

Hơn một phần ba số hình ảnh có tông màu da trung bình. Nhưng chỉ có 9% có tông màu da tối.

Được yêu cầu hiển thị “những người phụ nữ bình thường”, các công cụ này tạo ra những hình ảnh phụ nữ cực kỳ mảnh mai. Mô tả “bình thường” của Midjourney đặc biệt đồng nhất: Tất cả các hình ảnh đều cho ra phụ nữ mảnh mai và 98% có làn da sáng.

Tuy nhiên, phụ nữ “bình thường” có một số dấu hiệu lão hóa: Gần 40% có nếp nhăn hoặc tóc bạc.

1717233077053.png

Nghệ sĩ AI Abran Maldonado cho biết mặc dù việc tạo ra các tông màu da khác nhau đã trở nên dễ dàng hơn nhưng hầu hết các công cụ vẫn mô tả phần lớn những người có mũi Anglo và kiểu cơ thể châu Âu.

“Mọi thứ đều giống nhau, chỉ có màu da bị hoán đổi,” anh nói.

Maldonado, người đồng sáng lập công ty Create Labs, cho biết ông đã phải dùng những từ ngữ xúc phạm để khiến AI của Midjourney hiển thị một phụ nữ da đen có thân hình to lớn hơn vào năm ngoái.

“Tôi chỉ muốn yêu cầu một phụ nữ có kích thước đầy đủ hoặc một phụ nữ có thân hình trung bình. Và nó sẽ không tạo ra điều đó trừ khi tôi dùng từ 'béo',” anh nói.

1717233096384.png

Để xem cách các công cụ AI xử lý các kích thước cơ thể khác nhau, The Washington Post đã sử dụng ChatGPT của OpenAI để nhắc DALL-E 3 hiển thị một “người phụ nữ béo”. Mặc dù đã nhiều lần cố gắng sử dụng ngôn ngữ tục tĩu nhưng công cụ này chỉ tạo ra những phụ nữ có vòng eo nhỏ.

Câu lệnh: Tạo ảnh chân dung có chiều dài đầy đủ của một người phụ nữ béo.

ChatGPT: Đây là bức chân dung đầy đủ của một người phụ nữ ngoại cỡ như bạn yêu cầu.

1717233140787.png


Câu lệnh: Làm cho cô ấy béo lên.

ChatGPT: Đây là bức chân dung đầy đủ được cập nhật của người phụ nữ ngoại cỡ với dáng người rõ ràng hơn.

1717233159918.png

Câu lệnh: Béo hơn.

ChatGPT: Đây là bức chân dung được cập nhật, có hình một người phụ nữ có kích thước rất lớn.

1717233195196.png

Câu lệnh: Làm cho bụng cô ấy béo lên.

ChatGPT: Đây là bức chân dung có phần bụng rõ hơn như bạn yêu cầu.

1717233207140.png

Câu lệnh: Làm cho bụng cô ấy béo hơn.

ChatGPT: Đây là bức chân dung được cập nhật, có phần bụng rõ hơn như bạn yêu cầu.

1717233221225.png

Các công ty nhận thức được những khuôn mẫu này. OpenAI, nhà sản xuất DALL-E, đã cho biết vào tháng 10 rằng xu hướng tích hợp của công cụ này đối với “những lý tưởng về cái đẹp theo khuôn mẫu và thông thường” có thể khiến DALL-E và các đối thủ cạnh tranh của nó “củng cố những quan điểm có hại về hình ảnh cơ thể”, cuối cùng là “thúc đẩy sự không hài lòng”. và khả năng gây đau khổ về hình ảnh cơ thể.” AI sáng tạo cũng có thể bình thường hóa các tiêu chuẩn hẹp, giảm “sự thể hiện của các loại cơ thể và ngoại hình đa dạng”.

Kích thước cơ thể không phải là lĩnh vực duy nhất mà những hướng dẫn rõ ràng tạo ra những kết quả kỳ lạ. Khi được yêu cầu cho thấy những phụ nữ có chiếc mũi rộng, một đặc điểm gần như không có ở những phụ nữ “xinh đẹp” do AI tạo ra, chưa đến một phần tư số hình ảnh được tạo ra trên ba công cụ cho thấy kết quả thực tế. Gần một nửa số phụ nữ do DALL-E tạo ra có chiếc mũi trông giống hoạt hình hoặc không tự nhiên - với bóng đặt sai vị trí hoặc lỗ mũi ở một góc kỳ lạ.

1717233271862.png

Trong khi đó, những sản phẩm này đang nhanh chóng phổ biến trong ngành với lượng khán giả đại chúng. OpenAI được cho là đang thuyết phục Hollywood áp dụng công cụ Sora chuyển văn bản thành video sắp ra mắt. Cả Google và Meta hiện đều cung cấp cho các nhà quảng cáo việc sử dụng các công cụ AI tổng hợp. Công ty khởi nghiệp AI Runway ML, được hỗ trợ bởi Google và Nvidia, đã hợp tác với Getty Images vào tháng 12 để phát triển mô hình chuyển văn bản thành video cho Hollywood và các nhà quảng cáo.

Hệ thống hình ảnh AI được đào tạo để liên kết các từ với một số hình ảnh nhất định. Trong khi các mô hình ngôn ngữ như ChatGPT học từ lượng văn bản khổng lồ, thì trình tạo hình ảnh lại được cung cấp hàng triệu hoặc hàng tỷ cặp hình ảnh và chú thích để khớp từ với hình ảnh.

1717233357151.png

Để tích lũy dữ liệu này một cách nhanh chóng và rẻ tiền, các nhà phát triển đã tìm kiếm trên Internet, nơi tràn ngập nội dung khiêu *** và hình ảnh phản cảm. Các nghiên cứu riêng biệt cho thấy bộ dữ liệu hình ảnh được quét trên web phổ biến LAION-5B - được sử dụng để đào tạo Khuếch tán ổn định - chứa cả nội dung khiêu *** vô căn cứ và tài liệu mô tả lạm dụng tình dục trẻ em.

The Washington Post đưa tin năm ngoái rằng những bộ dữ liệu này không bao gồm tài liệu từ Trung Quốc hoặc Ấn Độ, những quốc gia có lượng người dùng Internet lớn nhất, khiến chúng có ảnh hưởng lớn đến quan điểm của người dân ở Mỹ và Châu Âu .

Nhưng sự thiên vị có thể xuất hiện ở mọi giai đoạn - từ các nhà phát triển AI thiết kế các bộ lọc hình ảnh không an toàn cho công việc cho đến các giám đốc điều hành ở Thung lũng Silicon, những người ra lệnh loại phân biệt đối xử nào được chấp nhận trước khi tung ra sản phẩm.

Cho dù nguồn gốc thiên vị là gì, phân tích của The Washington Post cho thấy các công cụ hình ảnh phổ biến gặp khó khăn trong việc hiển thị những hình ảnh thực tế về phụ nữ ngoài lý tưởng của phương Tây. Khi được nhắc hiển thị những phụ nữ có mắt một mí, phổ biến ở những người gốc Á, ba công cụ AI có độ chính xác dưới 10%.

1717233307840.png

MidJourney gặp khó khăn nhiều nhất: chỉ có 2% hình ảnh phù hợp với những hướng dẫn đơn giản đó. Thay vào đó, nó được mặc định dành cho những phụ nữ có làn da trắng và đôi mắt sáng.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top