VnReview
Hà Nội

AI kỳ lạ có khả năng tạo ra hình ảnh các loài vật đang cười, kết quả có thể khiến bạn “rùng mình”

Bạn không thể khiến cho những chú chó cưng trong nhà hay con hổ ở vườn thú "mỉm cười" để chụp ảnh đăng Instagram? Đừng lo, một phần mềm trí tuệ nhân tạo mới do các nhà nghiên cứu tại NVIDIA phát triển sẽ giúp bạn làm điều đó, một cách đầy thú vị mà vẫn không kém phần… kì dị!

Phần mềm này có khả năng trích xuất biểu cảm gương mặt của một con vật và "đặt" vào trong bức ảnh của một con vật khác. Với tên gọi GANimal (đặt theo cụm từ tiếng Anh có nghĩa là "mạng nghịch cảnh thế hệ", tên của một loại AI), phần mềm này cho phép người dùng tải ảnh một con vật bất kỳ lên, tái tạo biểu cảm gương mặt của nó và đặt vào trong bức ảnh của một loài vật khác.

Các chương trình GAN trước đây thường được thiết kế để có thể chuyển đổi một bức ảnh sao cho giống với một tấm ảnh khác, tuy nhiên thường được ứng dụng để thực hiện các nhiệm vụ tương đối cụ thể, chẳng hạn như biến ảnh con ngựa thường thành ảnh con ngựa vằn. Tuy nhiên, GANimal có khả năng áp dụng nhiều thay đổi hơn đối với bức ảnh, trong đó có việc chỉnh sửa biểu cảm khuôn mặt, vị trí đầu của các con vật, và trong nhiều trường hợp là cả phần nền của bức ảnh; dựa trên ảnh gốc để áp dụng lên những bức ảnh đã được chỉnh sửa. Khác với đa số các ứng dụng GAN khác, GANimal được thiết kế chuyên để chỉnh sửa ảnh tất cả các loài động vật.

Tuy nhiên, "năng lực thực sự" của hệ thống AI này hiện vẫn còn gây ra nhiều tranh cãi. Một trong những bức ảnh mẫu được các nhà nghiên cứu chia sẻ đã biến một con chó pug trông giống một vị… thuyền trưởng, còn con cáo thì bị biến thành một con… linh miêu. Tuy những bức ảnh thành quả sau khi được AI này xử lý trông có phần… kì dị và đáng sợ, nhưng nghiên cứu của họ vẫn có thể có nhiều ứng dụng trong tương lai.

Theo giải thích của NVIDIA, các ứng dụng trước đây cần phải được cung cấp một vài tấm ảnh gốc của con vật để nhận dạng và xử lý; trong khi đó GANimal chỉ cần duy nhất một tấm mà thôi. Các nghà nghiên cứu gọi phần mềm này là FUNIT – tức thuật toán "biên dịch ảnh sang ảnh không cần giám sát từ số lượng ảnh nguồn rất ít". Mục tiêu của thuật toán này là tạo ra những biểu cảm mới cho loài vật trong bức ảnh chỉ từ một số lượng rất ít ảnh nguồn, thay vì sử dụng một cơ sở dữ liệu ảnh đồ sộ để huấn luyện cho AI như các giải pháp trước đó.

Nghiên cứu này có thể có nhiều ứng dụng hữu ích trong tương lai nếu được mở rộng nghiên cứu thêm, theo gợi ý của NVIDIA, chẳng hạn như sản xuất những bộ phim người đóng có hình ảnh của loài hổ bằng cách quay lại hoạt động của những chú chó dễ huấn luyện, rồi sau đó sử dụng AI để biến chó thành hổ Tuy nhiên, nhóm vẫn đang phát triển các mạng thần kinh để mang đến cho phần mềm "trí tưởng tượng" giống với con người hơn nữa.

Bạn có thể thử tải ảnh của mình lên trang web AI Playground của NVIDIA tại đây để xem kết quả nhé.

An Huy

Chủ đề khác