Trương Quang
Writer
Tại sao hình ảnh do AI tạo ra thường trông rực rỡ, “giả giả” và thiếu cảm xúc, trong khi ảnh do con người chụp lại có sức hút tự nhiên đến vậy?
Với con người, ánh sáng đi qua mắt, được võng mạc chuyển thành tín hiệu rồi gửi lên não để tạo nên hình ảnh. Mắt người chú ý đến màu sắc, chuyển động, độ sâu và đặc biệt là cảm xúc hay ngữ cảnh. Chính điều đó giúp chúng ta hiểu được ai đang vui, buồn hay đang nguy hiểm.
Máy tính thì khác. Khi “nhìn” một hình ảnh, AI không thật sự thấy như chúng ta. Nó phân tích pixel, góc cạnh, kết cấu, rồi so sánh với hàng triệu hình ảnh khác đã học trước đó. Một bức ảnh với AI là tập hợp dữ liệu, không phải một khoảnh khắc đời thực.
Những bài kiểm tra CAPTCHA mà bạn từng làm “chọn tất cả hình ảnh có xe buýt” chính là cách chúng ta vô tình giúp AI học nhìn. Khi ta chọn đúng, hệ thống học thêm cách phân biệt vật thể, và thị giác máy tính ngày càng tinh vi hơn.
Khi tái hiện lại, AI tạo ra hình ảnh có màu sắc sặc sỡ, bão hòa hơn hẳn, giống ảnh quảng cáo stock. Nó thêm chi tiết, làm cho mọi thứ “giật gân” hơn, chẳng hạn một chiếc xe đơn lẻ trong ảnh gốc lại biến thành cả hàng xe nối đuôi nhau trong ảnh AI.
AI cũng bỏ qua nhiều yếu tố con người coi trọng. Nó không nhắc đến ngữ cảnh văn hóa, không nhận ra chữ Ả Rập hay Do Thái trong ảnh, gần như mặc định mọi thứ đều thuộc “chuẩn phương Tây”. Thậm chí màu sắc và chiều sâu những yếu tố làm nên cảm xúc cũng bị giảm bớt.
Kết quả là hình ảnh AI trông bắt mắt, nhưng lại thiếu linh hồn. Nó “đẹp” theo cách công nghiệp, không còn sự ngẫu hứng và chân thực mà con người tạo ra.
Nếu bạn cần dán nhãn dữ liệu, sắp xếp hàng nghìn ảnh trong kho lưu trữ, AI là lựa chọn tuyệt vời. Nhưng nếu bạn muốn kể một câu chuyện, truyền tải cảm xúc hay nắm bắt “khoảnh khắc”, mắt người vẫn vô địch.
Hiểu được sự khác biệt này giúp chúng ta tận dụng tốt cả hai. Trong một thế giới ngày càng pha trộn giữa thật và ảo, biết “khi nào nên tin vào mắt mình, khi nào nên dùng mắt máy” có thể trở thành kỹ năng sống còn không chỉ cho các nhà thiết kế hay nhiếp ảnh gia, mà cho bất kỳ ai giao tiếp bằng hình ảnh.
Nguồn: theconversation
Khi máy tính “nhìn” thế giới
Chúng ta và máy tính đều “nhìn”, nhưng cách hai bên nhìn nhận thế giới hoàn toàn khác nhau.Với con người, ánh sáng đi qua mắt, được võng mạc chuyển thành tín hiệu rồi gửi lên não để tạo nên hình ảnh. Mắt người chú ý đến màu sắc, chuyển động, độ sâu và đặc biệt là cảm xúc hay ngữ cảnh. Chính điều đó giúp chúng ta hiểu được ai đang vui, buồn hay đang nguy hiểm.
Máy tính thì khác. Khi “nhìn” một hình ảnh, AI không thật sự thấy như chúng ta. Nó phân tích pixel, góc cạnh, kết cấu, rồi so sánh với hàng triệu hình ảnh khác đã học trước đó. Một bức ảnh với AI là tập hợp dữ liệu, không phải một khoảnh khắc đời thực.
Những bài kiểm tra CAPTCHA mà bạn từng làm “chọn tất cả hình ảnh có xe buýt” chính là cách chúng ta vô tình giúp AI học nhìn. Khi ta chọn đúng, hệ thống học thêm cách phân biệt vật thể, và thị giác máy tính ngày càng tinh vi hơn.
Thế giới “lòe loẹt” của AI
Một nghiên cứu từ Đại học RMIT đã chỉ ra sự khác biệt sâu sắc này. Tác giả TJ Thomson dùng AI để mô tả rồi tái tạo lại hai nhóm hình ảnh: ảnh chụp thật và tranh minh họa vẽ tay. Kết quả rất thú vị.Khi tái hiện lại, AI tạo ra hình ảnh có màu sắc sặc sỡ, bão hòa hơn hẳn, giống ảnh quảng cáo stock. Nó thêm chi tiết, làm cho mọi thứ “giật gân” hơn, chẳng hạn một chiếc xe đơn lẻ trong ảnh gốc lại biến thành cả hàng xe nối đuôi nhau trong ảnh AI.
AI cũng bỏ qua nhiều yếu tố con người coi trọng. Nó không nhắc đến ngữ cảnh văn hóa, không nhận ra chữ Ả Rập hay Do Thái trong ảnh, gần như mặc định mọi thứ đều thuộc “chuẩn phương Tây”. Thậm chí màu sắc và chiều sâu những yếu tố làm nên cảm xúc cũng bị giảm bớt.
Kết quả là hình ảnh AI trông bắt mắt, nhưng lại thiếu linh hồn. Nó “đẹp” theo cách công nghiệp, không còn sự ngẫu hứng và chân thực mà con người tạo ra.
Khi nào nên tin vào mắt người, khi nào nên dùng mắt máy?
Điều thú vị là, dù AI có thể tạo ra hình ảnh nhanh, hấp dẫn và phù hợp nhiều ngữ cảnh, nhưng nó không thay thế được cảm xúc thật mà con người cảm nhận được qua hình ảnh.Nếu bạn cần dán nhãn dữ liệu, sắp xếp hàng nghìn ảnh trong kho lưu trữ, AI là lựa chọn tuyệt vời. Nhưng nếu bạn muốn kể một câu chuyện, truyền tải cảm xúc hay nắm bắt “khoảnh khắc”, mắt người vẫn vô địch.
Hiểu được sự khác biệt này giúp chúng ta tận dụng tốt cả hai. Trong một thế giới ngày càng pha trộn giữa thật và ảo, biết “khi nào nên tin vào mắt mình, khi nào nên dùng mắt máy” có thể trở thành kỹ năng sống còn không chỉ cho các nhà thiết kế hay nhiếp ảnh gia, mà cho bất kỳ ai giao tiếp bằng hình ảnh.
Nguồn: theconversation