AI học cách đọc vị cảm xúc: Ngữ cảnh là chìa khóa thấu hiểu con người.

Derpy
Derpy
Phản hồi: 0

Derpy

Intern Writer
Có một điều mà AI vẫn chưa làm được: hiểu tại sao bạn lại cảm thấy như vậy.

Hãy thử hình dung thế này. Bạn đang trong buổi đánh giá hiệu suất cuối năm. Sếp hỏi thăm, bạn đáp "ổn" và cố nở một nụ cười. Nhưng giọng bạn hơi run, vai chùng xuống. Với mắt người tinh ý, đó là dấu hiệu của sự kiệt sức. Với một AI chỉ biết phân loại cảm xúc thành "vui" hay "buồn", nó ghi nhận nụ cười rồi bỏ qua tất cả.

Đây chính là vấn đề cốt lõi của AI cảm xúc hiện nay.
1782274974282.png

Công nghệ này đang có mặt ở khắp nơi. Các nền tảng tổng đài dùng AI để phát hiện khi khách hàng khó chịu. Ứng dụng bạn đồng hành ảo nở rộ với thị trường dự kiến đạt khoảng 555 tỷ USD (tương đương 13.875 nghìn tỷ đồng) vào năm 2035. Ngay cả các thiết bị nhỏ như ElliQ, trông giống chiếc đèn bàn trắng, cũng đang được dùng để trò chuyện với người cao tuổi nhằm giảm bớt cô đơn.

Nhưng vấn đề nằm ở chỗ: hầu hết các hệ thống này chỉ đọc một vài tín hiệu bề ngoài rồi gán nhãn một cảm xúc. Tiếng cười có thể là niềm vui, nhưng cũng có thể là lo lắng. Giọng nói to có thể là hứng khởi hoặc bực bội. Và phản ứng của mỗi người lại khác nhau tùy vào văn hóa, tính cách, bối cảnh. Thậm chí một khảo sát công bố năm 2024 cho thấy điểm căng thẳng trên đồng hồ thông minh hiếm khi khớp với cảm nhận thực của người dùng, một phần tư người được hỏi cho biết cảm xúc họ trải qua hoàn toàn ngược với số liệu đồng hồ ghi nhận.

Câu trả lời không phải là từ bỏ công nghệ, mà là bổ sung ngữ cảnh.

Khái niệm "AI ngữ cảnh con người" đang được nhiều nhóm nghiên cứu theo đuổi, trong đó có công ty Neurologyca ở Tây Ban Nha. Thay vì chỉ đọc một tín hiệu tại một thời điểm, hướng tiếp cận này kết hợp ba lớp thông tin: ngữ cảnh tình huống (đây là buổi phỏng vấn hay buổi thư giãn?), ngữ cảnh cá nhân (người này có tiền sử lo âu không, mục tiêu của họ là gì?) và ngữ cảnh hành vi (sự chú ý, tự tin, mức độ tham gia của họ đang thay đổi theo thời gian thực ra sao?).

Neurologyca xây dựng cơ sở dữ liệu này qua nhiều năm, lập bản đồ hơn 790 điểm tham chiếu trên khuôn mặt và cơ thể, kết hợp với dữ liệu sinh trắc học, giọng nói và văn bản. Thay vì gán nhãn cứng nhắc, hệ thống phản ánh sự không chắc chắn thông qua điểm tin cậy thấp hơn khi tín hiệu mơ hồ, thay vì cố ép ra một kết luận.

Công nghệ này có thể hữu ích trong nhiều lĩnh vực, từ ứng dụng thiền định biết bạn đang lo lắng đến mức nào, đến robot giáo viên nhận ra khi học sinh đang bối rối, đến trợ lý phỏng vấn giúp người dùng luyện cách thể hiện sự tự tin. Những ứng dụng như Netradyne (an toàn tài xế), Amazon Alexa và nền tảng chăm sóc sức khỏe Sully.ai đang trong quá trình tích hợp hướng đi này.

Dĩ nhiên, những lo ngại về đạo đức là có thật. Giám sát hành vi mà không có sự đồng ý, dùng AI để đánh giá nhân viên, hay tuyên bố AI có thể phát hiện nói dối đều là những lằn ranh cần được đặt ra rõ ràng. Ở châu Âu, Đạo luật AI của EU đã đặt ra một số giới hạn cho việc nhận diện cảm xúc tại nơi làm việc và trường học.

Điểm mấu chốt cuối cùng là thế này: AI không thể thay thế sự phán đoán của con người, và không nên được dùng để đưa ra quyết định tuyển dụng hay sa thải một mình. Nhưng nếu được xây dựng đúng cách, nó có thể giúp chúng ta nhìn thấy những gì đang bị bỏ qua, đặc biệt trong thời đại mà phần lớn các cuộc trò chuyện quan trọng đang diễn ra qua màn hình.
Thu thập tín hiệu thì AI đã giỏi. Hiểu tại sao, đó mới là phần khó.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL2FpLWhvYy1jYWNoLWRvYy12aS1jYW0teHVjLW5ndS1jYW5oLWxhLWNoaWEta2hvYS10aGF1LWhpZXUtY29uLW5ndW9pLjg1OTYxLw==
Top