VNR Content
Pearl
Việc lạm dụng công nghệ nhận dạng khuôn mặt bị dư luận phản đối buộc Facebook phải ngừng hoạt động hệ thống nhận dạng khuôn mặt vào tháng 11 năm ngoái.
Cách đây vài ngày, một gã khổng lồ công nghệ khác đã dừng dự án công nghệ trí tuệ nhân tạo thu thập thông tin sinh trắc học của người dùng.
Microsoft thông báo sẽ dừng công nghệ nhận dạng khuôn mặt có thể suy ra cảm xúc cũng như các đặc điểm như tuổi tác, giới tính và tóc của mỗi người. Microsoft cho biết AI đã đặt ra các câu hỏi về quyền riêng tư, phân biệt đối xử và các hành vi lạm dụng khác. Cũng không có sự nhất trí rõ ràng về định nghĩa của cảm xúc và không có cách nào để tạo ra mối liên hệ tổng quát giữa các biểu hiện và cảm xúc.
Người dùng mới của khung lập trình Face Microsoft không còn có quyền truy cập vào các tính năng phát hiện thuộc tính này. Khách hàng hiện tại có thể sử dụng chúng cho đến ngày 30/6/2023. Microsoft vẫn sẽ đưa công nghệ này vào các công cụ hỗ trợ tiếp cận "có kiểm soát", chẳng hạn như Ứng dụng AI cho những người có vấn đề về thị lực.
Có thông tin cho rằng công nghệ nhận dạng cảm xúc AI của Microsoft có thể suy ra trạng thái cảm xúc, giới tính, tuổi tác, tâm trạng và các thuộc tính cá nhân khác của đối tượng, có nghĩa là nó thậm chí đã đạt được "khả năng quan sát". Trên thực tế, theo tờ "Guardian" của Anh đưa tin năm 2019, AI để diễn giải cảm xúc của con người đã trở thành một ngành công nghiệp trị giá 20 tỷ USD. Sử dụng AI để phân tích tâm lý và dự đoán hành vi của người tiêu dùng, hoặc sử dụng AI để phân tích sức khỏe tâm thần của bệnh nhân và các kịch bản ứng dụng khác từng bước được triển khai.
Tuy nhiên, tại sao Microsoft lại chủ động chọn từ bỏ một công nghệ đầy hứa hẹn như vậy? Điều này thực sự là do trong thực tiễn nhận dạng cảm xúc của AI, cả từ góc độ kỹ thuật và góc độ đạo đức, đều có những sai sót không thể bỏ qua, vì vậy tạm gác nó là giải pháp tốt nhất vào lúc này.
Trên thực tế, AI có thể "nhìn thấy" dựa trên thị giác máy tính và nhận dạng nét mặt (FER). Trong số đó, công nghệ thị giác máy tính cho phép máy móc nhận dạng chính xác thông tin trên khuôn mặt của con người, đây cũng là cơ sở kỹ thuật để thực hiện nhận dạng khuôn mặt; và nhận dạng nét mặt được sử dụng để phân tích và giải thích những cảm xúc có trong các nét mặt mà máy móc đọc được.
Vậy làm thế nào AI đọc được cảm xúc của con người, biết được con người và trái tim của họ? Tôi tin rằng nhiều người bạn của tôi đã nghe đến thuật ngữ "biểu hiện vi mô", và nó được mô tả trên Internet như một công nghệ cho phép "đọc được suy nghĩ".
Được biết, nhà tâm lý học Paul Ekman đã thành lập Hệ thống mã hóa biểu hiện trên khuôn mặt (FACS) dựa trên giải phẫu học vào đầu năm 1976. Theo cơ mặt của con người, hệ thống chia khuôn mặt người thành khoảng 46 đơn vị vận động (AU) vừa độc lập vừa kết nối với nhau, đồng thời phân tích đặc điểm chuyển động của các đơn vị vận động này và các khu vực chính mà chúng kiểm soát.
Ví dụ, khi tức giận, người ta thường cau mày, mí mắt căng thẳng, lỗ mũi giãn ra, khi sợ hãi thì đồng tử giãn ra, nhướng mày và há to miệng... Đồng thời, các nhà tâm lý học như Paul Ekman và Darwin tin rằng con người có sáu hệ thống cảm xúc cơ bản bẩm sinh, đó là sợ hãi, buồn bã, tức giận, thích thú, ngạc nhiên và ghê tởm. Những cảm xúc phức tạp hơn bắt nguồn từ những cảm xúc cơ bản này. Công nghệ nhận dạng cảm xúc sử dụng các biểu cảm và chuyển động cơ mặt tương ứng với các cảm xúc khác nhau làm chất liệu, đồng thời đào tạo và học hỏi máy bằng cách gắn nhãn các nhãn cảm xúc tương ứng với các biểu hiện.
Nói tóm lại, thông qua công nghệ thị giác máy tính, AI có thể nhận ra chuyển động của cơ mặt con người, sau đó dựa trên hệ thống mã hóa biểu cảm khuôn mặt và mô hình cảm xúc cơ bản, để cho AI biết loại cảm xúc nào được phản ánh trong bức ảnh và theo thời gian AI có thể biết cảm xúc mà con người tạo ra biểu hiện tương ứng. Trong khi lý thuyết có vẻ tự nhất quán, điều gì sẽ xảy ra nếu có vấn đề với chính lý thuyết hệ thống cảm xúc cơ bản?
Trên thực tế, tính nhất quán giữa các hệ thống cảm xúc cơ bản luôn là trọng tâm của các cuộc tranh luận học thuật, và luôn có sự phản đối lý thuyết cảm xúc này nếu bỏ qua các yếu tố nền tảng, văn hóa và xã hội. Hiệp hội Khoa học Tâm lý Hoa Kỳ đã ủy nhiệm cho 5 nhà khoa học từ các lý thuyết khác nhau về khoa học cảm xúc tiến hành thu thập dữ liệu và các bằng chứng khoa học để chứng minh mối quan hệ giữa biểu hiện và cảm xúc. Kết quả của bài báo cuối cùng là cảm xúc được thể hiện theo nhiều cách khác nhau, rất khó để suy ra một cách đáng tin cậy cảm xúc của một người từ một tập hợp các chuyển động đơn giản trên khuôn mặt, tức là không có cơ sở khoa học đáng tin cậy giữa biểu hiện và cảm xúc, chứng minh rằng cả hai có liên quan trực tiếp.
Lisa Feldman Barrett, giáo sư tâm lý học tại Đại học Northeastern, người tham gia dự án cho biết “Họ (những người khổng lồ công nghệ) có thể phát hiện ra khuôn mặt giận dữ, nhưng điều này không giống như phát hiện cảm xúc tức giận”. Trên thực tế, lý do tại sao lý thuyết hệ thống cảm xúc cơ bản được lĩnh vực trí tuệ nhân tạo chấp nhận là nó phù hợp với phạm vi khả năng của máy học.
Nếu công nghệ chỉ còn non nớt thì không sao, hiện nay công chúng ngày càng chú ý đến quyền riêng tư cá nhân. AI nhận diện cảm xúc, một công nghệ không chỉ là vấn đề kỹ thuật mà còn liên quan mật thiết đến quyền riêng tư cá nhân, có khơi dậy thần kinh của nhiều người. Sau tất cả, mọi người đều đã rất cảnh giác về tính năng nhận dạng khuôn mặt, và những cảm xúc đương nhiên mang tính cá nhân hơn, không thể bị đánh giá một cách tùy tiện bởi những gã khổng lồ công nghệ.
Trước khi phổ cập máy học trên quy mô lớn, công nghệ thuật toán truyền thống chỉ giới hạn ở sự biểu đạt của con người, nhưng thuật toán hiện tại đã vượt qua giới hạn về biểu hiện của con người. Điều này đã mang lại một bước nhảy vọt về hiệu quả, các thuật toán bắt chước cách suy nghĩ của con người nhưng chúng không thể bắt chước tính tự chủ về đạo đức của con người. Trong quá trình thực hiện thuật toán, việc theo đuổi logic đạo đức và tính hợp lý giá trị của con người bị loại trừ.
Vì vậy, đây là lý do tại sao ngày càng nhiều người có cái nhìn tiêu cực về công nghệ và tin rằng công nghệ đang dần trở thành "xấu xa".
Cách đây vài ngày, một gã khổng lồ công nghệ khác đã dừng dự án công nghệ trí tuệ nhân tạo thu thập thông tin sinh trắc học của người dùng.
Microsoft thông báo sẽ dừng công nghệ nhận dạng khuôn mặt có thể suy ra cảm xúc cũng như các đặc điểm như tuổi tác, giới tính và tóc của mỗi người. Microsoft cho biết AI đã đặt ra các câu hỏi về quyền riêng tư, phân biệt đối xử và các hành vi lạm dụng khác. Cũng không có sự nhất trí rõ ràng về định nghĩa của cảm xúc và không có cách nào để tạo ra mối liên hệ tổng quát giữa các biểu hiện và cảm xúc.
Người dùng mới của khung lập trình Face Microsoft không còn có quyền truy cập vào các tính năng phát hiện thuộc tính này. Khách hàng hiện tại có thể sử dụng chúng cho đến ngày 30/6/2023. Microsoft vẫn sẽ đưa công nghệ này vào các công cụ hỗ trợ tiếp cận "có kiểm soát", chẳng hạn như Ứng dụng AI cho những người có vấn đề về thị lực.
Tuy nhiên, tại sao Microsoft lại chủ động chọn từ bỏ một công nghệ đầy hứa hẹn như vậy? Điều này thực sự là do trong thực tiễn nhận dạng cảm xúc của AI, cả từ góc độ kỹ thuật và góc độ đạo đức, đều có những sai sót không thể bỏ qua, vì vậy tạm gác nó là giải pháp tốt nhất vào lúc này.
Trên thực tế, AI có thể "nhìn thấy" dựa trên thị giác máy tính và nhận dạng nét mặt (FER). Trong số đó, công nghệ thị giác máy tính cho phép máy móc nhận dạng chính xác thông tin trên khuôn mặt của con người, đây cũng là cơ sở kỹ thuật để thực hiện nhận dạng khuôn mặt; và nhận dạng nét mặt được sử dụng để phân tích và giải thích những cảm xúc có trong các nét mặt mà máy móc đọc được.
Vậy làm thế nào AI đọc được cảm xúc của con người, biết được con người và trái tim của họ? Tôi tin rằng nhiều người bạn của tôi đã nghe đến thuật ngữ "biểu hiện vi mô", và nó được mô tả trên Internet như một công nghệ cho phép "đọc được suy nghĩ".
Được biết, nhà tâm lý học Paul Ekman đã thành lập Hệ thống mã hóa biểu hiện trên khuôn mặt (FACS) dựa trên giải phẫu học vào đầu năm 1976. Theo cơ mặt của con người, hệ thống chia khuôn mặt người thành khoảng 46 đơn vị vận động (AU) vừa độc lập vừa kết nối với nhau, đồng thời phân tích đặc điểm chuyển động của các đơn vị vận động này và các khu vực chính mà chúng kiểm soát.
Ví dụ, khi tức giận, người ta thường cau mày, mí mắt căng thẳng, lỗ mũi giãn ra, khi sợ hãi thì đồng tử giãn ra, nhướng mày và há to miệng... Đồng thời, các nhà tâm lý học như Paul Ekman và Darwin tin rằng con người có sáu hệ thống cảm xúc cơ bản bẩm sinh, đó là sợ hãi, buồn bã, tức giận, thích thú, ngạc nhiên và ghê tởm. Những cảm xúc phức tạp hơn bắt nguồn từ những cảm xúc cơ bản này. Công nghệ nhận dạng cảm xúc sử dụng các biểu cảm và chuyển động cơ mặt tương ứng với các cảm xúc khác nhau làm chất liệu, đồng thời đào tạo và học hỏi máy bằng cách gắn nhãn các nhãn cảm xúc tương ứng với các biểu hiện.
Trên thực tế, tính nhất quán giữa các hệ thống cảm xúc cơ bản luôn là trọng tâm của các cuộc tranh luận học thuật, và luôn có sự phản đối lý thuyết cảm xúc này nếu bỏ qua các yếu tố nền tảng, văn hóa và xã hội. Hiệp hội Khoa học Tâm lý Hoa Kỳ đã ủy nhiệm cho 5 nhà khoa học từ các lý thuyết khác nhau về khoa học cảm xúc tiến hành thu thập dữ liệu và các bằng chứng khoa học để chứng minh mối quan hệ giữa biểu hiện và cảm xúc. Kết quả của bài báo cuối cùng là cảm xúc được thể hiện theo nhiều cách khác nhau, rất khó để suy ra một cách đáng tin cậy cảm xúc của một người từ một tập hợp các chuyển động đơn giản trên khuôn mặt, tức là không có cơ sở khoa học đáng tin cậy giữa biểu hiện và cảm xúc, chứng minh rằng cả hai có liên quan trực tiếp.
Lisa Feldman Barrett, giáo sư tâm lý học tại Đại học Northeastern, người tham gia dự án cho biết “Họ (những người khổng lồ công nghệ) có thể phát hiện ra khuôn mặt giận dữ, nhưng điều này không giống như phát hiện cảm xúc tức giận”. Trên thực tế, lý do tại sao lý thuyết hệ thống cảm xúc cơ bản được lĩnh vực trí tuệ nhân tạo chấp nhận là nó phù hợp với phạm vi khả năng của máy học.
Trước khi phổ cập máy học trên quy mô lớn, công nghệ thuật toán truyền thống chỉ giới hạn ở sự biểu đạt của con người, nhưng thuật toán hiện tại đã vượt qua giới hạn về biểu hiện của con người. Điều này đã mang lại một bước nhảy vọt về hiệu quả, các thuật toán bắt chước cách suy nghĩ của con người nhưng chúng không thể bắt chước tính tự chủ về đạo đức của con người. Trong quá trình thực hiện thuật toán, việc theo đuổi logic đạo đức và tính hợp lý giá trị của con người bị loại trừ.
Vì vậy, đây là lý do tại sao ngày càng nhiều người có cái nhìn tiêu cực về công nghệ và tin rằng công nghệ đang dần trở thành "xấu xa".