Sóng AI
Writer

Các nhà khoa học đã sử dụng mô hình ngôn ngữ lớn (LLM) là Whisper để phân tích hoạt động não bộ trong các cuộc trò chuyện thực tế, mang đến hiểu biết mới về cách não xử lý ngôn ngữ.
Nghiên cứu được công bố trên tạp chí Nature Human Behaviour ngày 7/3, bao gồm 4 bệnh nhân động kinh đã được cấy điện cực theo dõi não cho mục đích lâm sàng.
Các nhà nghiên cứu đã ghi lại hơn 100 giờ âm thanh cuộc trò chuyện của bệnh nhân trong thời gian nằm viện, với mỗi người được cấy từ 104 đến 255 điện cực.
Mô hình Whisper không được lập trình sẵn các đặc điểm cấu trúc ngôn ngữ như âm vị (phoneme) hay các thành phần của lời nói, mà chỉ được huấn luyện để chuyển đổi file âm thanh thành văn bản.
Khi phân tích, các nhà nghiên cứu phát hiện mô hình vẫn tự động hình thành các cấu trúc ngôn ngữ mà không cần được lập trình trước.
Nghiên cứu cho thấy các vùng não cụ thể có xu hướng liên quan đến một số nhiệm vụ ngôn ngữ, ví dụ như vùng hồi thái dương trên (superior temporal gyrus) hoạt động mạnh hơn khi xử lý thông tin âm thanh.
Các khu vực não bộ hoạt động theo trình tự: vùng chịu trách nhiệm nghe từ được kích hoạt trước vùng chịu trách nhiệm giải thích nghĩa của từ.
Nghiên cứu cũng phát hiện nhiều vùng não được kích hoạt trong các hoạt động không phải chuyên môn của chúng, ủng hộ mô hình "phân tán" trong xử lý ngôn ngữ.
Mô hình AI có thể dự đoán chính xác hoạt động não bộ sẽ diễn ra trong các cuộc trò chuyện mới, với độ chính xác cao hơn các mô hình truyền thống dựa trên đặc điểm cấu trúc ngôn ngữ.
Tác giả chính Ariel Goldstein, giáo sư tại Đại học Hebrew ở Jerusalem, cho rằng nghiên cứu giúp hiểu cách nhận thức con người hoạt động thông qua lăng kính thống kê.
Các chuyên gia không tham gia nghiên cứu như Leonhard Schilbach đánh giá đây là "nghiên cứu đột phá" vì chứng minh mối liên hệ giữa mô hình tính toán và chức năng não bộ.
Gašper Beguš từ Đại học California, Berkeley nhận xét việc so sánh não bộ với mạng thần kinh nhân tạo có thể giúp thực hiện các thí nghiệm và mô phỏng không thể thực hiện trên não sinh học.
Công nghệ này có thể được ứng dụng trong tương lai để cải thiện các công nghệ nhận diện giọng nói hoặc hỗ trợ giao tiếp cho người khuyết tật.

Nguồn: Songai.vn