Tai nghe AI này cho phép bạn nghe giọng nói của chỉ một người giữa đám đông

Sasha

Moderator
Bạn đã bao giờ ở trong một căn phòng đông đúc, nhiều người nói chuyện cùng lúc, và bạn phải vất vả lắm mới nghe được người mình cần? Nhóm nghiên cứu tại Đại học Washington (UW) đã phát triển một công nghệ AI hứa hẹn sẽ giải quyết vấn đề này.

Theo thông cáo báo chí của UW, hệ thống AI này cho phép người đeo tai nghe thông thường có thể tập trung nghe một người nói cụ thể trong đám đông. Để "ghi danh" giọng nói của người đó, bạn chỉ cần nhìn vào họ trong 3-5 giây. Hệ thống có tên "Target Speech Hearing" (tạm dịch: Nghe Giọng Nói Mục Tiêu) sẽ lọc bỏ tất cả các tạp âm và giọng nói khác, chỉ để bạn nghe thấy giọng nói đã chọn. Thậm chí, bạn có thể di chuyển ra xa người nói mà vẫn nghe rõ ràng.

1717124063444.png


Hệ thống hoạt động như thế nào?

Bạn chỉ cần đeo bất kỳ tai nghe nào có micrô kép và nhấn nút trong khi nhìn vào người đang nói. Sóng âm thanh từ giọng nói của người đó sẽ được thu bởi cả hai micrô trên tai nghe. Tín hiệu sau đó được gửi đến bộ xử lý tích hợp AI, nơi nó sẽ học các mẫu giọng nói của người đó. Hệ thống sau đó sẽ tách giọng nói đó và phát lại cho bạn. Người đó càng nói lâu, hệ thống càng học hỏi và bổ sung thêm dữ liệu huấn luyện.

Hiện tại, một số tai nghe và tai nghe nhét tai đã có tính năng khử tiếng ồn và các tùy chọn khác giúp bạn nghe rõ âm thanh cụ thể hơn. Ví dụ, AirPods Pro của Apple có chế độ kiểm soát tiếng ồn, cho phép bạn giảm âm thanh xung quanh để tập trung vào âm thanh từ tai nghe. Tuy nhiên, hệ thống của UW hứa hẹn sẽ nâng cao khả năng này lên một tầm cao mới, đặc biệt là nó được thiết kế để hoạt động với mọi loại tai nghe.

"Chúng ta thường nghĩ AI là chatbot trả lời câu hỏi trên web", Shyam Gollakota, giáo sư UW và là tác giả chính của nghiên cứu, cho biết. "Nhưng trong dự án này, chúng tôi phát triển AI để điều chỉnh nhận thức thính giác của bất kỳ ai đeo tai nghe, dựa trên sở thích của họ. Với thiết bị của chúng tôi, giờ đây bạn có thể nghe rõ ràng một người nói, ngay cả khi bạn đang ở trong môi trường ồn ào với rất nhiều người khác đang nói chuyện".

Nhóm nghiên cứu đã thử nghiệm hệ thống trên 21 người khác nhau và kết quả cho thấy độ rõ ràng của giọng nói được chọn gần như gấp đôi so với âm thanh chưa được lọc.

Tuy nhiên, hệ thống vẫn còn một số hạn chế.

Hiện tại, bạn chỉ có thể "ghi danh" một giọng nói tại một thời điểm và chỉ khi không có giọng nói lớn khác phát ra từ cùng một vị trí. Hơn nữa, hệ thống mới chỉ hoạt động với tai nghe, mặc dù nhóm nghiên cứu đang nghiên cứu để hỗ trợ tai nghe nhét tai và máy trợ thính. Cuối cùng, hệ thống vẫn chưa được thương mại hóa. Nhóm nghiên cứu đã công bố mã nguồn của thiết bị để các nhà phát triển khác có thể nghiên cứu và sử dụng.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top