Tai nghe AI này cho phép bạn nghe giọng nói của chỉ một người giữa đám đông

Sasha · 31/05/2024

Bạn đã bao giờ ở trong một căn phòng đông đúc, nhiều người nói chuyện cùng lúc, và bạn phải vất vả lắm mới nghe được người mình cần? Nhóm nghiên cứu tại Đại học Washington (UW) đã phát triển một công nghệ AI hứa hẹn sẽ giải quyết vấn đề này.

Theo thông cáo báo chí của UW, hệ thống AI này cho phép người đeo tai nghe thông thường có thể tập trung nghe một người nói cụ thể trong đám đông. Để "ghi danh" giọng nói của người đó, bạn chỉ cần nhìn vào họ trong 3-5 giây. Hệ thống có tên "Target Speech Hearing" (tạm dịch: Nghe Giọng Nói Mục Tiêu) sẽ lọc bỏ tất cả các tạp âm và giọng nói khác, chỉ để bạn nghe thấy giọng nói đã chọn. Thậm chí, bạn có thể di chuyển ra xa người nói mà vẫn nghe rõ ràng.

Hệ thống hoạt động như thế nào?

Bạn chỉ cần đeo bất kỳ tai nghe nào có micrô kép và nhấn nút trong khi nhìn vào người đang nói. Sóng âm thanh từ giọng nói của người đó sẽ được thu bởi cả hai micrô trên tai nghe. Tín hiệu sau đó được gửi đến bộ xử lý tích hợp AI, nơi nó sẽ học các mẫu giọng nói của người đó. Hệ thống sau đó sẽ tách giọng nói đó và phát lại cho bạn. Người đó càng nói lâu, hệ thống càng học hỏi và bổ sung thêm dữ liệu huấn luyện.

Hiện tại, một số tai nghe và tai nghe nhét tai đã có tính năng khử tiếng ồn và các tùy chọn khác giúp bạn nghe rõ âm thanh cụ thể hơn. Ví dụ, AirPods Pro của Apple có chế độ kiểm soát tiếng ồn, cho phép bạn giảm âm thanh xung quanh để tập trung vào âm thanh từ tai nghe. Tuy nhiên, hệ thống của UW hứa hẹn sẽ nâng cao khả năng này lên một tầm cao mới, đặc biệt là nó được thiết kế để hoạt động với mọi loại tai nghe.

"Chúng ta thường nghĩ AI là chatbot trả lời câu hỏi trên web", Shyam Gollakota, giáo sư UW và là tác giả chính của nghiên cứu, cho biết. "Nhưng trong dự án này, chúng tôi phát triển AI để điều chỉnh nhận thức thính giác của bất kỳ ai đeo tai nghe, dựa trên sở thích của họ. Với thiết bị của chúng tôi, giờ đây bạn có thể nghe rõ ràng một người nói, ngay cả khi bạn đang ở trong môi trường ồn ào với rất nhiều người khác đang nói chuyện".

Nhóm nghiên cứu đã thử nghiệm hệ thống trên 21 người khác nhau và kết quả cho thấy độ rõ ràng của giọng nói được chọn gần như gấp đôi so với âm thanh chưa được lọc.

Tuy nhiên, hệ thống vẫn còn một số hạn chế.

Hiện tại, bạn chỉ có thể "ghi danh" một giọng nói tại một thời điểm và chỉ khi không có giọng nói lớn khác phát ra từ cùng một vị trí. Hơn nữa, hệ thống mới chỉ hoạt động với tai nghe, mặc dù nhóm nghiên cứu đang nghiên cứu để hỗ trợ tai nghe nhét tai và máy trợ thính. Cuối cùng, hệ thống vẫn chưa được thương mại hóa. Nhóm nghiên cứu đã công bố mã nguồn của thiết bị để các nhà phát triển khác có thể nghiên cứu và sử dụng.

Tìm kiếm

Có thể bạn quan tâm

Tai nghe AI này cho phép bạn nghe giọng nói của chỉ một người giữa đám đông

Sasha

Moderator

Sasha

Ông lớn Hollywood cho phép công ty AI khai thác dữ liệu, muốn dùng AI tạo sinh sản xuất phim

Người dùng Apple tại Việt Nam chú ý: Apple Intelligence vừa có 1 thông báo quan trọng

OpenAI thừa nhận lỗi chatbot ChatGPT tự ý nhắn tin "tâm sự" với người dùng

Google sẽ đánh dấu triệt để những hình ảnh tạo ra bởi AI

Học dốt thì làm nghề gì? Những công việc phù hợp với người có học lực kém

NASA đã làm gì để cứu con tàu Voyager 1 cách Trái Đất 24,6 tỷ km

Tiết lộ nguyên nhân AMD bị các hãng laptop tẩy chay, hóa ra cũng chẳng "liêm khiết" lắm đâu!

Mỹ xuất khẩu thịt lợn lớn thứ 3 thế giới nhưng dân Mỹ lại không thích ăn thịt lợn

Cáp quang biển: chiến trường so kè mới giữa Mỹ và Trung Quốc

Khai quốc công thần, tận trung báo quốc, nhưng Nguyễn Trãi đã bị triều đình Hậu Lê bạc đãi ra sao?

Lắp trạm phát sóng di động tại bản mới của Làng Nủ

FBI tố hacker Iran tìm cách can thiệp bầu cử Mỹ, gửi thông tin tranh cử ông Trump cho Biden

Trải nghiệm Huawei MatePad SE 11: máy tính bảng hợp với gia đình, giá chỉ hơn 5 triệu đồng có màn hình lớn 11 inch, vỏ kim loại nguyên khối

Cách tắt online Liên Quân và ẩn thông tin lịch sử đấu cho "người hướng nội"

Đánh giá nổi bật