Spotify đang sử dụng AI để dịch podcast sang các ngôn ngữ khác bằng giọng nói của chính họ

Bạn đã bao giờ tự hỏi podcast yêu thích của mình sẽ như thế nào bằng tiếng Trung hoặc tiếng Tây Ban Nha chưa? Chà, Spotify đang thử nghiệm một tính năng mới được hỗ trợ bởi AI sẽ thực hiện chính xác điều đó.
Spotify đang sử dụng AI để dịch podcast sang các ngôn ngữ khác bằng giọng nói của chính họ
Dịch giọng nói là một tính năng mới được triển khai hôm nay (25 tháng 9) cho phép bạn nghe một số tập podcast nhất định bằng một ngôn ngữ khác, nhưng ít nhất là bằng giọng nói của chính người nói… hoặc ít nhất là bản fax của ngôn ngữ đó.
Công cụ này do Spotify phát triển với sự trợ giúp của hệ thống Whisper nhận dạng giọng nói tự động (ASR) của OpenAI, sử dụng mô hình AI tạo giọng nói thành văn bản để dịch các tệp âm thanh và mô hình sao chép giọng nói để phù hợp với phong cách của người nói ban đầu.
Những người thuyết trình đầu tiên tham gia tính năng mới này bao gồm Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons và Steven Bartlett. Tuy nhiên, không phải mọi tập podcast tương ứng của họ đều có sẵn bằng nhiều ngôn ngữ. Thay vào đó, hãy theo dõi tập 'Phỏng vấn Yuval Noah Harari' trên Lex Fridman Podcast, 'Kristen Bell, nhờ ơn Chúa, trở lại' trên Chuyên gia về ghế bành và 'Phỏng vấn bác sĩ Mindy Pelz' trên Nhật ký của một Giám đốc điều hành với Steven Bartlett, tất cả đều có sẵn bằng tiếng Tây Ban Nha.
Spotify cho biết sẽ có nhiều tập hơn trong những ngày và tuần tới, với bản dịch tiếng Pháp và tiếng Đức sẽ ra mắt tiếp theo. Bạn sẽ có thể tìm thấy những tập này trong Chế độ xem hiện đang phát trên ứng dụng dành cho thiết bị di động hoặc máy tính để bàn của bạn, với nhiều tập được dịch bằng giọng nói hơn sẽ được thêm vào trung tâm Dịch giọng nói chuyên dụng.
Ý kiến: sử dụng AI thông minh hơn
Các dịch vụ phát nhạc trực tuyến tốt nhất đã nhanh chóng tham gia vào cơn sốt vàng AI rộng lớn sau sự cường điệu xung quanh ChatGPT của OpenAI. Mặc dù họ đã sử dụng công nghệ máy học để xác định các mô hình và xu hướng trong thói quen nghe nhạc của bạn nhằm đề xuất các bài hát mới tốt hơn (hãy nghĩ đến: danh sách phát Discover Weekly của bạn), nhưng công nghệ này đang được triển khai theo một số cách mới.
DJ AI của Spotify, sử dụng giọng nói do AI tạo ra để giới thiệu các bản nhạc mới, chỉ là một trong số đó. Ngoài ra còn có thỏa thuận của Universal Music với Endel để tạo ra âm thanh xung quanh như tiếng ồn trong rừng và tiếng nước chảy bằng AI, cũng như vô số trình tạo nhạc, bao gồm cả những công cụ như Meta và Google. Nhưng chắc chắn điều đáng sợ nhất là ý tưởng sử dụng AI tổng hợp để tạo podcast từ đầu.
Một số podcast AI tổng hợp đã xuất hiện sau quá trình thử nghiệm trong khu vực, bao gồm Trải nghiệm AI của Joe Rogan và Bản tóm tắt tin tức về hacker để kể tên một số. Bên cạnh những lo ngại về bản quyền và quyền riêng tư, phản ứng dữ dội nhất đối với những điều này là việc thiếu một cuộc trò chuyện sôi nổi, nền tảng để xây dựng các podcast tốt nhất.
Rất có thể đó là lý do tại sao chúng không thực sự thành công, nhưng ý tưởng sử dụng AI tổng hợp để dịch podcast chính xác là loại trường hợp sử dụng mà tôi có thể áp dụng. Xét cho cùng, máy học là một công cụ, vì vậy, việc thấy nó được sử dụng để cung cấp các chương trình thú vị được phổ biến rộng rãi hơn là một công dụng tuyệt vời, giả sử tốc độ và sự sống động của cuộc trò chuyện thực sự có tác dụng. Bây giờ tôi cần tìm tất cả các podcast tiếng nước ngoài mà tôi đã bỏ lỡ và tải chúng bằng tiếng Anh
Tham khảo bài viết gốc tại đây:
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top