Spotify đang sử dụng AI để dịch podcast sang các ngôn ngữ khác bằng giọng nói của chính họ

Thoại Viết Hoàng · 30/05/2022

Bạn đã bao giờ tự hỏi podcast yêu thích của mình sẽ như thế nào bằng tiếng Trung hoặc tiếng Tây Ban Nha chưa? Chà, Spotify đang thử nghiệm một tính năng mới được hỗ trợ bởi AI sẽ thực hiện chính xác điều đó.

You.com phát hành YouAgent: Một tác nhân AI có khả năng thực thi mã để có câu trả lời chính xác hơn cho các câu hỏi toán học và khoa học phức tạp

Spotify đang sử dụng AI để dịch podcast sang các ngôn ngữ khác bằng giọng nói của chính họ

Dịch giọng nói là một tính năng mới được triển khai hôm nay (25 tháng 9) cho phép bạn nghe một số tập podcast nhất định bằng một ngôn ngữ khác, nhưng ít nhất là bằng giọng nói của chính người nói… hoặc ít nhất là bản fax của ngôn ngữ đó.
Công cụ này do Spotify phát triển với sự trợ giúp của hệ thống Whisper nhận dạng giọng nói tự động (ASR) của OpenAI, sử dụng mô hình AI tạo giọng nói thành văn bản để dịch các tệp âm thanh và mô hình sao chép giọng nói để phù hợp với phong cách của người nói ban đầu.
Những người thuyết trình đầu tiên tham gia tính năng mới này bao gồm Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons và Steven Bartlett. Tuy nhiên, không phải mọi tập podcast tương ứng của họ đều có sẵn bằng nhiều ngôn ngữ. Thay vào đó, hãy theo dõi tập 'Phỏng vấn Yuval Noah Harari' trên Lex Fridman Podcast, 'Kristen Bell, nhờ ơn Chúa, trở lại' trên Chuyên gia về ghế bành và 'Phỏng vấn bác sĩ Mindy Pelz' trên Nhật ký của một Giám đốc điều hành với Steven Bartlett, tất cả đều có sẵn bằng tiếng Tây Ban Nha.
Spotify cho biết sẽ có nhiều tập hơn trong những ngày và tuần tới, với bản dịch tiếng Pháp và tiếng Đức sẽ ra mắt tiếp theo. Bạn sẽ có thể tìm thấy những tập này trong Chế độ xem hiện đang phát trên ứng dụng dành cho thiết bị di động hoặc máy tính để bàn của bạn, với nhiều tập được dịch bằng giọng nói hơn sẽ được thêm vào trung tâm Dịch giọng nói chuyên dụng.
Ý kiến: sử dụng AI thông minh hơn
Các dịch vụ phát nhạc trực tuyến tốt nhất đã nhanh chóng tham gia vào cơn sốt vàng AI rộng lớn sau sự cường điệu xung quanh ChatGPT của OpenAI. Mặc dù họ đã sử dụng công nghệ máy học để xác định các mô hình và xu hướng trong thói quen nghe nhạc của bạn nhằm đề xuất các bài hát mới tốt hơn (hãy nghĩ đến: danh sách phát Discover Weekly của bạn), nhưng công nghệ này đang được triển khai theo một số cách mới.
DJ AI của Spotify, sử dụng giọng nói do AI tạo ra để giới thiệu các bản nhạc mới, chỉ là một trong số đó. Ngoài ra còn có thỏa thuận của Universal Music với Endel để tạo ra âm thanh xung quanh như tiếng ồn trong rừng và tiếng nước chảy bằng AI, cũng như vô số trình tạo nhạc, bao gồm cả những công cụ như Meta và Google. Nhưng chắc chắn điều đáng sợ nhất là ý tưởng sử dụng AI tổng hợp để tạo podcast từ đầu.
Một số podcast AI tổng hợp đã xuất hiện sau quá trình thử nghiệm trong khu vực, bao gồm Trải nghiệm AI của Joe Rogan và Bản tóm tắt tin tức về hacker để kể tên một số. Bên cạnh những lo ngại về bản quyền và quyền riêng tư, phản ứng dữ dội nhất đối với những điều này là việc thiếu một cuộc trò chuyện sôi nổi, nền tảng để xây dựng các podcast tốt nhất.
Rất có thể đó là lý do tại sao chúng không thực sự thành công, nhưng ý tưởng sử dụng AI tổng hợp để dịch podcast chính xác là loại trường hợp sử dụng mà tôi có thể áp dụng. Xét cho cùng, máy học là một công cụ, vì vậy, việc thấy nó được sử dụng để cung cấp các chương trình thú vị được phổ biến rộng rãi hơn là một công dụng tuyệt vời, giả sử tốc độ và sự sống động của cuộc trò chuyện thực sự có tác dụng. Bây giờ tôi cần tìm tất cả các podcast tiếng nước ngoài mà tôi đã bỏ lỡ và tải chúng bằng tiếng Anh
Tham khảo bài viết gốc tại đây:

Tìm kiếm

Có thể bạn quan tâm

Spotify đang sử dụng AI để dịch podcast sang các ngôn ngữ khác bằng giọng nói của chính họ

Thoại Viết Hoàng

Writer

Thoại Viết Hoàng

Người dùng Apple tại Việt Nam chú ý: Apple Intelligence vừa có 1 thông báo quan trọng

OpenAI thừa nhận lỗi chatbot ChatGPT tự ý nhắn tin "tâm sự" với người dùng

Google sẽ đánh dấu triệt để những hình ảnh tạo ra bởi AI

Đáng lo ngại: không chỉ có trình độ ngang Tiến sĩ, mô hình AI của OpenAI còn biết "nói dối" có chủ đích

Học dốt thì làm nghề gì? Những công việc phù hợp với người có học lực kém

Cách tắt online Liên Quân và ẩn thông tin lịch sử đấu cho "người hướng nội"

Chi tiết những khác biệt giữa iPhone 16, 16 Plus, 16 Pro và 16 Pro Max, nên chọn máy nào?

Cuộc cách mạng xe điện của Trung Quốc gặp khó ở vùng nông thôn

Chiến lược mới của Canon để đánh chiếm thị trường Trung Quốc, biến camera mirrorless thành mũi nhọn

"Inside Out 2": thắng lợi cay đắng của xưởng phim Pixar, bộ mặt thật giả dối và bạc bẽo của Disney

Keysight ra mắt giải pháp kiểm tra hàn nối dây dẫn trong sản xuất bán dẫn

Miley Cyrus và Sony bị kiện vì sao chép "When I Was Your Man" của Bruno Mars

Lỗ đen siêu lớn thực sự có luồng tia trải dài 23 triệu năm ánh sáng, lớn nhất từng thấy

Chưa hết bàng hoàng vì nổ máy nhắn tin, Hezbollah lại hứng chịu loạt vụ nổ bộ đàm từ xa, ít nhất 20 người tử vong

Đánh giá nổi bật