A-Train The Seven
...'cause for once, I didn't hate myself.
Teleperformance SE, nhà điều hành trung tâm cuộc gọi lớn nhất thế giới, đang triển khai một hệ thống trí tuệ nhân tạo (AI) được thiết kế để làm mềm giọng của những nhân viên Ấn Độ nói tiếng Anh trong thời gian thực. Công ty tuyên bố công nghệ này sẽ nâng cao sự hiểu biết và hài lòng của khách hàng.
Phó Giám đốc điều hành Thomas Mackenbrock nói với Bloomberg: "Khi bạn có một nhân viên Ấn Độ trực điện thoại, đôi khi thật khó để nghe, để hiểu. [Công nghệ này có thể] trung hòa giọng của người nói Ấn Độ với độ trễ bằng không, [tạo ra] sự thân mật hơn, tăng sự hài lòng của khách hàng và giảm thời gian xử lý trung bình."
Công nghệ này phân tích đầu vào giọng nói và sửa đổi nó để phù hợp với giọng được chỉ định trong khi vẫn giữ được giọng nói và cảm xúc ban đầu của người nói. Hệ thống sử dụng nhận dạng giọng nói để thu giọng nói của người nói trong thời gian thực. Các thuật toán tiên tiến sau đó phiên âm các từ đã nói thành văn bản, có tính đến các giọng và kiểu phát âm khác nhau. Sau khi hệ thống phiên âm giọng nói, quá trình dịch giọng lõi sẽ phân tích giọng và các mẫu phát âm của người nói. Sau đó, nó áp dụng các mô hình AI được đào tạo trên các tập dữ liệu của các giọng khác nhau để sửa đổi giọng nói.
Trong quá trình chuyển đổi, phần mềm sửa đổi ngữ điệu, các mẫu trọng âm và cách phát âm âm vị để phù hợp với giọng mục tiêu. Hệ thống sử dụng công nghệ chuyển văn bản thành giọng nói (TTS) để tổng hợp mẫu âm vị và chuyển đổi văn bản thành giọng nói tổng hợp duy trì âm sắc, cảm xúc và danh tính ban đầu của người nói. Teleperformance đang triển khai công nghệ khử tiếng ồn xung quanh tại các trung tâm cuộc gọi ở Ấn Độ, cung cấp hỗ trợ khách hàng cho các khách hàng quốc tế. Khách hàng của hãng bao gồm các công ty công nghệ lớn như Apple, TikTok và Samsung Electronics.
Công nghệ này là một phần của chiến lược đầu tư AI lớn hơn của Teleperformance. Công ty có kế hoạch đầu tư tới 100 triệu euro (104 triệu USD) vào quan hệ đối tác AI vào năm 2025. Startup Sanas có trụ sở tại Palo Alto đã phát triển công nghệ giọng sau khoản đầu tư 13 triệu đô la của Teleperformance vào đầu năm nay.
Phần mềm này xuất hiện khi ngành công nghiệp trung tâm cuộc gọi phải đối mặt với những thách thức từ sự trỗi dậy của chatbot AI. Năm ngoái, Teleperformance đã trải qua một đợt sụt giảm đáng kể về giá cổ phiếu sau khi công ty công nghệ tài chính Thụy Điển Klarna Bank thông báo rằng trợ lý AI của họ đang thực hiện công việc tương đương với 700 nhân viên toàn thời gian. Để đối phó, Teleperformance đã tập trung vào việc sử dụng AI để nâng cao chứ không phải thay thế lực lượng lao động 490.000 nhân viên của mình.
Sanas tuyên bố rằng mục tiêu của họ là giảm "phân biệt đối xử dựa trên giọng nói". Tuy nhiên, mặc dù phần mềm có thể không thay thế trực tiếp người lao động, nhưng có những lo ngại về tác động tiềm tàng đối với các trung tâm cuộc gọi ở những nơi như Philippines, nơi đã xây dựng vị thế thị trường của mình trên những người nói tiếng Anh chất lượng cao. Hiện tại, phần mềm hỗ trợ giọng Ấn Độ và Philippines. Sanas đang phát triển các phiên bản cho các khu vực khác, bao gồm cả Mỹ Latinh. Mackenbrock nhấn mạnh rằng mặc dù AI sẽ có mặt ở khắp mọi nơi, "yếu tố con người sẽ vô cùng quan trọng" trong việc xây dựng các kết nối và nâng cao trải nghiệm của khách hàng.
Phó Giám đốc điều hành Thomas Mackenbrock nói với Bloomberg: "Khi bạn có một nhân viên Ấn Độ trực điện thoại, đôi khi thật khó để nghe, để hiểu. [Công nghệ này có thể] trung hòa giọng của người nói Ấn Độ với độ trễ bằng không, [tạo ra] sự thân mật hơn, tăng sự hài lòng của khách hàng và giảm thời gian xử lý trung bình."
Công nghệ này phân tích đầu vào giọng nói và sửa đổi nó để phù hợp với giọng được chỉ định trong khi vẫn giữ được giọng nói và cảm xúc ban đầu của người nói. Hệ thống sử dụng nhận dạng giọng nói để thu giọng nói của người nói trong thời gian thực. Các thuật toán tiên tiến sau đó phiên âm các từ đã nói thành văn bản, có tính đến các giọng và kiểu phát âm khác nhau. Sau khi hệ thống phiên âm giọng nói, quá trình dịch giọng lõi sẽ phân tích giọng và các mẫu phát âm của người nói. Sau đó, nó áp dụng các mô hình AI được đào tạo trên các tập dữ liệu của các giọng khác nhau để sửa đổi giọng nói.

Trong quá trình chuyển đổi, phần mềm sửa đổi ngữ điệu, các mẫu trọng âm và cách phát âm âm vị để phù hợp với giọng mục tiêu. Hệ thống sử dụng công nghệ chuyển văn bản thành giọng nói (TTS) để tổng hợp mẫu âm vị và chuyển đổi văn bản thành giọng nói tổng hợp duy trì âm sắc, cảm xúc và danh tính ban đầu của người nói. Teleperformance đang triển khai công nghệ khử tiếng ồn xung quanh tại các trung tâm cuộc gọi ở Ấn Độ, cung cấp hỗ trợ khách hàng cho các khách hàng quốc tế. Khách hàng của hãng bao gồm các công ty công nghệ lớn như Apple, TikTok và Samsung Electronics.
Công nghệ này là một phần của chiến lược đầu tư AI lớn hơn của Teleperformance. Công ty có kế hoạch đầu tư tới 100 triệu euro (104 triệu USD) vào quan hệ đối tác AI vào năm 2025. Startup Sanas có trụ sở tại Palo Alto đã phát triển công nghệ giọng sau khoản đầu tư 13 triệu đô la của Teleperformance vào đầu năm nay.

Phần mềm này xuất hiện khi ngành công nghiệp trung tâm cuộc gọi phải đối mặt với những thách thức từ sự trỗi dậy của chatbot AI. Năm ngoái, Teleperformance đã trải qua một đợt sụt giảm đáng kể về giá cổ phiếu sau khi công ty công nghệ tài chính Thụy Điển Klarna Bank thông báo rằng trợ lý AI của họ đang thực hiện công việc tương đương với 700 nhân viên toàn thời gian. Để đối phó, Teleperformance đã tập trung vào việc sử dụng AI để nâng cao chứ không phải thay thế lực lượng lao động 490.000 nhân viên của mình.
Sanas tuyên bố rằng mục tiêu của họ là giảm "phân biệt đối xử dựa trên giọng nói". Tuy nhiên, mặc dù phần mềm có thể không thay thế trực tiếp người lao động, nhưng có những lo ngại về tác động tiềm tàng đối với các trung tâm cuộc gọi ở những nơi như Philippines, nơi đã xây dựng vị thế thị trường của mình trên những người nói tiếng Anh chất lượng cao. Hiện tại, phần mềm hỗ trợ giọng Ấn Độ và Philippines. Sanas đang phát triển các phiên bản cho các khu vực khác, bao gồm cả Mỹ Latinh. Mackenbrock nhấn mạnh rằng mặc dù AI sẽ có mặt ở khắp mọi nơi, "yếu tố con người sẽ vô cùng quan trọng" trong việc xây dựng các kết nối và nâng cao trải nghiệm của khách hàng.