FPT ra mắt công nghệ giọng máy AceSound tự nhiên như người thật

TienCM

Pearl
Nền tảng trí tuệ nhân tạo FPT.AI của tập đoàn FPT vừa ra mắt phiên bản mới của công nghệ giọng máy AceSound có cách phát âm, biểu cảm, cao độ va khả năng ngắt nghỉ tự nhiên đến mức khó phân biệt được.
Công nghệ tổng hợp giọng nói là việc tạo ra giọng máy của người từ đầu vào là văn bản hay các mã hóa phát âm. Hệ thống này còn được gọi là chuyển văn bản thành giọng nói (Text to Speech). Trên thế giới, công nghệ giọng nói được nghiên cứu và có những bứt phá mạnh mẽ trong khoảng 10 năm trở lại đây. Những “ông trùm” công nghệ lớn trên thế giới đều sở hữu nhiều giọng máy riêng với chất lượng giọng tự nhiên như người thật.
Những giọng máy nổi tiếng và gần gũi nhất có thể kể đến Google Assistant, Amazon Alexa, trợ lý ảo Siri của Apple hay Samsung Bixby… Để tiếp cận thị trường Việt Nam, nhiều công ty công nghệ toàn cầu đã phát triển giọng nói tiếng Việt như Google, Nuance. Tuy nhiên chất lượng giọng không tự nhiên và gặp nhiều hạn chế về tính vùng miền.
FPT ra mắt công nghệ giọng máy AceSound tự nhiên như người thật
Mới đây, nền tảng trí tuệ nhân tạo FPT.AI đã ra mắt thêm hàng loạt các giọng máy mới ứng dụng công nghệ AceSound. Theo FPT, phiên bản mới thay đổi về cao độ, tốc độ, cách phát âm, khả năng ngắt nghỉ… khiến giọng máy AceSound trở nên mượt mà, sống động hơn. Các giọng mới như giọng Ban Mai AceSound, giọng Minh Quang AceSound, giọng Thu Minh AceSound… có ngữ điệu, biểu cảm gần như tiệm cận với người thật, thậm chí hay hơn người thật, chất lượng ngang với giọng đọc của các MC chuyên nghiệp. Hầu hết người nghe khó phân biệt được giọng máy AceSound với giọng người thật trong 10 giây đầu tiên. Hơn thế nữa, giọng máy AceSound có hiệu năng triển khai và tích hợp với các hệ thống lớn trong thời gian ngắn.
Kể từ khi ra mắt, giọng máy FPT.AI đã được tích hợp vào trợ lý ảo của các trung tâm tổng đài chăm sóc khách hàng (CSKH) tại nhiều doanh nghiệp như Home Credit, ngân hàng VIB, công ty dược Boston Pharma, phục vụ hàng triệu khách hàng mỗi tháng.
Giọng nói của trợ lý ảo được xây dựng để tạo ra sự đặc trưng riêng biệt cho từng thương hiệu, ngành nghề. Bằng cách “huấn luyện” bot hiểu ngôn ngữ tự nhiên nhờ AI, voicebot có thể giao tiếp hai chiều với con người theo thời gian thực, đưa ra các câu phản hồi có giọng nói biểu cảm, ngữ điệu, mang lại sắc thái tự nhiên cho cuộc hội thoại. Với công nghệ AceSound, FPT cho rằng giọng máy có thể hoạt động như người phát ngôn của thương hiệu, truyền bá thông điệp của doanh nghiệp bằng một giọng nói đặc trưng, tạo ra dấu ấn riêng các doanh nghiệp.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top