Microsoft tạo ra AI mô phỏng giọng nói con người nguy hiểm đến mức không dám phát hành

Jimmy

Moderator
Microsoft đã phát triển một mô hình AI chuyển văn bản thành giọng nói tiên tiến đến mức khiến chính công ty phải lo ngại về mức độ chân thực của nó. Họ cho rằng việc phát hành công nghệ này ra công chúng là quá nguy hiểm vì khả năng mô phỏng giọng nói con người một cách đáng kinh ngạc.

Trong bối cảnh các công cụ AI như ChatGPT ngày càng trở nên tinh vi, nguy cơ về việc khó phân biệt giữa người và máy móc ngày càng hiện hữu. Và trình tạo giọng nói dựa trên AI của Microsoft chính là ví dụ điển hình cho mối lo ngại này.

1721268442972.png


Theo LiveScience, Microsoft đã tạo ra một AI có khả năng chuyển văn bản thành giọng nói với độ chính xác cao đến mức công ty e ngại rằng nó có thể bị lợi dụng cho các mục đích xấu, chẳng hạn như lừa đảo hoặc mạo danh.

Mô hình AI "nguy hiểm" này có tên là VALL-E 2. Trong một bài báo, các nhà nghiên cứu của Microsoft cho biết VALL-E 2 đã đạt đến một cột mốc quan trọng trong lĩnh vực tổng hợp giọng nói, với khả năng tái tạo giọng nói con người một cách chính xác đến kinh ngạc, thậm chí đôi khi còn vượt trội hơn cả bản gốc.

"Các thử nghiệm của chúng tôi trên tập dữ liệu LibriSpeech và VCTK cho thấy VALL-E 2 vượt trội hơn hẳn các hệ thống chuyển văn bản thành giọng nói zero-shot trước đây về độ chân thực, tự nhiên và mức độ tương đồng. Đây là hệ thống đầu tiên đạt đến ngưỡng tương đương với con người dựa trên các tiêu chuẩn này", các nhà nghiên cứu cho biết.

Microsoft khẳng định VALL-E 2 hiện chỉ là một dự án nghiên cứu và chưa có kế hoạch thương mại hóa hoặc công bố rộng rãi. Tuy nhiên, công ty cũng đề cập đến một số ứng dụng tiềm năng của công nghệ này trong các lĩnh vực như giáo dục, báo chí, sáng tạo nội dung, hỗ trợ người khuyết tật, hệ thống phản hồi bằng giọng nói, dịch thuật và chatbot.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top