Microsoft tạo ra AI mô phỏng giọng nói con người nguy hiểm đến mức không dám phát hành

Jimmy · 18/07/2024

Microsoft đã phát triển một mô hình AI chuyển văn bản thành giọng nói tiên tiến đến mức khiến chính công ty phải lo ngại về mức độ chân thực của nó. Họ cho rằng việc phát hành công nghệ này ra công chúng là quá nguy hiểm vì khả năng mô phỏng giọng nói con người một cách đáng kinh ngạc.

Trong bối cảnh các công cụ AI như ChatGPT ngày càng trở nên tinh vi, nguy cơ về việc khó phân biệt giữa người và máy móc ngày càng hiện hữu. Và trình tạo giọng nói dựa trên AI của Microsoft chính là ví dụ điển hình cho mối lo ngại này.

Theo LiveScience, Microsoft đã tạo ra một AI có khả năng chuyển văn bản thành giọng nói với độ chính xác cao đến mức công ty e ngại rằng nó có thể bị lợi dụng cho các mục đích xấu, chẳng hạn như lừa đảo hoặc mạo danh.

Mô hình AI "nguy hiểm" này có tên là VALL-E 2. Trong một bài báo, các nhà nghiên cứu của Microsoft cho biết VALL-E 2 đã đạt đến một cột mốc quan trọng trong lĩnh vực tổng hợp giọng nói, với khả năng tái tạo giọng nói con người một cách chính xác đến kinh ngạc, thậm chí đôi khi còn vượt trội hơn cả bản gốc.

"Các thử nghiệm của chúng tôi trên tập dữ liệu LibriSpeech và VCTK cho thấy VALL-E 2 vượt trội hơn hẳn các hệ thống chuyển văn bản thành giọng nói zero-shot trước đây về độ chân thực, tự nhiên và mức độ tương đồng. Đây là hệ thống đầu tiên đạt đến ngưỡng tương đương với con người dựa trên các tiêu chuẩn này", các nhà nghiên cứu cho biết.

Microsoft khẳng định VALL-E 2 hiện chỉ là một dự án nghiên cứu và chưa có kế hoạch thương mại hóa hoặc công bố rộng rãi. Tuy nhiên, công ty cũng đề cập đến một số ứng dụng tiềm năng của công nghệ này trong các lĩnh vực như giáo dục, báo chí, sáng tạo nội dung, hỗ trợ người khuyết tật, hệ thống phản hồi bằng giọng nói, dịch thuật và chatbot.

Tìm kiếm

Có thể bạn quan tâm

Microsoft tạo ra AI mô phỏng giọng nói con người nguy hiểm đến mức không dám phát hành

Jimmy

Moderator

Jimmy

Cách tạo chatbot Google Gemini AI tùy chỉnh của riêng bạn

Sự thật phũ phàng đằng sau cơn sốt AI: 80% các dự án thất bại, OpenAI còn đang "lỗ chổng vó" 5 tỷ USD

Chỉ sau 2 năm, ChatGPT "hiện nguyên hình" là 1 cú lừa

Trí tuệ nhân tạo: "Con dao hai lưỡi" trong cuộc chiến chống biến đổi khí hậu

Học dốt thì làm nghề gì? Những công việc phù hợp với người có học lực kém

Giải mã sức hút của "Black Myth: Wukong" - siêu phẩm AAA đang gây bão ngành game

Họa vô đơn chí: giữa lúc Intel gặp khủng hoảng nghiêm trọng, 4 "đầu não" tài giỏi này lại bỏ đi

Làm sao để nhận nút Ruby như Ronaldo? Tất cả những gì cần biết về nút bạc, nút vàng của YouTube

Chuyện gì xảy ra khi sét đánh xuống hồ nước?

Chỉ sau 2 năm, ChatGPT "hiện nguyên hình" là 1 cú lừa

Không mua được máy quang khắc EUV, Trung Quốc đã bỏ ra số tiền khổng lồ để làm việc này

Một hãng TV vừa ra mắt hẳn chế độ hình ảnh tối ưu cho Black Myth: Wukong, tựa game Ngộ Không đang gây sốt toàn cầu

Honor 200 5G ra mắt tại Việt Nam: tuyên bố mang tới trải nghiệm chụp ảnh chân dung chuẩn Studio Harcourt Paris đáng giá 2.000 Euro

Hà Lan sắp thực hiện một hành động đủ khiến ngành bán dẫn Trung Quốc tụt hậu xa hơn

Đánh giá nổi bật