OpenAI thử nghiệm công cụ có thể tái tạo giọng nói con người

OpenAI, công ty đứng sau ChatGPT, đang liên tục khiến giới công nghệ phải nhắc đến mình. Mới đây, OpenAI đã công bố Sora, một công cụ có khả năng tạo ra các đoạn video dài tới một phút chỉ bằng văn bản. Giờ đây, công ty đã công bố một hệ thống mới có tên Voice Engine, có thể tái tạo giọng nói của con người (theo The New York Times).
Giống như Sora, OpenAI không cho phép công chúng sử dụng Voice Engine - ít nhất là chưa. Hiện tại, công ty đang thử nghiệm hệ thống này với "một nhóm nhỏ các doanh nghiệp." Rõ ràng, lý do OpenAI tiến hành cách thử nghiệm này là do những tác động to lớn về mặt đạo đức của một hệ thống có thể bắt chước giọng nói của một người thật.
OpenAI thử nghiệm công cụ có thể tái tạo giọng nói con người
Tờ The New York Times đã được dùng thử hệ thống này và chia sẻ một số đoạn clip. Bạn có thể nghe các nội dung này tại đây. Clip đầu tiên là một đoạn ghi âm dài 16 giây, thể hiện giọng nói thật của một người đàn ông với chất giọng Bồ Đào Nha đặc sệt. Người này tự giới thiệu và nói rằng anh ấy đang tạo clip này để “giúp những người không có khả năng nói có thể thể hiện bản thân đầy đủ hơn”. Clip tiếp theo là đoạn Voice Engine tái tạo giọng nói của anh ấy và đọc những nội dung hoàn toàn khác. Còn có một clip khác tái tạo giọng nói của người đàn ông này nhưng lại sử dụng tiếng Bồ Đào Nha thay vì tiếng Anh.
Cả hai đoạn âm thanh từ Voice Engine đều không giống hệt như bản gốc. Tuy nhiên, chúng vẫn là quá đủ để có thể đánh lừa bất kỳ ai quen biết với giọng nói của người đàn ông đó, khiến họ nghĩ rằng anh ấy thực sự đã nói những điều đó.
Điều đáng sợ là tiềm năng sử dụng một công cụ như thế này để lan truyền thông tin sai lệch. Giọng nói của các chính trị gia, người nổi tiếng và nhà báo có thể dễ dàng bị Voice Engine chiếm đoạt, sau đó bị chỉnh sửa để nói bất cứ điều gì. Thêm vào đó, với khả năng chỉnh sửa và một đoạn video thuyết phục, thật khó để đoán biết điều gì có thể xảy ra.
Ngoài ra, cần chú ý rằng các hệ thống xác thực giọng nói đang được sử dụng trên toàn thế giới nhằm mục đích bảo mật. Rất có thể Voice Engine cho phép mọi người qua mặt các hệ thống đó, khiến thông tin nhạy cảm gặp rủi ro.
Giám đốc sản phẩm của OpenAI, Jeff Harris, chia sẻ: “Đây là một vấn đề nhạy cảm, và điều quan trọng là cần phải đưa ra cách sử dụng phù hợp”. OpenAI đang thử nghiệm các hệ thống đóng dấu kỹ thuật số để giúp phân biệt các bản ghi âm thực tế với các bản tổng hợp. Đội ngũ phát triển cũng cởi mở về những vấn đề đạo đức mà hệ thống này đặt ra.
Tuy nhiên, lập luận được đưa ra là Voice Engine vẫn có thể mang lại nhiều điều tốt đẹp. Ví dụ, những người đã từng có giọng nói nhưng không may mất đi khả năng này sau đó trong cuộc đời, có thể bắt đầu giao tiếp trở lại bằng cách sử dụng giọng nói mô phỏng của chính họ. Nhà vật lý Stephen Hawking là một ví dụ điển hình về một người có thể được hưởng lợi từ một dịch vụ giọng nói như thế này. Voice Engine cũng có thể bảo tồn giọng nói của những người đã khuất và cũng hoạt động trong nhiều bối cảnh thương mại, chẳng hạn như trong việc tạo ra sách nói.
OpenAI cho biết hiện tại họ chưa có kế hoạch nào cho việc tung ra Voice Engine ra công chúng. Giống như Sora, công ty chỉ muốn giới thiệu những gì hệ thống này có thể làm được.
 


Đăng nhập một lần thảo luận tẹt ga

Gợi ý cộng đồng

Top