VnReview
Hà Nội

YouTube sử dụng AI để tạo phụ đề cho hiệu ứng âm thanh

Nghiên cứu đặc biệt này của YouTube ;hứa hẹn sẽ giúp những người bị khiếm thính hoặc suy giảm khả năng nghe có thể thưởng thức các đoạn video YouTube một cách dễ dàng hơn.

Theo công bố mới nhất từ trang Google Blog cho biết, YouTube, công ty con của Google đang nghiên cứu cách tạo phụ đề tự động dựa vào hiệu ứng âm thanh trong video. Mục đích của nghiên cứu nhằm trợ giúp cho những người bị khiếm thính hoặc suy giảm khả năng nghe có thể xem video YouTube dễ dàng.

Trên thực tế, mỗi video YouTube nói riêng và video thông thường nói chung đều cấu thành từ hai yếu tố chính, hình ảnh và âm thanh. Việc chỉ có hình ảnh nhưng thiếu đi âm thanh của câu nói khiến nội dung video trở nên khó tiếp cận hơn với những người khiếm thính.

YouTube hiện đang thử nghiệm một hệ thống tạo phụ đề dựa vào hiệu ứng âm thanh sử dụng mạng trí tuệ nhân tạo. Hệ thống này sẽ được liên tục được huấn luyện với hàng ngàn giờ video để nhanh chóng hiểu sâu hơn về cách tạo nên phụ đề cho một video khi chỉ dựa vào hiệu ứng âm thanh sẵn có.

Tuy nhiên, hệ thống này vẫn chỉ đang ở giai đoạn đầu, một số phụ đề cơ bản có thể biểu lộ như tiếng cười, âm nhạc hay tiếng vỗ tay. Trong tương lai YouTube sẽ bổ sung thêm nhiều dạng âm thanh khác như tiếng gõ cửa, chuông reo,… Trước đó, YouTube cũng từng thử nghiệm tính năng tạo phụ đề video tự động bằng máy tính và nó hoạt động tương đối chính xác.

Dưới đây là một đoạn video ví dụ về cách YouTube sẽ cải tiến công cụ tạo phụ đề tự động bằng hiệu ứng âm thanh:

Tiến Thanh

Chủ đề khác