Nhanh hơn 70% so với thuật toán do người viết! Google DeepMind sử dụng AI để cải thiện việc sắp xếp dữ liệu

Đoàn Thúy Hà

Editor
Thành viên BQT
Phần đầu tiên đề cập đến AlphaDev và AlphaZero.

3. MuZero: mã hóa nhóm hình ảnh video, tốc độ bit nén giảm 4%​

Truyền phát video chiếm một phần đáng kể lưu lượng truy cập Internet, do đó, việc nâng cao hiệu quả phân phối video sẽ có tác động rất lớn đến hàng triệu người xem video mỗi ngày.
Nhanh hơn 70% so với thuật toán do người viết! Google DeepMind sử dụng AI để cải thiện việc sắp xếp dữ liệu

Năm ngoái, Google DeepMind đã hợp tác với trang video YouTube để nén và truyền tải video thông qua MuZero, kết quả cho thấy công cụ này có thể giảm 4% tốc độ bit mà không ảnh hưởng đến chất lượng video.
Trước đó, các nhà nghiên cứu đã áp dụng MuZero để tối ưu hóa quá trình nén từng khung hình riêng lẻ trong video và giờ đây họ đang mở rộng nó để xác định cách các khung hình được nhóm và tham chiếu trong quá trình mã hóa.
Ban đầu, MuZero xác định các khung GOP (nhóm ảnh) sẽ được nén, sau đó nhóm chúng theo sự giống nhau về hình ảnh của chúng. MuZero sẽ nén khung hình chính của một trong các nhóm ảnh, sau đó tham chiếu khung hình chính để nén các khung hình khác.Trong quá trình này, thuật toán sẽ sử dụng tìm kiếm khối để tìm khu vực có ít thay đổi nhất trong ảnh, sao cho hiệu ứng nén Tốt hơn vẫn có thể đảm bảo chất lượng video.
Cuối cùng, sau khi quá trình nén một nhóm ảnh hoàn tất, MuZero sẽ thực hiện theo các bước tương tự để hoàn tất quá trình nén phần còn lại của video.
Kết quả ban đầu từ những nghiên cứu này cho thấy MuZero có tiềm năng trở thành một công cụ tổng quát hơn để giúp các nhà nghiên cứu tìm ra giải pháp tối ưu trong quá trình nén video.

Kết luận: Tiềm năng biến đổi của các công cụ trí tuệ nhân tạo​

Ngày nay, các công cụ trí tuệ nhân tạo của Google DeepMind đang cho phép hàng tỷ người dùng tiết kiệm thời gian và năng lượng theo cách họ sử dụng máy tính, từ chơi trò chơi đến giải quyết các vấn đề kỹ thuật phức tạp nằm ở trung tâm của mọi thiết bị điện toán. Các nhà nghiên cứu tin rằng đây mới chỉ là sự khởi đầu.
Trong tương lai, ngày càng nhiều công cụ trí tuệ nhân tạo tổng quát có thể tối ưu hóa toàn bộ hệ sinh thái điện toán cung cấp năng lượng cho thế giới kỹ thuật số, nhưng đồng thời, cơ sở hạ tầng kỹ thuật số đằng sau những công cụ này cần phải nhanh hơn, hiệu quả hơn và bền vững hơn. Do đó, việc hiện thực hóa tầm nhìn này đòi hỏi nhiều đột phá hơn về lý thuyết và công nghệ.
Không thể phủ nhận rằng tiềm năng biến đổi của các công cụ trí tuệ nhân tạo nói chung đã được bộc lộ và các nhà nghiên cứu đã bắt đầu xem xét các ứng dụng của nó trong công nghệ, khoa học và y học.
Cuối cùng, sau khi quá trình nén một nhóm ảnh hoàn tất, MuZero sẽ thực hiện theo các bước tương tự để hoàn tất quá trình nén phần còn lại của video.
Kết quả ban đầu từ những nghiên cứu này cho thấy MuZero có tiềm năng trở thành một công cụ tổng quát hơn để giúp các nhà nghiên cứu tìm ra giải pháp tối ưu trong quá trình nén video.
 


Đăng nhập một lần thảo luận tẹt ga

Gợi ý cộng đồng

Top