Thanh Phong
Editor
Microsoft AI, bộ phận AI của Microsoft đã công bố các mô hình AI nội bộ đầu tiên vào ngày 28/8: MAI-Voice-1 AI và MAI-1-preview. Công ty cho biết mô hình giọng nói MAI-Voice-1 mới của họ có thể tạo ra âm thanh dài một phút trong vòng chưa đầy một giây chỉ trên một GPU, trong khi MAI-1-preview "cung cấp cái nhìn thoáng qua về các sản phẩm tương lai bên trong Copilot".
Microsoft đã sử dụng MA1-Voice-1 để hỗ trợ một số tính năng của mình, bao gồm Copilot Daily, nơi người dẫn chương trình AI đọc lại những tin tức nổi bật trong ngày và tạo ra các cuộc thảo luận theo phong cách podcast để giúp giải thích các chủ đề.
Bạn có thể tự mình dùng thử MA1-Voice-1 trên Copilot Labs, nơi bạn có thể nhập nội dung bạn muốn mô hình AI nói, cũng như thay đổi giọng nói và phong cách nói của nó. Ngoài mô hình này, Microsoft còn giới thiệu MAI-1-preview, được cho là đã được đào tạo trên khoảng 15.000 GPU Nvidia H100. Nó được xây dựng cho những người dùng cần một mô hình AI có khả năng làm theo hướng dẫn và "cung cấp phản hồi hữu ích cho các truy vấn hàng ngày".
Giám đốc AI của Microsoft, Mustafa Suleyman, đã phát biểu trong một tập của Decoder năm ngoái rằng các mô hình AI nội bộ của công ty không tập trung vào các trường hợp sử dụng trong doanh nghiệp. "Theo tôi, chúng tôi phải tạo ra thứ gì đó hoạt động cực kỳ hiệu quả cho người dùng và thực sự tối ưu hóa cho trường hợp sử dụng của chúng tôi", Suleyman nói. "Vì vậy, chúng tôi có một lượng lớn dữ liệu rất có khả năng dự đoán và rất hữu ích về mặt quảng cáo, về dữ liệu từ xa của người dùng, v.v. Trọng tâm của tôi là xây dựng các mô hình thực sự hiệu quả cho người dùng đồng hành."
Microsoft AI dự định triển khai bản xem trước MAI-1 cho một số trường hợp sử dụng văn bản nhất định trong trợ lý AI Copilot, hiện đang dựa trên các mô hình ngôn ngữ lớn của OpenAI. Công ty cũng đã bắt đầu thử nghiệm công khai mô hình xem trước MAI-1 của mình trên nền tảng đánh giá AI LMArena.
"Chúng tôi có tham vọng lớn về hướng đi tiếp theo", Microsoft AI viết trong bài đăng trên blog. “Chúng tôi không chỉ theo đuổi những tiến bộ hơn nữa ở đây mà còn tin rằng việc sắp xếp một loạt các mô hình chuyên biệt phục vụ các mục đích và trường hợp sử dụng khác nhau của người dùng sẽ mang lại giá trị to lớn.”

Microsoft đã sử dụng MA1-Voice-1 để hỗ trợ một số tính năng của mình, bao gồm Copilot Daily, nơi người dẫn chương trình AI đọc lại những tin tức nổi bật trong ngày và tạo ra các cuộc thảo luận theo phong cách podcast để giúp giải thích các chủ đề.
Bạn có thể tự mình dùng thử MA1-Voice-1 trên Copilot Labs, nơi bạn có thể nhập nội dung bạn muốn mô hình AI nói, cũng như thay đổi giọng nói và phong cách nói của nó. Ngoài mô hình này, Microsoft còn giới thiệu MAI-1-preview, được cho là đã được đào tạo trên khoảng 15.000 GPU Nvidia H100. Nó được xây dựng cho những người dùng cần một mô hình AI có khả năng làm theo hướng dẫn và "cung cấp phản hồi hữu ích cho các truy vấn hàng ngày".
Giám đốc AI của Microsoft, Mustafa Suleyman, đã phát biểu trong một tập của Decoder năm ngoái rằng các mô hình AI nội bộ của công ty không tập trung vào các trường hợp sử dụng trong doanh nghiệp. "Theo tôi, chúng tôi phải tạo ra thứ gì đó hoạt động cực kỳ hiệu quả cho người dùng và thực sự tối ưu hóa cho trường hợp sử dụng của chúng tôi", Suleyman nói. "Vì vậy, chúng tôi có một lượng lớn dữ liệu rất có khả năng dự đoán và rất hữu ích về mặt quảng cáo, về dữ liệu từ xa của người dùng, v.v. Trọng tâm của tôi là xây dựng các mô hình thực sự hiệu quả cho người dùng đồng hành."
Microsoft AI dự định triển khai bản xem trước MAI-1 cho một số trường hợp sử dụng văn bản nhất định trong trợ lý AI Copilot, hiện đang dựa trên các mô hình ngôn ngữ lớn của OpenAI. Công ty cũng đã bắt đầu thử nghiệm công khai mô hình xem trước MAI-1 của mình trên nền tảng đánh giá AI LMArena.
"Chúng tôi có tham vọng lớn về hướng đi tiếp theo", Microsoft AI viết trong bài đăng trên blog. “Chúng tôi không chỉ theo đuổi những tiến bộ hơn nữa ở đây mà còn tin rằng việc sắp xếp một loạt các mô hình chuyên biệt phục vụ các mục đích và trường hợp sử dụng khác nhau của người dùng sẽ mang lại giá trị to lớn.”