Sóng AI
Writer

Sam Altman đã tiết lộ trên nền tảng X rằng OpenAI sẽ phát hành một mô hình ngôn ngữ trọng số mở mạnh mẽ với khả năng lập luận trong những tháng tới.
Altman cho biết công ty đã cân nhắc việc phát hành mô hình trọng số mở từ lâu, và "giờ đây cảm thấy điều này quan trọng cần thực hiện".
Động thái này một phần là phản ứng trước thành công vang dội của mô hình R1 từ công ty Trung Quốc DeepSeek, cũng như sự phổ biến của các mô hình Llama của Meta.
OpenAI có thể cảm thấy cần chứng minh khả năng huấn luyện mô hình mới với chi phí thấp hơn, khi mô hình của DeepSeek được cho là đã được huấn luyện với chi phí chỉ bằng một phần nhỏ so với hầu hết các mô hình AI lớn khác.
Clement Delangue, đồng sáng lập và CEO của HuggingFace - công ty chuyên về lưu trữ các mô hình AI mở, nhận xét: "Đây là tin tuyệt vời. Với DeepSeek, mọi người đang nhận ra sức mạnh của trọng số mở."
Hiện tại, OpenAI cung cấp AI thông qua chatbot và đám mây. Các mô hình trọng số mở như R1, Llama có thể được tải xuống miễn phí và chỉnh sửa.
"Trọng số" của mô hình đề cập đến các giá trị bên trong mạng nơ-ron lớn được thiết lập trong quá trình huấn luyện. Các mô hình trọng số mở có chi phí sử dụng thấp hơn và có thể được điều chỉnh cho các trường hợp nhạy cảm, như xử lý thông tin tuyệt mật.
Steven Heidel, thành viên đội ngũ kỹ thuật tại OpenAI, đã chia sẻ lại thông báo của Altman và bổ sung: "Chúng tôi sẽ phát hành một mô hình năm nay mà bạn có thể chạy trên phần cứng của riêng mình."
OpenAI cũng đã đăng một trang web mời các nhà phát triển đăng ký truy cập sớm vào mô hình sắp tới. Altman cho biết công ty sẽ tổ chức các sự kiện cho nhà phát triển với các nguyên mẫu ban đầu của mô hình mới trong những tuần tới.
Meta là công ty AI lớn đầu tiên theo đuổi cách tiếp cận mở hơn, phát hành phiên bản đầu tiên của Llama vào tháng 7/2023. Hiện có ngày càng nhiều mô hình AI trọng số mở.
Một số nhà nghiên cứu lưu ý rằng Llama và một số mô hình khác không minh bạch như có thể vì dữ liệu huấn luyện và các chi tiết khác vẫn được giữ bí mật. Meta cũng áp đặt giấy phép giới hạn khả năng kiếm lợi nhuận từ các ứng dụng và công cụ được xây dựng bằng Llama.

Nguồn: Songai.vn