Tùy chỉnh LLM cho các tác vụ theo miền cụ thể

Thoại Viết Hoàng · 30/08/2023

Theo Predibase, việc mở rộng các mô hình ngôn ngữ lớn (LLM) trong thời gian gần đây đã mang lại sự thay đổi mang tính cách mạng trong quá trình học máy và đưa ra những quan điểm mới về tiềm năng của AI.

Mọi người đều muốn AI có trách nhiệm, nhưng rất ít người làm bất cứ điều gì về nó

Dựa trên dữ liệu khảo sát từ các tổ chức thử nghiệm LLM, các nhà nghiên cứu đã phát hiện ra rằng các doanh nghiệp đang tìm cách tùy chỉnh và triển khai LLM nguồn mở mà không cấp cho các nhà cung cấp thương mại quyền truy cập vào dữ liệu độc quyền và họ đang khám phá các trường hợp sử dụng khác ngoài khả năng AI tổng hợp.
“Bây giờ là mùa mở cửa cho LLM. Nhờ sự công nhận rộng rãi của ChatGPT của OpenAI, các doanh nghiệp đang chạy đua vũ trang để giành được lợi thế cạnh tranh bằng cách sử dụng các khả năng AI mới nhất. Tuy nhiên, họ yêu cầu LLM tùy chỉnh hơn để đáp ứng các trường hợp sử dụng theo tên miền cụ thể,” Piero Molino, Giám đốc điều hành của Predibase cho biết.
Molino nói thêm: “Báo cáo này nhấn mạnh sự cần thiết của ngành phải tập trung vào những cơ hội và thách thức thực sự thay vì mù quáng chạy theo sự cường điệu”.
Việc áp dụng LLM của doanh nghiệp
Chưa đến một phần tư doanh nghiệp cảm thấy thoải mái khi sử dụng LLM thương mại. 33% trích dẫn lo ngại về việc chia sẻ dữ liệu nhạy cảm hoặc độc quyền với các nhà cung cấp LLM thương mại, dẫn đến sự quan tâm ngày càng tăng đối với các giải pháp thay thế nguồn mở, được lưu trữ riêng tư.
LLM nguồn mở đang có đà phát triển. Gần 77% số người được hỏi không sử dụng hoặc không có kế hoạch sử dụng LLM thương mại ngoài nguyên mẫu trong sản xuất, với lý do lo ngại về quyền riêng tư, chi phí và thiếu khả năng tùy chỉnh, dẫn đến sự gia tăng các lựa chọn thay thế nguồn mở. Ví dụ: Meta đã chuyển từ xây dựng LLM nguồn đóng như LLaMA-1, thay thế nó bằng LLaMA-2, có sẵn dưới dạng nguồn mở và miễn phí cho các ứng dụng thương mại và nghiên cứu.
Trong khi các trường hợp sử dụng AI tổng quát vẫn còn phổ biến, các doanh nghiệp nhận thấy tiềm năng của các ứng dụng khác trong việc mang lại giá trị kinh doanh. Trích xuất thông tin là trường hợp sử dụng phổ biến thứ hai (được 32,6% số người được hỏi lựa chọn).
Điều này liên quan đến việc tận dụng LLM để chuyển đổi dữ liệu phi cấu trúc như tài liệu PDF hoặc email của khách hàng thành các bảng có cấu trúc để phân tích tổng hợp. Tiếp theo là Hỏi đáp và Tìm kiếm (15,2% số người được hỏi), bộ não trong chatbot cung cấp phản hồi chính xác và phù hợp cho các truy vấn của người dùng trong thời gian thực.
LLM tùy chỉnh
Các tổ chức đang chuyển sang LLM tùy chỉnh để đạt được kết quả chính xác và phù hợp hơn. Hầu hết các nhóm đều có kế hoạch tùy chỉnh LLM của họ bằng cách tinh chỉnh (32,4%) hoặc học tăng cường với phản hồi của con người (27%). Nhóm rào cản phải đối mặt với việc tinh chỉnh tiếp tục là thiếu dữ liệu (21%) và độ phức tạp tổng thể của quy trình như quản lý cơ sở hạ tầng (46%).
Dave Thau, Nhà khoa học trưởng về Công nghệ và Dữ liệu Toàn cầu, Quỹ Động vật hoang dã Thế giới cho biết: “Chúng tôi nhận thấy tiềm năng rõ ràng trong việc cải thiện kết quả của các nỗ lực bảo tồn bằng cách sử dụng LLM nguồn mở tùy chỉnh để giúp các nhóm của chúng tôi tạo ra những hiểu biết sâu sắc và bài học từ kho báo cáo dự án khổng lồ của chúng tôi”. .
“Tất nhiên, bí quyết không nằm ở việc xây dựng những kết quả này mà nằm ở việc đảm bảo rằng chúng mang lại những kết quả nhất quán, an toàn và có trách nhiệm. Với mong muốn ngày càng tùy chỉnh và triển khai các mô hình nguồn mở, các doanh nghiệp sẽ cần đầu tư vào công cụ vận hành và cơ sở hạ tầng có khả năng theo kịp tốc độ đổi mới nhanh chóng trong cộng đồng nguồn mở”, Shimmin kết luận.
Tham khảo bài viết gốc tại đây: