Những nhà nghiên cứu Trung Quốc đã phát triển WebGLM: Hệ thống trả lời câu hỏi nâng cao trên web dựa trên Mô hình ngôn ngữ chung (GLM)

Các mô hình ngôn ngữ lớn (LLM), bao gồm GPT-3, PaLM, OPT, BLOOM và GLM-130B, đã đẩy rất nhiều giới hạn về khả năng hiểu và tạo ra ngôn ngữ của máy tính.
Những nhà nghiên cứu Trung Quốc đã phát triển WebGLM: Hệ thống trả lời câu hỏi nâng cao trên web dựa trên Mô hình ngôn ngữ chung (GLM)
Một trong những ứng dụng ngôn ngữ cơ bản nhất, trả lời câu hỏi, đã được cải thiện đáng kể do những đột phá LLM gần đây. Theo các nghiên cứu hiện có, hiệu suất của QA sách kín và QA học tập theo ngữ cảnh của LLM ngang bằng với hiệu suất của các mô hình được giám sát, điều này góp phần giúp chúng ta hiểu về khả năng ghi nhớ của LLM. Nhưng ngay cả các LLM cũng có năng lực hữu hạn và họ không đáp ứng được kỳ vọng của con người khi đối mặt với các vấn đề cần kiến thức đặc biệt đáng kể. Do đó, những nỗ lực gần đây đã tập trung vào việc xây dựng các LLM nâng cao với kiến thức bên ngoài, bao gồm cả truy xuất và tìm kiếm trực tuyến.
Chẳng hạn, WebGPT có khả năng duyệt trực tuyến, câu trả lời dài cho các câu hỏi phức tạp và các tài liệu tham khảo hữu ích không kém. Mặc dù phổ biến nhưng phương pháp WebGPT ban đầu vẫn chưa được áp dụng rộng rãi. Đầu tiên, nó dựa vào nhiều chú thích ở cấp độ chuyên gia về quỹ đạo duyệt, câu trả lời được viết tốt và gắn nhãn tùy chọn câu trả lời, tất cả đều yêu cầu tài nguyên đắt tiền, nhiều thời gian và đào tạo chuyên sâu. Thứ hai, bằng cách yêu cầu hệ thống tương tác với trình duyệt web, đưa ra hướng dẫn thao tác (chẳng hạn như “Tìm kiếm”, “Đọc” và “Trích dẫn”), sau đó thu thập tài liệu thích hợp từ các nguồn trực tuyến, phương pháp sao chép hành vi (nghĩa là bắt chước learning) đòi hỏi mô hình cơ bản của nó, GPT-3, giống với các chuyên gia của con người.
Cuối cùng, cấu trúc nhiều lượt của việc lướt web đòi hỏi nhiều tài nguyên tính toán và có thể quá chậm đối với trải nghiệm người dùng, chẳng hạn như WebGPT-13B mất khoảng 31 giây để phản hồi truy vấn 500 mã thông báo. Các nhà nghiên cứu từ Đại học Thanh Hoa, Đại học Beihang và Zhipu.AI giới thiệu WebGLM trong nghiên cứu này, một hệ thống đảm bảo chất lượng nâng cao web hợp lý được xây dựng trên Mô hình ngôn ngữ chung 10 tỷ tham số (GLM-10B). Hình 1 cho thấy một minh họa về một. Nó hiệu quả, giá cả phải chăng, nhạy cảm với sở thích của con người và đáng kể nhất là nó có chất lượng ngang bằng với WebGPT. Để đạt được hiệu suất tốt, hệ thống sử dụng một số phương pháp tiếp cận và thiết kế mới, bao gồm Công cụ truy xuất được tăng cường LLM, một công cụ truy xuất hai giai đoạn kết hợp truy ********* lọc LLM với tìm kiếm web chi tiết.
Khả năng của các LLM như GPT-3 chấp nhận một cách tự nhiên các tham chiếu phù hợp là nguồn cảm hứng cho kỹ thuật này, kỹ thuật này có thể được tinh chỉnh để tăng cường các bộ thu thập dữ liệu dày đặc nhỏ hơn. Trình tạo phản hồi dựa trên GLM-10B được khởi động thông qua học theo ngữ cảnh LLM và được đào tạo trên các mẫu QA hình thành từ lâu được trích dẫn được gọi là trình tạo khởi động. LLM có thể được chuẩn bị để cung cấp dữ liệu chất lượng cao bằng cách sử dụng bộ lọc dựa trên trích dẫn phù hợp thay vì dựa vào các chuyên gia đắt tiền để viết trong WebGPT. Người ghi điểm được dạy bằng cách sử dụng tín hiệu ngón tay cái của người dùng từ các diễn đàn QA trực tuyến có thể hiểu sở thích của đa số con người khi đưa ra các câu trả lời khác nhau.
Họ chứng minh rằng một kiến trúc tập dữ liệu phù hợp có thể tạo ra trình ghi điểm chất lượng cao so với cách ghi nhãn chuyên gia của WebGPT. Kết quả của các thử nghiệm cắt bỏ định lượng và đánh giá chuyên sâu của con người cho thấy hệ thống WebGLM hiệu quả và hiệu quả như thế nào. Cụ thể, WebGLM (10B) hoạt động tốt hơn WebGPT (175B) trong thử nghiệm Turing của họ và hoạt động tốt hơn WebGPT có kích thước tương tự (13B). WebGLM là một trong những hệ thống QA nâng cao trên web có sẵn công khai lớn nhất tính đến thời điểm gửi này, nhờ cải tiến của nó so với hệ thống có thể truy cập công khai duy nhất, Perplexity.ai. Tóm lại, họ cung cấp những điều sau đây trong bài báo này: • Họ xây dựng WebGLM, một hệ thống đảm bảo chất lượng được nâng cao trên web hiệu quả theo sở thích của con người. Nó hoạt động tương tự như WebGPT (175B) và tốt hơn đáng kể so với WebGPT (13B), cùng kích thước.
Nó cũng vượt qua Perplexity.ai, một hệ thống phổ biến được cung cấp bởi LLM và công cụ tìm kiếm. • Họ xác định các hạn chế của WebGPT đối với việc triển khai trong thế giới thực. Họ đề xuất một tập hợp các thiết kế và chiến lược mới để cho phép độ chính xác cao của WebGLM đồng thời đạt được các lợi thế hiệu quả và tiết kiệm chi phí so với các hệ thống cơ bản. • Họ xây dựng các thước đo đánh giá con người để đánh giá các hệ thống QA nâng cao trên web. Đánh giá và thử nghiệm mở rộng của con người chứng minh khả năng mạnh mẽ của WebGLM và tạo ra những hiểu biết sâu sắc về sự phát triển trong tương lai của hệ thống. Việc triển khai mã có sẵn trên GitHub.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top