Nhóm AI ổn định giới thiệu FreeWilly1 và FreeWilly2: Các mô hình ngôn ngữ lớn truy cập mở mới (LLM)

Thoại Viết Hoàng · 25/07/2023

FreeWilly1 và người kế nhiệm FreeWilly2 là các Mô hình ngôn ngữ lớn (LLM) mã nguồn mở mới mạnh mẽ được phát triển bởi nhóm CarperAI của Stability AI.

Meta có lặp lại sai lầm của OpenAI không? Mark Zuckerberg không nghĩ vậy

Cả hai mô hình đều thể hiện xuất sắc trong các cuộc thi lập luận sử dụng nhiều thước đo khác nhau.

Nhóm AI ổn định giới thiệu FreeWilly1 và FreeWilly2: Các mô hình ngôn ngữ lớn truy cập mở mới (LLM)

Tinh chỉnh có giám sát (SFT) ở định dạng Alpaca tiêu chuẩn công nghiệp đã được sử dụng để tinh chỉnh mô hình FreeWilly1, được xây dựng dựa trên mô hình nền tảng LLaMA 65B ban đầu. FreeWilly2 sử dụng mô hình cơ sở LLaMA 2 70B để đạt được hiệu suất ngang với GPT-3.5 trong một số tác vụ.
Quá trình đào tạo các mô hình FreeWilly bị ảnh hưởng nặng nề bởi phương pháp đột phá của Microsoft, được mô tả trong bài viết “Orca: Học tập tiến bộ từ các dấu vết giải thích phức tạp của GPT-4”. Nhóm đã nhắc các mô hình ngôn ngữ có hướng dẫn chất lượng cao để tạo bản sao tập dữ liệu của chúng tôi, chứa 600.000 điểm dữ liệu (khoảng 10% kích thước tập dữ liệu được sử dụng trong tác phẩm gốc của Orca).
Sử dụng phương pháp này, các nhà nghiên cứu đã tạo ra 500.000 trường hợp sử dụng mô hình LLM ít phức tạp hơn và thêm 100.000 trường hợp sử dụng mô hình LLM phức tạp hơn. Họ đã sàng lọc kỹ lưỡng các bộ dữ liệu này, loại bỏ các trường hợp bắt nguồn từ tiêu chuẩn đánh giá để đảm bảo so sánh hợp lệ. Cách tiếp cận của họ đối với các bộ dữ liệu được tạo tổng hợp được xác thực bởi các mô hình FreeWilly hoạt động cực kỳ tốt trên nhiều điểm chuẩn mặc dù đào tạo chỉ bằng một phần mười kích thước mẫu được sử dụng trong bài báo gốc của Orca.
Các nhà nghiên cứu đã sử dụng lm-eval-khai thác của EleutherAI, mà họ đã thêm AGIEval, để tiến hành đánh giá các mô hình này. Các phát hiện cho thấy rằng cả hai mô hình FreeWilly đều xuất sắc khi giải quyết các vấn đề khó khăn trong các lĩnh vực chuyên ngành như luật và toán học, thực hiện lập luận phức tạp và nhận ra sắc thái ngôn ngữ.
Nhóm nghiên cứu tin rằng hai mô hình cải thiện khả năng nắm bắt ngôn ngữ nói của chúng ta và mở ra những khả năng không thể trước đây. Họ hy vọng sẽ thấy tất cả những ứng dụng sáng tạo của các mô hình này trong trí tuệ nhân tạo.
Tham khảo bài viết gốc tại đây

Tìm kiếm

Có thể bạn quan tâm

Nhóm AI ổn định giới thiệu FreeWilly1 và FreeWilly2: Các mô hình ngôn ngữ lớn truy cập mở mới (LLM)

Thoại Viết Hoàng

Writer

Thoại Viết Hoàng

Công ty mẹ TikTok tự phát triển GPU AI để không bị lệ thuộc vào công nghệ Mỹ

Hồ sơ người dùng trên LinkedIn đã bị sử dụng trái phép để đào tạo AI

EA muốn dùng AI tạo sinh để sản xuất trò chơi điện tử, giảm bớt vai trò của con người

Ông lớn Hollywood cho phép công ty AI khai thác dữ liệu, muốn dùng AI tạo sinh sản xuất phim

Học dốt thì làm nghề gì? Những công việc phù hợp với người có học lực kém

Kế hoạch tấn công thị trường xe điện của Sony dần lộ diện

Ốp lưng iPhone 15 có vừa với iPhone 16 không?

Chiếc xe bằng giá Vinfast VF3 vừa trở thành xe bán chạy nhất Trung Quốc

Bước ngoặt cho TikToker nhiều follow nhất thế giới

Nhật Bản đang biến "hòn đảo xe hơi" thành "hòn đảo di động" để thúc đẩy công nghệ pin và chip

DJI Osmo Action 5 Pro trình làng: camera hành động đối đầu GoPro Hero 13, giá từ hơn 9 triệu đồng

Triển Lãm Ô Tô Vietnam Motor Show 2024 hướng tới mục tiêu phù hợp với thực tế thị trường

Cận cảnh Synology NAS DS923+: giải pháp NAS giúp quản lý dữ liệu thuận tiện cho cá nhân, doanh nghiệp vừa và nhỏ

Yamaha LEXi 155 giảm giá "sập sàn", đại lý hạ giá mong kiếm khách

Đánh giá nổi bật