Chưa đánh đã thỏa thuận đình chiến! Cuộc chiến AI có thể chấm dứt sớm hơn dự kiến

Meta đã cung cấp LLaMA trên Azure. Có lẽ ngày các LLM làm việc cùng nhau đang sắp đến gần.
Vài tháng trở lại đây, mọi người tự hỏi ai sẽ chiến thắng trong cuộc chạy đua vũ trang AI. Microsoft đã liên kết với OpenAI. Google ra mắt Bard. Meta bắt đầu làm việc trên mô hình ngôn ngữ lớn của riêng mình, LLaMA. Các công ty khác bắt đầu nghĩ đến việc tung ra các nền tảng AI và những người dùng tò mò đã so tài các mô hình này với nhau.
Chưa đánh đã thỏa thuận đình chiến! Cuộc chiến AI có thể chấm dứt sớm hơn dự kiến

Nhưng một thỏa thuận gần đây cho thấy chúng ta cũng có thể thấy số lượng quan hệ đối tác ngày càng tăng, không chỉ là cạnh tranh trực tiếp. Đầu tuần này, Meta đã cung cấp miễn phí mô hình ngôn ngữ lớn LLaMA theo giấy phép mở và đưa nó lên nền tảng Azure của Microsoft. Quyết định nêu bật những lợi ích của khả năng tương tác trong AI — và khi có nhiều công ty tham gia vào lĩnh vực này, có lẽ đây sẽ không phải là công ty cuối cùng thuộc loại này.
Các LLM nổi tiếng cho đến nay đã tương đối im lặng và được cung cấp trong một môi trường được kiểm soát nhiều hơn, nơi người dùng cần có quyền để xây dựng với mô hình hoặc sử dụng dữ liệu. OpenAI tiếp tục đào tạo GPT, phát hành GPT-4 vào tháng 3 và cung cấp cho các nhà phát triển quyền truy cập API trả phí vào phiên bản mới nhất của mô hình. Apple đang phát triển LLM của riêng mình, được gọi là Ajax, mặc dù rất ít thông tin chi tiết; nó vẫn chưa có sẵn công khai và trạng thái nguồn mở của nó vẫn chưa được biết. Bard, LLM của Google, hoàn toàn không phải là mã nguồn mở.
LLaMA ban đầu không có sẵn công khai và chỉ có thể truy cập thông qua Meta và Meta vẫn chưa tiết lộ dữ liệu đào tạo của nó. Nhưng LLaMA luôn được dự định là nguồn mở và được xây dựng để “dân chủ hóa hơn nữa quyền truy cập” vào AI. Tuần này, Meta ít nhất đã thực hiện được một phần lời hứa đó. Người dùng của các hệ thống đóng phải trả phí cấp phép để truy cập vào mô hình nơi nó được lưu trữ và phân phối các ứng dụng sử dụng cùng một mô hình đó. Cách Meta mở LLaMA, bằng cách cung cấp nó cho người dùng Azure và không được cấp phép ở một mức độ nhất định, đã loại bỏ sự bất tiện đó.
Meta mở LLaMa và đưa nó lên Azure có ý nghĩa kinh doanh, đặc biệt nếu Meta tin tưởng vào việc phát triển AI một cách cởi mở. Đây là bước đầu tiên hướng tới việc cho phép mọi người truy cập nhiều mô hình LLM hơn trên các nền tảng và so sánh kết quả. Một loạt các khung LLM lớn hơn để lựa chọn cũng tập trung vào câu hỏi làm thế nào mỗi mô hình có thể hoạt động cùng nhau. Và các nhà phát triển LLM muốn mọi người sử dụng các mô hình của họ, do đó, việc cung cấp chúng trên nhiều nền tảng sẽ đưa chúng đến với nhiều người dùng hơn.
Ngay cả những công ty Công nghệ lớn cạnh tranh nhất cũng kinh doanh với nhau. Meta không lạ gì khi hợp tác với Microsoft — Meta đã mang sản phẩm Teams của Microsoft đến Workplace của Meta, ứng dụng này đã chạy bộ Office 365.
Sự cởi mở có những rủi ro của nó. Ilya Sutskever, đồng sáng lập và nhà khoa học trưởng của OpenAI, một tổ chức cởi mở hơn khi được thành lập vào năm 2015, nói với The Verge rằng ông rất tiếc khi chia sẻ nghiên cứu vì sợ cạnh tranh và an toàn. Ví dụ, việc mở các bộ dữ liệu giúp dễ dàng kiện vi phạm bản quyền hơn vì mọi người có thể xem nguồn nào đã lấy dữ liệu để đào tạo các mô hình.
Nhưng việc có nhiều khung LLM hơn để lựa chọn có thể là tin tốt cho những người ủng hộ khả năng tương tác của AI.
Vì các LLM theo mặc định là khác biệt với nhau nên các nhà phát triển thường phải chọn mô hình nào để xây dựng ứng dụng. Không có cách nào tốt để các hệ thống nói chuyện.
Những khu vườn có tường bao quanh không gây sốc đối với hầu hết người dùng công nghệ hiện đại, nhưng những người ủng hộ khả năng tương tác của AI cho rằng cách duy nhất để AI có thể phát triển và tiến hóa không phải thông qua các silo kín mà thông qua các cấu trúc mở có thể giao tiếp với nhau. Ngay cả Microsoft cũng tin vào một AI có thể tương tác; nó đã cùng với các công ty công nghệ khác tham gia Open Neural Network Exchange, một nhóm muốn thúc đẩy tiêu chuẩn ngành về khả năng tương tác của AI để các nhà phát triển có thể “tìm ra sự kết hợp các công cụ phù hợp”.
Để các hệ thống AI hoạt động song song có thể mang lại kết quả tốt hơn cho những thứ như truy vấn tìm kiếm. Các công ty có thể đào tạo các mô hình trên các bộ dữ liệu khác nhau có thể cung cấp dịch vụ tốt hơn, đầy đủ hơn — và nếu một mô hình sai, có khả năng tránh được sự phụ thuộc quá mức thảm khốc vào một nguồn thông tin. Và việc có thể phát triển cho cả hai mô hình GPT của LLaMa và OpenAI ở một nơi có thể cắt giảm chi phí và thời gian phát triển.
Hiện tại, LLaMa khả dụng trên Azure không có nghĩa là các ứng dụng được tạo bằng LLaMa có thể đột nhiên nói chuyện với những ứng dụng chạy trên các mô hình GPT của OpenAI. Chưa có ai tạo ra cây cầu đó. Ngoài ra, không phải ai cũng đồng ý rằng LLaMa kiểm tra tất cả các hộp đối với phần mềm nguồn mở, đặc biệt là vì phần mềm này không sử dụng giấy phép được Open Source Initiative chấp thuận. Nó cũng giới hạn những người có thể sử dụng LLaMa về mặt thương mại mà không phải trả phí. Theo thỏa thuận cấp phép cộng đồng, các nhà phát triển có hơn 700 triệu người dùng hoạt động hàng tháng “phải yêu cầu giấy phép từ Meta”.
Nhưng đây là một bước đi đúng hướng cho nguồn mở và khả năng tương tác, nếu chỉ để cho phép các nhà phát triển truy cập dễ dàng hơn giữa các mô hình. Có chỗ cho sự cạnh tranh lành mạnh, nhưng nếu các công ty thực sự muốn AI phát triển, thì làm việc cùng nhau là lựa chọn tốt nhất.
Bài viết gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga

Gợi ý cộng đồng

Top