Cuộc chiến nguồn mở và nguồn đóng của các mô hình ngôn ngữ lớn bắt đầu sớm hơn dự kiến

Vào ngày 18 tháng 7 năm 2023, Meta, công ty mẹ của Facebook, cho biết sẽ phát hành phiên bản thương mại của mô hình mã nguồn mở lớn Llama, cung cấp cho các công ty khởi nghiệp và doanh nghiệp khác một tùy chọn miễn phí mạnh mẽ để thay thế các mô hình độc quyền đắt tiền do OpenAI và Google bán. Meta cũng thông báo rằng Llama sẽ được Microsoft phân phối thông qua dịch vụ đám mây Azure và sẽ chạy trên hệ điều hành Windows, gọi Microsoft là "đối tác lựa chọn của chúng tôi".
Trong một thời gian, nhiều nhà phân tích tin rằng Llama sẽ thay đổi cấu trúc công nghiệp của AIGC. Yang Likun, phó chủ tịch của Meta và là trưởng bộ phận trí tuệ nhân tạo, cũng đến nền tảng này, "Llama 2 sẽ thay đổi mô hình của thị trường mô hình ngôn ngữ lớn". Có đúng là không có gì hồi hộp không?
Cuộc chiến nguồn mở và nguồn đóng của các mô hình ngôn ngữ lớn bắt đầu sớm hơn dự kiến
Mã nguồn mở (Open Source), tức là mã nguồn mở, có nguồn gốc đầu tiên ở Hoa Kỳ vào những năm 1950 và 1960. Trong những ngày đầu phát triển công nghệ Internet và giao thức mạng viễn thông, các nhà nghiên cứu cần một môi trường cộng tác và cởi mở. Việc thành lập ARPANET, nhà tiên phong của Internet vào năm 1968, đã trở thành biểu tượng cho tính khả thi của mã nguồn mở. Năm 1985, Richard Stallman, người lãnh đạo phong trào phần mềm tự do, đã chứng kiến việc thương mại hóa phần mềm độc quyền dần dần thay thế phần mềm miễn phí và lưu hành tự do trong phòng thí nghiệm, và đã xuất bản bản tuyên ngôn GNU nổi tiếng, mở đầu cho phong trào nguồn mở và cuối cùng dẫn đến sự ra đời của hệ điều hành Linux miễn phí.
Kể từ khi ChatGPT bùng nổ, lời kêu gọi về mã nguồn mở chưa bao giờ dừng lại. Nhưng ngay sau khi phát hành ChatGPT2, OpenAI đã chọn phát triển nguồn đóng. Điều này có thể không hoàn toàn nằm ngoài sự cân nhắc về việc tránh cạnh tranh.Ngay cả khi OpenAI thực sự mở cửa hoàn toàn vào một ngày nào đó, các đồng nghiệp khác không thể đơn giản sao chép con đường thành công của nó.
Bởi vì lý do tại sao ChatGPT có thể kích hoạt "khoảnh khắc iPhone" là khả năng tạo mạnh mẽ mang đến cho mọi người trải nghiệm cảnh khác nhau. Nhưng điều này phụ thuộc vào sự tích lũy sức mạnh tính toán, thuật toán và dữ liệu của OpenAI trong một khoảng thời gian dài. Trên thực tế, trong cuộc chạy đua vũ trang mô hình quy mô lớn toàn cầu này, cuộc tranh luận về phát triển nguồn mở và phát triển sâu nguồn đóng sẽ tiếp tục không ngừng.

Mã nguồn mở hoặc mã nguồn đóng​

Cuộc chiến nguồn mở và nguồn đóng của các mô hình ngôn ngữ lớn bắt đầu sớm hơn dự kiến
Bánh xe lịch sử sẽ luôn quay đi quay lại, trong lịch sử phát triển của Internet luôn diễn ra các cuộc chiến về mã nguồn mở và mã nguồn đóng.
Bên cạnh tuyên ngôn GNU của Richard Stallman ở trên đã nổ phát súng đầu tiên chống lại nguồn đóng, cuộc tranh luận về nguồn mở và nguồn đóng trong kỷ nguyên PC tiếp theo vẫn chưa dừng lại.
Khi PC mới xuất hiện, nhóm R&D nội bộ của Microsoft đã phát triển hệ điều hành Windows thông qua phát triển nguồn đóng và phát triển phần mềm ứng dụng hỗ trợ như Office, đồng thời thành lập liên minh Wintel về mặt xây dựng sinh thái và chiếm lĩnh thành công thị trường PC. Vào thời điểm đó, Linux là một "tổ chức phi chính phủ" tự nguyện, được xây dựng bởi các nhà phát triển từ khắp nơi trên thế giới và hình thành một sự cạnh tranh nhất định với Microsoft thông qua nguồn mở.
Trong thời đại của Internet di động, các tranh chấp về mã nguồn mở Android của Google và iOS của Apple cũng đi theo những con đường khác nhau. Dựa trên sự mở đầu của Android, một số lượng lớn hệ điều hành điện thoại di động tùy chỉnh đã ra đời, chẳng hạn như MIUI của Xiaomi ở Trung Quốc, ColorOS của OPPO... Ngay cả hệ thống máy móc BYD bên ô tô cũng được phát triển dựa trên Android. Tất nhiên, từ góc độ thành công thương mại, vị trí của Microsoft và Apple sẽ an toàn hơn trong một khoảng thời gian nhất định.
Trong lịch sử phát triển của SaaS, mã nguồn mở của phần mềm cũng giống như trên. Giáo sư Wang Huaimin, viện sĩ Viện Hàn lâm Khoa học Trung Quốc kiêm giám đốc Ủy ban Phát triển Nguồn mở CCF, tin rằng trong thời đại xác định phương hướng phát triển, tác dụng thúc đẩy của các công ty nguồn đóng là hiển nhiên và khả năng cạnh tranh cũng vô cùng mạnh mẽ. "Nhưng khi kỷ nguyên Internet không chắc chắn đến, nguồn mở sẽ thu hút các nhà phát triển từ khắp nơi trên thế giới tham gia vào nó, để các hệ điều hành máy chủ, hệ điều hành đám mây, hệ điều hành điện thoại di động và hệ điều hành Internet of Things sau này đều dựa trên Linux nguồn mở".
ChatGPT và Llama ở nước ngoài có tranh chấp, các nhà sản xuất mô hình quy mô lớn trong nước cũng có thế mạnh riêng.
Ví dụ: Alibaba Cloud, Zhipu, Tsinghua EKG, Baichuan Intelligent, v.v., đã chọn mã nguồn mở. Alibaba Cloud đã công bố chiến lược nguồn mở 1+4 và ra mắt lực lượng nguồn mở mới theo hướng mô hình lớn là GPT. Li Chenliang, một kỹ sư thuật toán cao cấp tại Học viện Phật pháp Alibaba, đã từng nói với thế giới bên ngoài, "Hệ sinh thái nguồn mở chắc chắn có lợi cho sự thịnh vượng của các mô hình lớn." Ngược lại, mô hình lớn Bàn Cổ của Huawei đã chọn mã nguồn đóng, cũng để xem xét quyền riêng tư dữ liệu và lợi ích thương mại của nó.

Giá tốt nhất sẽ thắng?​

Cuộc chiến nguồn mở và nguồn đóng của các mô hình ngôn ngữ lớn bắt đầu sớm hơn dự kiến
Sau khi mô hình lớn được mã hóa nguồn mở, sẽ thu hút được nhiều nhân tài tham gia hơn và tiến bộ công nghệ sẽ được đẩy nhanh hơn, tuy nhiên để đạt được những bước đột phá thì cần phải hiểu nguyên tắc cơ bản của khung mô hình và thuật toán từ dưới lên. Như chúng ta đã biết, ba yếu tố của trí tuệ nhân tạo là: sức mạnh tính toán, thuật toán và dữ liệu. Nguồn mở mới chỉ ở giai đoạn thuật toán, sau đó nó cần rất nhiều hỗ trợ về sức mạnh tính toán và đào tạo dữ liệu, và chi phí đằng sau nó khá cao.
Lấy OpenAI làm ví dụ: Những người trong ngành nói rằng việc đào tạo và vận hành các mô hình lớn sẽ tiêu tốn tài nguyên máy tính và dữ liệu khổng lồ, riêng năm 2022, OpenAI sẽ tiêu tốn tổng cộng 540 triệu đô la Mỹ, trong khi doanh thu mà nó tạo ra chỉ là 28 triệu đô la Mỹ.
Theo các nguồn tin trong ngành, bộ phận trí tuệ nhân tạo của một công ty niêm yết dự định sử dụng GPT-3.5 của OpenAI để phát triển các chức năng, nhưng do chi phí, phát triển tùy chỉnh và không hỗ trợ đáp ứng đồng thời số lượng lớn yêu cầu của người dùng nên đã chọn Llama với số tham số ít hơn và mô hình mã nguồn mở lớn của công ty trong nước, đồng thời chi phí đào tạo và triển khai trong giai đoạn sau cũng sẽ thấp hơn.
Amjad Masad, Giám đốc điều hành của nền tảng phát triển phần mềm Replit cho biết: “Bất kỳ cải tiến gia tăng nào đối với mô hình nguồn mở đều ăn vào thị phần của mô hình nguồn đóng, bởi vì bạn có thể chạy chúng với chi phí thấp hơn và ít phụ thuộc hơn”.
Nguồn mở cũng sẽ cho phép những người mới tham gia khác thích ứng với ngành AI nhanh hơn. Ví dụ, nó được đề cập trong tài liệu rò rỉ của Google: Hầu như bất kỳ ai cũng có thể tinh chỉnh mô hình theo ý tưởng của mình và chu trình đào tạo trong vòng một ngày sẽ trở thành chuẩn mực. Với tốc độ này, hiệu quả tích lũy của tinh chỉnh sẽ nhanh chóng giúp các mẫu xe cỡ nhỏ khắc phục nhược điểm về kích thước.
Nhiều người đến và sử dụng nó hơn, và nhiều dữ liệu hơn sẽ được tạo ra. Việc đào tạo chuẩn hóa các nội dung có nguồn gốc từ Internet này đơn giản hơn nhiều so với việc một mình công ty thu thập và dán nhãn dữ liệu.
Meta, đã chia sẻ Llama, nói rằng dữ liệu được thu thập đại diện cho các sở thích của con người được lấy mẫu dựa trên kinh nghiệm và những người chú thích con người chọn đầu ra nào trong số hai đầu ra mô hình mà họ thích. Phản hồi do con người đưa ra sau đó được sử dụng để đào tạo một mô hình phần thưởng, mô hình này liên tục học các mẫu ưu tiên của người chú thích con người và sau đó tự động thực hiện các quyết định ưu tiên dựa trên chúng.
Lợi ích của nguồn mở là rõ ràng và logic của nguồn đóng cũng rất vững chắc.
Nghiên cứu của Yuanchuang Capital cho thấy so với mã nguồn mở, mô hình mã nguồn đóng tương đối trưởng thành và chất lượng dữ liệu được đảm bảo hơn, đồng thời tiết kiệm được rắc rối khi triển khai và chi phí tương đối thấp, chỉ cần phí mã thông báo.
Tất nhiên, điều quan trọng nhất là đối với các nhà sản xuất, nguồn đóng cũng có những cân nhắc về mặt thương mại. Theo dự đoán của tạp chí có thẩm quyền "Fast Company", doanh thu của OpenAI vào năm 2023 sẽ đạt 200 triệu đô la Mỹ, bao gồm việc cung cấp dịch vụ giao diện dữ liệu API, phí dịch vụ đăng ký robot trò chuyện...

Trận đấu chỉ mới bắt đầu​

Tháng trước, cuộc chiến ngôn từ giữa Giám đốc điều hành Cheetah Mobile Fu Sheng và nhà đầu tư Zhu Xiaohu đã gây ra những cuộc thảo luận sôi nổi. Xung đột cốt lõi nằm ở suy nghĩ của ngành về giá trị của các mô hình lớn và liệu các mô hình lớn có giải quyết được vấn đề hay không.
Ngày nay, các công ty lớn được đại diện bởi OpenAI, sức mạnh tính toán mạnh mẽ và các thuật toán mạnh mẽ đã cùng nhau xây dựng một bức tường mà các doanh nhân và nhà phát triển bình thường khó có thể vượt qua, để khi các ứng dụng mã nguồn mở tương tự khác xuất hiện trên thị trường, mọi người nghĩ rằng sự độc quyền của ngành công nghiệp mô hình lớn sẽ bị phá vỡ.
Trên thực tế, kể từ khi OpenAI ra mắt ChatGPT và gây ra sự theo dõi toàn cầu, giá cổ phiếu của Nvidia đã tăng đột biến, chủ yếu là do nhu cầu mạnh mẽ của các nhà sản xuất đối với chip điện toán. Nói cách khác, ngay cả khi mọi người đều có một mô hình lớn sau mã nguồn mở, công việc về sức mạnh tính toán, đào tạo thuật toán và dữ liệu vẫn cần một người nào đó thực hiện. Và mã nguồn mở chỉ tương đương với việc mở bản vẽ thiết kế, bạn có thể thực hiện các điều chỉnh trên bản vẽ nhưng không có nghĩa là bạn có thể xây dựng hoàn toàn một công trình.
Ví dụ, khi một số sản phẩm mô hình quy mô lớn lần đầu tiên được tung ra, cách hiểu ngữ nghĩa thường không chính xác và kết quả đầu ra rất nực cười. Lý do đằng sau điều này là có quá ít sàng lọc và đào tạo dữ liệu chất lượng cao, dẫn đến độ chính xác của dữ liệu ảnh hưởng trực tiếp đến đầu ra của trí tuệ nhân tạo.
Nhưng dữ liệu đào tạo không phải là tạm thời, nó liên quan đến một chuỗi thu thập, làm sạch và ghi nhãn dữ liệu công nghiệp khác. Trong một thời gian dài trước đây, liên kết này được thực hiện bởi các công ty xử lý dữ liệu chuyên biệt, tức là cần có sự đầu tư dài hạn của con người.
Một số kỹ sư tối ưu hóa dữ liệu trong ngành cũng bày tỏ quan điểm tương tự và khả năng khái quát hóa của bản thân mô hình lớn vẫn bị hạn chế bởi dữ liệu. Nếu ChatGPT là để thay thế một nghề nghiệp hoặc vị trí nhất định, thì tiêu chí đánh giá đơn giản nhất là có đủ dữ liệu với chất lượng tốt hay không. Theo cách tương tự, nếu bạn muốn phá vỡ mô hình độc quyền thông qua nguồn mở, bạn cần tối ưu hóa đủ dữ liệu và đầu tư đủ vào cơ sở hạ tầng.
Cuộc chiến giữa các nguồn mở và đóng của các mô hình lớn sẽ không kết thúc với sự xuất hiện của một hoặc một số sản phẩm, mà cần có sự tham gia của những tài năng hàng đầu, sự lặp lại kỹ thuật và hỗ trợ tài chính. Nếu muốn phá vỡ thế độc quyền, bạn cũng cần quan tâm đến yếu tố thời gian và sàng lọc dữ liệu chất lượng cao.
Mở hay đóng chưa bao giờ là vấn đề cơ bản nhất, sự phù hợp giữa trải nghiệm sản phẩm và nhu cầu thị trường mới là yếu tố quyết định.
>> AI đang được sử dụng để hack và tung thông tin sai lệch
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

Gợi ý cộng đồng

Top