Huyền thoại về AI 'nguồn mở'

Một phân tích mới cho thấy các công cụ AI “nguồn mở” như Llama 2 vẫn được các công ty công nghệ lớn kiểm soát theo một số cách.
VNReview.vn

CHATGPT LÀM CHO bất cứ ai cũng có thể chơi với trí tuệ nhân tạo mạnh mẽ, nhưng hoạt động bên trong của chatbot nổi tiếng thế giới vẫn là một bí mật được bảo vệ chặt chẽ.
Tuy nhiên, trong những tháng gần đây, những nỗ lực nhằm làm cho AI “cởi mở” hơn dường như đã có động lực. Vào tháng 5, ai đó đã rò rỉ một mô hình từ Meta, được gọi là Llama, cho phép người ngoài truy cập vào mã cơ bản của nó cũng như “trọng số” xác định cách nó hoạt động. Sau đó, vào tháng 7 này, Meta đã chọn tạo ra một mô hình thậm chí còn mạnh mẽ hơn, có tên là Llama 2, để mọi người có thể tải xuống, sửa đổi và sử dụng lại. Các mô hình của Meta kể từ đó đã trở thành nền tảng cực kỳ phổ biến đối với nhiều công ty, nhà nghiên cứu và những người có sở thích xây dựng các công cụ và ứng dụng có khả năng giống ChatGPT.
“Chúng tôi có nhiều người ủng hộ trên khắp thế giới, những người tin tưởng vào cách tiếp cận mở của chúng tôi đối với AI ngày nay... các nhà nghiên cứu cam kết thực hiện nghiên cứu với mô hình và những người trong giới công nghệ, học viện và chính sách, những người nhìn thấy lợi ích của Llama và một cơ chế mở nền tảng như chúng tôi làm,” Meta nói khi công bố Llama 2. Sáng nay, Meta đã phát hành một mô hình khác, Llama 2 Code, được tinh chỉnh để mã hóa.
Có vẻ như cách tiếp cận nguồn mở, vốn đã dân chủ hóa quyền truy cập vào phần mềm, đảm bảo tính minh bạch và cải thiện bảo mật trong nhiều thập kỷ, giờ đây đã sẵn sàng để có tác động tương tự đối với AI.
Không nhanh như vậy, một nhóm đứng sau một bài nghiên cứu kiểm tra thực tế của Llama 2 và các mô hình AI khác được mô tả, theo cách này hay cách khác, là “mở” cho biết. Các nhà nghiên cứu từ Đại học Carnegie Mellon, Viện AI Now và Quỹ Signal, nói rằng các mô hình được gắn nhãn hiệu “mở” có thể đi kèm với nhiều lợi ích.
Llama 2 được tải xuống, sửa đổi và triển khai miễn phí nhưng nó không được cấp giấy phép nguồn mở thông thường. Giấy phép của Meta cấm sử dụng Llama 2 để đào tạo các mô hình ngôn ngữ khác và yêu cầu giấy phép đặc biệt nếu nhà phát triển triển khai nó trong một ứng dụng hoặc dịch vụ có hơn 700 triệu người dùng hàng ngày.
Mức độ kiểm soát này có nghĩa là Llama 2 có thể mang lại những lợi ích chiến lược và kỹ thuật đáng kể cho Meta—ví dụ: bằng cách cho phép công ty hưởng lợi từ những chỉnh sửa hữu ích do các nhà phát triển bên ngoài thực hiện khi sử dụng mô hình này trong các ứng dụng của riêng mình.
Các nhà nghiên cứu cho biết các mô hình được phát hành theo giấy phép nguồn mở thông thường, như GPT Neo từ tổ chức phi lợi nhuận EleutherAI, sẽ mở hoàn toàn hơn. Nhưng thật khó để những dự án như vậy có được sự bình đẳng.
Đầu tiên, dữ liệu cần thiết để đào tạo các mô hình tiên tiến thường được giữ bí mật. Thứ hai, các khung phần mềm cần thiết để xây dựng các mô hình như vậy thường được kiểm soát bởi các tập đoàn lớn. Hai cái phổ biến nhất, TensorFlow và Pytorch, lần lượt được duy trì bởi Google và Meta. Thứ ba, sức mạnh máy tính cần thiết để đào tạo một mô hình lớn cũng nằm ngoài tầm với của bất kỳ nhà phát triển hoặc công ty bình thường nào, thường cần hàng chục hoặc hàng trăm triệu đô la cho một lần đào tạo. Và cuối cùng, lao động con người cần thiết để hoàn thiện và cải tiến các mô hình này cũng là nguồn lực hầu như chỉ dành cho các công ty lớn có túi tiền dồi dào.
Tham khảo bài viết gốc tại đây:
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top