Sóng AI
Writer

Chatbot Arena ra mắt năm 2023, sáng lập bởi nhóm nghiên cứu liên kết UC Berkeley’s Sky Computing Lab, nhanh chóng trở thành công cụ đánh giá thực tế, toàn diện và có ảnh hưởng nhất cho các mô hình ngôn ngữ lớn (LLM).
Nền tảng cho phép người dùng toàn cầu trực tiếp so sánh mô hình AI qua hội thoại thực tế, bình chọn mô hình trả lời tốt hơn, và tổng hợp kết quả thành bảng xếp hạng.
Hiện có hơn 100 mô hình AI từ các tổ chức và cá nhân tham gia, bao gồm cả các tên tuổi lớn: OpenAI, Google, Meta, Anthropic.
Tổng cộng, Chatbot Arena đã ghi nhận gần 1.500.000 lượt bình chọn, với kết quả phân loại theo các tiêu chí như: viết code, xử lý truy vấn dài, toán học, “hard prompts”, đa ngôn ngữ (Anh, Pháp, Trung, Nhật, Tây Ban Nha...).
Chatbot Arena vừa chuyển thành công ty LMArena thuộc Arena Intelligence Inc., đồng sáng lập bởi Dimitris Angelopoulos, Wei-Lin Chiang và Ion Stoica. Được tài trợ bởi Google Kaggle, Andreessen Horowitz, Together AI...
Nền tảng được đánh giá cao nhờ tính khách quan, loại trừ thiên vị qua so sánh ẩn danh và hệ thống bình chọn cộng đồng, tạo điều kiện để các mô hình AI so tài công bằng.
Hai chế độ nổi bật: “Arena Battle” (người dùng nhập prompt, hai AI trả lời, bình chọn ẩn danh trước khi công bố tên mô hình), và “Side-by-side comparison” (chọn sẵn hai AI để đối chiếu).
Quy trình sử dụng đơn giản, chỉ cần truy cập https://arena.lmsys.org/, nhập prompt và bầu chọn mô hình trả lời tốt hơn; có thể bấm nút tạo lại nếu chưa hài lòng với kết quả.
Nền tảng vừa là công cụ nghiên cứu, vừa là “sân chơi” thử nghiệm cho nhà phát triển, nhà nghiên cứu và cộng đồng AI trên toàn thế giới.

Nguồn: Songai.vn