Google ra mắt mô hình nhúng văn bản Gemini vượt trội, hỗ trợ hơn 100 ngôn ngữ

Sóng AI
Sóng AI
Phản hồi: 0

Sóng AI

Writer
XrFQZWC1NWNnuaWpbOGR.webp


  • Ngày 7/3/2025, Google đã bổ sung mô hình nhúng văn bản thực nghiệm mới có tên "Gemini Embedding" vào API Gemini dành cho nhà phát triển.


  • Mô hình nhúng có khả năng chuyển đổi đầu vào văn bản như từ và cụm từ thành biểu diễn số học, gọi là embeddings, giúp nắm bắt ý nghĩa ngữ nghĩa của văn bản.


  • Embeddings được sử dụng trong nhiều ứng dụng như truy xuất và phân loại tài liệu, một phần vì chúng có thể giảm chi phí đồng thời cải thiện độ trễ.


  • Đây là mô hình nhúng đầu tiên của Google được huấn luyện trên dòng mô hình AI Gemini, kế thừa khả năng hiểu ngôn ngữ và ngữ cảnh tinh tế của Gemini.


  • Google tuyên bố mô hình này có tính tổng quát cao, mang lại hiệu suất nổi bật trên nhiều lĩnh vực đa dạng như tài chính, khoa học, pháp lý, tìm kiếm và nhiều lĩnh vực khác.


  • Gemini Embedding vượt trội so với mô hình nhúng tiên tiến trước đây của Google là text-embedding-004 và đạt hiệu suất cạnh tranh trên các tiêu chuẩn đánh giá embedding phổ biến.


  • So với text-embedding-004, Gemini Embedding có thể xử lý các đoạn văn bản và mã lớn hơn cùng lúc, đồng thời hỗ trợ gấp đôi số lượng ngôn ngữ (hơn 100 ngôn ngữ).


  • Các công ty như Amazon, Cohere và OpenAI cũng đã cung cấp mô hình nhúng thông qua các API tương ứng của họ.


  • Gemini Embedding hiện đang trong "giai đoạn thử nghiệm" với năng lực hạn chế và có thể thay đổi trong tương lai.


  • Google đang nỗ lực phát triển phiên bản ổn định, sẵn sàng ra mắt rộng rãi trong những tháng tới.

📌 Google vừa ra mắt Gemini Embedding, mô hình nhúng văn bản dựa trên nền tảng Gemini có khả năng xử lý nhiều ngôn ngữ hơn (100+) và đoạn văn bản lớn hơn, đồng thời vượt trội so với mô hình tiền nhiệm trong ứng dụng tài chính, khoa học và pháp lý.

Nguồn: Songai.vn
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top