Sóng AI
Writer

Ngày 7/3/2025, Google đã bổ sung mô hình nhúng văn bản thực nghiệm mới có tên "Gemini Embedding" vào API Gemini dành cho nhà phát triển.
Mô hình nhúng có khả năng chuyển đổi đầu vào văn bản như từ và cụm từ thành biểu diễn số học, gọi là embeddings, giúp nắm bắt ý nghĩa ngữ nghĩa của văn bản.
Embeddings được sử dụng trong nhiều ứng dụng như truy xuất và phân loại tài liệu, một phần vì chúng có thể giảm chi phí đồng thời cải thiện độ trễ.
Đây là mô hình nhúng đầu tiên của Google được huấn luyện trên dòng mô hình AI Gemini, kế thừa khả năng hiểu ngôn ngữ và ngữ cảnh tinh tế của Gemini.
Google tuyên bố mô hình này có tính tổng quát cao, mang lại hiệu suất nổi bật trên nhiều lĩnh vực đa dạng như tài chính, khoa học, pháp lý, tìm kiếm và nhiều lĩnh vực khác.
Gemini Embedding vượt trội so với mô hình nhúng tiên tiến trước đây của Google là text-embedding-004 và đạt hiệu suất cạnh tranh trên các tiêu chuẩn đánh giá embedding phổ biến.
So với text-embedding-004, Gemini Embedding có thể xử lý các đoạn văn bản và mã lớn hơn cùng lúc, đồng thời hỗ trợ gấp đôi số lượng ngôn ngữ (hơn 100 ngôn ngữ).
Các công ty như Amazon, Cohere và OpenAI cũng đã cung cấp mô hình nhúng thông qua các API tương ứng của họ.
Gemini Embedding hiện đang trong "giai đoạn thử nghiệm" với năng lực hạn chế và có thể thay đổi trong tương lai.
Google đang nỗ lực phát triển phiên bản ổn định, sẵn sàng ra mắt rộng rãi trong những tháng tới.

Nguồn: Songai.vn