Dũng Đỗ
Writer
Google vừa chính thức giới thiệu Gemma 3, thế hệ tiếp theo của dòng mô hình AI nguồn mở Gemma, được xây dựng dựa trên cùng một nghiên cứu và công nghệ đã tạo ra Gemini 2.0. Điểm nổi bật của Gemma 3 là sự kết hợp giữa hiệu năng mạnh mẽ và kích thước nhỏ gọn, cho phép mô hình này hoạt động trên nhiều loại thiết bị, từ điện thoại thông minh đến máy trạm.
Gemma 3: 'Siêu Nhẹ' Nhưng Không Hề Yếu
Google nhấn mạnh Gemma 3 là một tập hợp các mô hình nguồn mở "nhẹ" (lightweight) và "hiện đại" (state-of-the-art). Điều này có nghĩa là Gemma 3 được thiết kế để tối ưu hóa hiệu suất và hiệu quả, có thể chạy trên các thiết bị có cấu hình phần cứng khiêm tốn, như điện thoại, máy tính xách tay, hoặc thậm chí chỉ cần một bộ xử lý đồ họa (GPU) hoặc bộ xử lý tensor (TPU).
CEO Sundar Pichai của Google cho biết: "Các mô hình nguồn mở mới của chúng tôi cực kỳ hiệu quả, như mô hình 27B lớn nhất chỉ chạy trên một GPU H100. Bạn sẽ cần khả năng tính toán ít nhất gấp 10 lần để có được hiệu suất tương tự từ các mô hình khác."
Đa Dạng Phiên Bản, Đáp Ứng Mọi Nhu Cầu
Gemma 3 được phát hành với nhiều phiên bản khác nhau, với số lượng tham số (biểu thị độ phức tạp và khả năng của mô hình) khác nhau:
Khả Năng Đa Phương Thức, Hỗ Trợ Nhiều Ngôn Ngữ
Gemma 3 không chỉ xử lý văn bản, mà còn có khả năng phân tích hình ảnh và video ngắn. Mô hình này hỗ trợ hơn 35 ngôn ngữ, và đã được đào tạo trước (pre-trained) trên hơn 140 ngôn ngữ.
Google tự tin khẳng định Gemma 3 vượt trội hơn các mô hình AI nguồn mở khác như Meta Platforms Llama-405B, DeepSeek V3 và o3-mini của OpenAI trong các bài đánh giá ban đầu trên LMArena (một nền tảng đánh giá hiệu năng của các mô hình AI). Trong bảng xếp hạng này, chỉ có mô hình R1 của DeepSeek là có điểm số cao hơn Gemma 3.
Cùng với Gemma 3, Google cũng ra mắt ShieldGemma 2, một công cụ kiểm tra độ an toàn của hình ảnh, được xây dựng dựa trên nền tảng Gemma 3. ShieldGemma 2 (phiên bản 4B) có thể phân loại hình ảnh thành ba loại: nội dung nguy hiểm, nội dung khiêu *** và bạo lực.
Việc ra mắt Gemma 3 cho thấy Google đang đẩy mạnh phát triển AI nguồn mở, cung cấp cho các nhà phát triển những công cụ mạnh mẽ và linh hoạt để xây dựng các ứng dụng AI. Với hiệu năng cao, kích thước nhỏ gọn, khả năng đa phương thức và hỗ trợ nhiều ngôn ngữ, Gemma 3 hứa hẹn sẽ mở ra nhiều cơ hội mới cho việc ứng dụng AI trong nhiều lĩnh vực khác nhau.

Gemma 3: 'Siêu Nhẹ' Nhưng Không Hề Yếu
Google nhấn mạnh Gemma 3 là một tập hợp các mô hình nguồn mở "nhẹ" (lightweight) và "hiện đại" (state-of-the-art). Điều này có nghĩa là Gemma 3 được thiết kế để tối ưu hóa hiệu suất và hiệu quả, có thể chạy trên các thiết bị có cấu hình phần cứng khiêm tốn, như điện thoại, máy tính xách tay, hoặc thậm chí chỉ cần một bộ xử lý đồ họa (GPU) hoặc bộ xử lý tensor (TPU).

CEO Sundar Pichai của Google cho biết: "Các mô hình nguồn mở mới của chúng tôi cực kỳ hiệu quả, như mô hình 27B lớn nhất chỉ chạy trên một GPU H100. Bạn sẽ cần khả năng tính toán ít nhất gấp 10 lần để có được hiệu suất tương tự từ các mô hình khác."
Đa Dạng Phiên Bản, Đáp Ứng Mọi Nhu Cầu
Gemma 3 được phát hành với nhiều phiên bản khác nhau, với số lượng tham số (biểu thị độ phức tạp và khả năng của mô hình) khác nhau:
- 1B (1 tỷ tham số)
- 4B (4 tỷ tham số)
- 12B (12 tỷ tham số)
- 27B (27 tỷ tham số)

Khả Năng Đa Phương Thức, Hỗ Trợ Nhiều Ngôn Ngữ
Gemma 3 không chỉ xử lý văn bản, mà còn có khả năng phân tích hình ảnh và video ngắn. Mô hình này hỗ trợ hơn 35 ngôn ngữ, và đã được đào tạo trước (pre-trained) trên hơn 140 ngôn ngữ.
Google tự tin khẳng định Gemma 3 vượt trội hơn các mô hình AI nguồn mở khác như Meta Platforms Llama-405B, DeepSeek V3 và o3-mini của OpenAI trong các bài đánh giá ban đầu trên LMArena (một nền tảng đánh giá hiệu năng của các mô hình AI). Trong bảng xếp hạng này, chỉ có mô hình R1 của DeepSeek là có điểm số cao hơn Gemma 3.
Cùng với Gemma 3, Google cũng ra mắt ShieldGemma 2, một công cụ kiểm tra độ an toàn của hình ảnh, được xây dựng dựa trên nền tảng Gemma 3. ShieldGemma 2 (phiên bản 4B) có thể phân loại hình ảnh thành ba loại: nội dung nguy hiểm, nội dung khiêu *** và bạo lực.
Việc ra mắt Gemma 3 cho thấy Google đang đẩy mạnh phát triển AI nguồn mở, cung cấp cho các nhà phát triển những công cụ mạnh mẽ và linh hoạt để xây dựng các ứng dụng AI. Với hiệu năng cao, kích thước nhỏ gọn, khả năng đa phương thức và hỗ trợ nhiều ngôn ngữ, Gemma 3 hứa hẹn sẽ mở ra nhiều cơ hội mới cho việc ứng dụng AI trong nhiều lĩnh vực khác nhau.