Google chính thức ra mắt Gemini, mô hình AI được kỳ vọng sẽ hạ gục GPT-4

TienCM · 07/12/2023

Đúng một năm sau khi ChatGPT tạo ra làn sóng AI, Google vừa chính thức có câu trả lời bằng màn ra mắt Gemini.
Theo giám đốc điều hành Sundar Pichai, Gemini là sự khởi đầu cho một kỷ nguyên AI mới ở Google. Gemini là mô hình ngôn ngữ lớn (LLM) mới nhất của Google, được Sundar Pichai giới thiệu lần đầu tại hội nghị nhà phát triển I/O vào tháng 6 vừa qua và hiện đang ra mắt công chúng.

Google chính thức ra mắt Gemini, mô hình AI được kỳ vọng sẽ hạ gục GPT-4

Sundar Pichai và Giám đốc điều hành Google DeepMind, Demis Hassabis mô tả, đó là một bước tiến vượt bậc trong mô hình AI sẽ ảnh hưởng đến hầu hết các sản phẩm của Google.
Gemini không phải là một mô hình AI đơn lẻ. Có một phiên bản nhẹ hơn tên là Gemini Nano được thiết kế để chạy ngoại tuyến trên các thiết bị Android. Có một phiên bản mạnh mẽ hơn có tên Gemini Pro sẽ sớm hỗ trợ nhiều dịch vụ AI của Google và là xương sống của Bard kể từ hôm nay. Và có một mô hình thậm chí còn có khả năng cao hơn tên là Gemini Ultra, LLM mạnh nhất mà Google từng tạo ra và dường như được thiết kế chủ yếu cho các trung tâm dữ liệu và ứng dụng doanh nghiệp.
Theo trang TheVerge, Google hiện đang tung ra Gemini theo một số cách: Bard hiện được cung cấp bởi Gemini Pro và người dùng Pixel 8 Pro sẽ nhận được một số tính năng mới nhờ Gemini Nano. Gemini Ultra sẽ ra mắt vào năm tới. Các nhà phát triển và khách hàng doanh nghiệp sẽ có thể truy cập Gemini Pro thông qua Google Generative AI Studio hoặc Vertex AI trong Google Cloud bắt đầu từ ngày 13/12. Gemini hiện chỉ hỗ trợ tiếng Anh và các ngôn ngữ khác chắc chắn sẽ sớm ra mắt. Như Sundar Pichai cho biết mô hình LLM này cuối cùng sẽ được tích hợp vào công cụ tìm kiếm của Google, các sản phẩm quảng cáo, trình duyệt Chrome… trên toàn thế giới. Đó là tương lai của Google và sẽ không còn sớm nữa.
OpenAI đã ra mắt ChatGPT cách đây một năm. Sự thành công của ChatGPT đã đưa công ty OpenAI và sản phẩm này ngay lập tức trở thành những thứ lớn nhất trong lĩnh vực AI. Giờ đây, Google - công ty đã tự gọi mình là tổ chức “tiên phong AI” trong gần một thập kỷ vừa qua và bị muối mặt trước sự tiên phong của ChatGPT, cuối cùng đã sẵn sàng đáp trả.

Demis Hassabis, Giám đốc điều hành Google DeepMind cho biết Google đã phân tích và so sánh song song Gemini và GPT-4 của Open AI ở 32 điểm chuẩn từ những bài kiểm tra tổng thể đến những yếu tố như khả năng tạo mã Python thì Gemini đang dẫn trước ở 30 trên 32 điểm chuẩn.
Theo Demis Hassabis, so với GPT-4, ưu thế rõ rệt nhất của Gemini là khả năng hiểu và tương tác với video và âm thanh. Tuy vậy, Google chưa đào tạo các mô hình riêng biệt cho hình ảnh và giọng nói, như cách OpenAI đã tạo ra DALL-E và Whisper.
Hiện tại, các mô hình cơ bản nhất của Gemini là nhập văn bản và gửi văn bản, nhưng các mô hình mạnh mẽ hơn như Gemini Ultra có thể hoạt động với hình ảnh, video và âm thanh. Demis Hassabis cho biết theo thời gian, Gemini sẽ có nhiều giác quan hơn, nhận thức rõ hơn, chính xác và có căn cứ hơn.
Theo TheVerge, có vẻ Google coi việc viết mã (code) là một trong số ứng dụng hấp dẫn đối với Gemini. Hệ thống LLM này sử dụng một hệ thống tạo code mới có tên AlphaCode 2 hoạt động tốt hơn 85% số người tham gia cuộc thi viết code, tăng từ 50% đối với hệ thống AlphaCode ban đầu. Nhưng Sundar Pichai nói rằng người dùng sẽ nhận thấy sự cải thiện ở mọi thứ mà mô hình này hỗ trợ.
Gemini được đào tạo trên bộ xử lý Tensor của riêng Google và chạy nhanh hơn cũng như rẻ hơn so với các mô hình trước đây của Google như PaLM. Cùng với Gemini, Google cũng tung ra phiên bản mới của hệ thống TPU, TPU v5p, một hệ thống máy tính được thiết kế để sử dụng trong các trung tâm dữ liệu nhằm đào tạo và chạy các mô hình quy mô lớn.
Theo Sundar Pichai, Google coi việc ra mắt Gemini vừa là sự khởi đầu của một dự án lớn hơn vừa là một bước thay đổi của bản thân. Gemini là mô hình mà Google đã chờ đợi, mô hình mà họ đã hướng tới trong nhiều năm, thậm chí có thể là mô hình mà lẽ ra họ phải có trước khi OpenAI và ChatGPT thống trị thế giới.
Sau khi ChatGPT ra mắt và làm mưa làm gió lĩnh vực AI, Google đã kích hoạt chế độ “báo động đỏ” để chạy đua. Tuy nhiên, có vẻ như Google còn táo bạo hơn khi tham vọng tiến sớm đến giấc mơ AI cuối cùng: trí tuệ nhân tạo tổng quát (AGI), thuật ngữ chỉ AI có khả năng tự cải thiện, thông minh hơn con người và sẵn sàng thay đổi thế giới.
“Khi chúng tôi tiếp cận AGI, mọi thứ sẽ khác. Đó là một loại công nghệ tích cực, vì vậy tôi nghĩ chúng ta phải tiếp cận nó một cách thận trọng. Thận trọng nhưng lạc quan”, Demis Hassabis nói.

Google chính thức ra mắt Gemini, mô hình AI được kỳ vọng sẽ hạ gục GPT-4

Thanh Phong

Pearl

Thành viên mới đăng

Điện Máy Xanh đạt doanh thu và lợi nhuận kỷ lục, sẵn sàng “lên sàn” HOSE

Vì sao Trung Quốc chính thức "khai tử" đèn LED màu xanh trên xe điện?

Chính thức khởi động DENSO Factory Hacks 2026: Sân chơi giải bài toán nhà máy thông minh cho giới trẻ Việt

Nexon công bố vòng chung kết cuộc thi AI "NYPC 2026": nhiều đội Việt Nam giành vé đến Seoul

Hàng loạt đại học lớn ở Hàn Quốc hủy điểm thi vì sinh viên dùng AI gian lận, phải quay lại thi viết tay

Miệng nói "bóng đá không phải để bán", nhưng FIFA quyết tâm bán cổ phần thương mại World Cup

Ra mắt DUV tự làm, AI tiệm cận Mỹ và IPO chip nhớ: Đột phá dồn dập nhưng vì sao cổ phiếu công nghệ Trung Quốc vẫn đỏ sàn?

El Nino đợt này có thể mạnh nhất 150 năm qua: 2027 đối mặt nguy cơ thành năm nóng kỷ lục

Đánh giá nổi bật