Tại sao Google Gemini lại không được các nhà phát triển ưa chuộng?

Hoàng Nam

Writer
Theo báo cáo của các phương tiện truyền thông nước ngoài, Google đã đầu tư rất mạnh cho các mô hình ngôn ngữ lớn, nhưng Gemini vẫn phải đối mặt với thách thức kép là hoạt động phức tạp và xu hướng lựa chọn sản phẩm đối thủ của các nhà phát triển. Những vấn đề này có thể ảnh hưởng đến dịch vụ đám mây và hoạt động kinh doanh trí tuệ nhân tạo của hãng. Sự tăng trưởng phải trả giá. Gemini đã đạt được một số tiến bộ kể từ khi phát hành, nhưng vẫn còn một khoảng cách đáng kể so với các đối thủ như OpenAI về độ tin cậy và thị phần.

Một số nhà phát triển và nhân viên Google đã phàn nàn rằng trí tuệ nhân tạo đàm thoại Gemini của Google quá phức tạp để sử dụng so với các công nghệ cạnh tranh. Trong số các nhà phát triển phàn nàn về Gemini có Aidan McLaughlin, người sáng lập công ty khởi nghiệp Topology. Công ty phát triển phần mềm để cải thiện khả năng suy luận của các mô hình trí tuệ nhân tạo hiện có.
1726647858999.png

Anh cho biết, lần đầu thử sử dụng API của OpenAI chỉ mất 30 giây nhưng với Gemini phải mất tới 4 tiếng vì Google yêu cầu anh phải lập tài khoản cloud và thực hiện rất nhiều cấu hình. Ngoài ra, các lỗ hổng trong hệ thống của Google đôi khi buộc anh phải quay lại. McLaughlin cho biết: "Nếu mô hình do Google cung cấp khả năng vượt trội đáng kể so với các mô hình do OpenAI và Anthropic, tôi sẵn sàng vượt qua tất cả những khó khăn này. Điều quan trọng nhất trên thế giới là chất lượng của mô hình, ngoại trừ một số trường hợp đặc biệt, mô hình của Google dường như được xếp thứ ba”.

Những khó khăn mà các nhà phát triển gặp phải khi sử dụng Gemini có thể ảnh hưởng đến hoạt động kinh doanh trên nền tảng đám mây của Google, vì Google hy vọng sử dụng Gemini để thu hút nhiều khách hàng hơn đến với hoạt động kinh doanh cho thuê máy chủ. Ngoài ra, một số nhân viên của Google cho rằng điều này cũng có thể gây ra những vấn đề tiềm ẩn cho sự phát triển trí tuệ nhân tạo của chính Google. Bằng cách thu hút hàng triệu người dùng trả tiền mua các mô hình trí tuệ nhân tạo hoặc sử dụng ChatGPT, OpenAI nhận được một lượng lớn phản hồi ngầm và rõ ràng về hiệu suất của trí tuệ nhân tạo, cho phép cải thiện hơn nữa các mô hình. Nếu Gemini của Google không có cùng mức độ sử dụng, công ty có thể sử dụng lộ trình mơ hồ hơn cho những cải tiến tương tự.

Gemini cũng đóng vai trò quan trọng trong việc phát triển các sản phẩm quảng cáo và tiêu dùng của Google, vốn yêu cầu tìm kiếm câu trả lời đàm thoại và trợ lý giọng nói. Bindu Reddy, Giám đốc điều hành của Abacus AI cho biết: “Việc các nhà phát triển sử dụng Gemini để giải quyết các vấn đề phức tạp trong thế giới thực là phản hồi quan trọng đối với thế hệ Gemini tiếp theo”. Phần mềm của công ty giúp các nhà phát triển xây dựng các ứng dụng trí tuệ nhân tạo. Cô nói: “Bạn càng có nhiều phản hồi thì càng tốt”.

Mặc dù Gemini đã được cải thiện rất nhiều trong năm nay nhưng nó vẫn không đáng tin cậy bằng các mô hình cạnh tranh khi cung cấp năng lượng cho các ứng dụng thương mại của trí tuệ nhân tạo. Người phát ngôn của Google cho biết phản hồi của nhà phát triển rất quan trọng trong việc cải thiện mô hình Gemini, nhưng đó không phải là nguồn dữ liệu duy nhất. Một số nhà nghiên cứu AI cũng cho biết có thể đạt được những cải tiến lớn bằng cách dạy AI học hỏi từ các chuyên gia con người trong nhiều lĩnh vực khác nhau.

Các nhà phát triển nhỏ và công ty lớn áp dụng các mô hình ngôn ngữ lớn như GPT-4 của OpenAI để phát triển các ứng dụng có thể tự động hóa mọi thứ từ dịch vụ khách hàng và phân tích dữ liệu đến phát hiện gian lận và tạo mã máy tính. OpenAI và Microsoft mỗi bên kiếm được khoảng 100 triệu USD mỗi tháng bằng cách cung cấp dịch vụ mô hình ngôn ngữ lớn cho các nhà phát triển. Những nhà phát triển này bao gồm các công ty thương mại định lượng như Jane Street, các ngân hàng như Morgan Stanley và các công ty công nghệ tài chính như Stripe.

Google cũng liệt kê một số khách hàng của Gemini, bao gồm Mercedes-Benz, Goldman Sachs và Uber. Các công ty cho biết họ sử dụng trí tuệ nhân tạo để cung cấp mọi thứ từ dịch vụ khách hàng đến hỗ trợ mã hóa, mặc dù chưa rõ mức độ mua hàng (Google trước đây đặt mục tiêu ra mắt dịch vụ đám mây AI ở Bắc Mỹ trong năm nay có doanh thu 1 tỷ USD), nhưng nó bán nhiều dịch vụ AI hơn là chỉ các mô hình ngôn ngữ lớn.

Sundar Pichai, Giám đốc điều hành của Alphabet, công ty mẹ của Google, cho biết trong cuộc họp báo cáo thu nhập quý 2 vào tháng 7/2024 rằng hơn 2 triệu nhà phát triển đã sử dụng Gemini kể từ đầu năm, nhưng hiện tại vẫn chưa rõ liệu con số này có bao gồm các nhà phát triển chỉ dùng thử mô hình hay không.

So với các mô hình của OpenAI, việc Gemini không được các nhà phát triển ưa chuộng dường như là một bí mật mở trong ngành. Tuy nhiên, Gemini của Google vẫn tiếp tục đạt được tiến bộ và công ty đang tích cực thực hiện các bước để cải thiện hiệu suất và độ tin cậy nhằm nỗ lực duy trì tính cạnh tranh trong không gian AI.

Không có lợi thế cạnh tranh

Ví dụ: một cuộc khảo sát vào tháng 6 với hơn 750 nhân viên công nghệ của công ty khởi nghiệp phần mềm doanh nghiệp Retool cho thấy chỉ 2,6% số người được hỏi cho biết họ thường xuyên sử dụng Gemini để xây dựng các ứng dụng AI, trong khi 76% cho biết họ thường xuyên sử dụng ChatGPT của OpenAI. Gemini suýt vượt qua Claude của Anthropic, người nhận được 2,3% phiếu bầu. Nhưng điều đáng chú ý là mức sử dụng của Claude đã tăng hơn bốn lần kể từ báo cáo tháng 11/2023 của Retool. Gemini không có sẵn cho các nhà phát triển cho đến tháng 12 năm ngoái.

Similarweb, trang theo dõi lưu lượng truy cập trang web, cho biết trang dành cho nhà phát triển ứng dụng OpenAI đã nhận được 82,8 triệu lượt truy cập từ tháng 6 đến tháng 8, trong khi trang của Google chỉ có 8,4 triệu lượt xem trong cùng thời gian. Các cuộc khảo sát nhỏ hơn đã cung cấp bằng chứng tương tự. Cuối tháng trước, người sáng lập Finetune Julian Saks đã hỏi 50 nhà phát triển công ty khởi nghiệp AI tại không gian làm việc chung của ông ở San Francisco về những mô hình AI đàm thoại mà họ thường sử dụng nhất. Hầu hết tất cả họ đều cho biết họ chủ yếu sử dụng các mô hình từ Anthropic hoặc OpenAI, và không ai chủ yếu sử dụng Gemini. Sacks không ngạc nhiên với kết quả này. Anh nói: “Tôi cảm thấy Gemini không nổi bật so với những người mẫu khác khi nói đến vấn đề viết mã.

Google phải mất gần một năm và một cuộc tái tổ chức lớn để cho ra mắt một mô hình có thể cạnh tranh với bản phát hành GPT-4 của OpenAI vào đầu năm 2023. Google sẽ bắt đầu cấp cho các nhà phát triển quyền truy cập vào các mô hình Gemini vào tháng 12 năm 2023 và hiệu suất của chúng tương tự như các mô hình của OpenAI trong các đánh giá so sánh phổ biến.

Nhưng một số nhân viên của Google cho biết động thái đầu tiên của OpenAI đã giúp nó được các nhà phát triển công nhận thương hiệu. Anthropic, một công ty khởi nghiệp AI trẻ khác, đã tận hưởng làn sóng tiếp thị truyền miệng trong năm nay khi các nhà phát triển tạo dựng tên tuổi cho mình như một giải pháp thay thế cho OpenAI, đặc biệt là hỗ trợ mã hóa.

Rắc rối của nhà phát triển


Gemini dường như không thu hút được nhiều sự chú ý. Các nhà phát triển được khảo sát cho biết mô hình Gemini rất hữu ích khi phân tích các tài liệu hoặc cơ sở mã dài vì chúng có thể xử lý nhiều thông tin cùng một lúc hơn các mô hình khác. Nhưng họ cũng chỉ ra rằng Google cung cấp các tùy chọn sử dụng khó hiểu và nhiều bước so với các đối thủ cạnh tranh, đồng thời hệ thống nhà phát triển khác với OpenAI, khiến việc sử dụng các mô hình này trở nên khó khăn hơn.

Đôi khi, các tùy chọn khác nhau mà Google đưa ra để sử dụng Gemini thậm chí còn cạnh tranh với nhau trong kết quả tìm kiếm của chính Google. Trong một thời gian vào mùa xuân này, Vertex AI Studio—một dịch vụ mà Google quảng bá cho các doanh nghiệp lớn có thể muốn sử dụng Gemini—đã trở thành kết quả được tài trợ của Google AI Studio, một công cụ đơn giản hơn cho phép các nhà phát triển sử dụng Gemini.

Alex Atallah, cựu giám đốc công nghệ của OpenSea, cho biết: “Mọi người bối rối khi cố gắng tìm ra các lựa chọn. Anh ấy gặp phải những khó khăn tương tự khi cố gắng sử dụng Gemini cho công ty khởi nghiệp OpenRouter của mình, công ty sản xuất phần mềm dành cho các nhà phát triển làm việc với các mô hình ngôn ngữ lớn.

Mặc dù Google đã ra mắt dịch vụ AI Studio vào tháng 12 để giúp các nhà phát triển sử dụng Gemini dễ dàng hơn, nhưng họ phải sử dụng một phương thức gửi truy vấn khác với GPT và Claude, vốn có chung định dạng. McLaughlin cho biết sự khác biệt này khiến các nhà phát triển chuyển sang Gemini trở nên kém hấp dẫn hơn.

Song Tử thường bị chỉ trích trên mạng xã hội - đặc biệt là trên nền tảng mạng xã hội X. Brendan Dolan-Gavitt, một nhà nghiên cứu AI tại công ty khởi nghiệp bảo mật Xbow, đã đăng trên X vào đầu tháng này về hành trình của anh ấy thông qua Vertex, một ứng dụng phát triển ứng dụng AI khác của Google. Các bài đăng về nhiều bước cần thiết để sử dụng Gemini đã thu hút sự chú ý rộng rãi. Các nhà phát triển khác cũng đã tham gia vào hàng ngũ khiếu nại và bày tỏ sự không hài lòng với Google Gemini.

Thị phần đã ổn định

Google đang cố gắng thay đổi hình ảnh đó, kể cả trên X để đáp lại những lời chỉ trích của Gemini. Họ cũng tổ chức các sự kiện dành cho các nhà phát triển để quảng bá cho Gemini. Google cũng đang thử nghiệm các ưu đãi khác, chẳng hạn như tổ chức một cuộc thi dành cho nhà phát triển để xây dựng ứng dụng tốt nhất do Gemini cung cấp. Người chiến thắng đầu tiên sẽ nhận được một chiếc xe điện tùy chỉnh mang nhãn hiệu DeLorean với biển số "G3M1N1". Theo kế hoạch, Google sẽ công bố kết quả giải thưởng cuối cùng vào cuối năm nay.

Logan Kilpatrick, người làm việc trong bộ phận phát triển sản phẩm tại Google, tiết lộ rằng Google cũng đang xem xét việc hợp nhất các tính năng của một số sản phẩm xây dựng ứng dụng chồng chéo để giảm bớt sự nhầm lẫn giữa các nhà phát triển. “OpenAI cung cấp cho các nhà phát triển thứ gì đó hữu ích lâu hơn một chút, lâu hơn Google một chút, trong bối cảnh API mô hình ngôn ngữ lớn”, ông nói. “Chúng tôi phải đấu tranh chống lại thị phần vững chắc mà họ hiện có trong số các nhà phát triển”.

Tuần này, OpenAI đã ra mắt o1-preview, một mô hình suy luận hoạt động tốt hơn các mô hình ngôn ngữ lớn trong một số nhiệm vụ kỹ thuật hoặc phức tạp. Điều này có thể gây áp lực lên Google trong việc phát hành công nghệ tương tự hoặc có nguy cơ mất nhiều vị thế hơn trong dư luận nhà phát triển.

Dịch vụ “găng tay trắng”

Google đang tích cực phát triển phiên bản 2.0 của Gemini, nhằm đạt được chiến thắng kéo dài trong cuộc cạnh tranh trong lĩnh vực trí tuệ nhân tạo, hy vọng có thể bắt kịp hoặc thậm chí vượt qua công nghệ của OpenAI. Tuy nhiên, Gemini đã chiếm được cảm tình của một số người hâm mộ, đặc biệt là vì nó vượt trội hơn các mô hình khác về lượng thông tin mà nó có thể xử lý. Người sáng lập Starcycle Jaclyn Siu cho biết công ty của cô đang sử dụng Gemini 1.5 Pro, mô hình ngôn ngữ lớn tiên tiến nhất của Google dành cho các nhà phát triển, chủ yếu để trích xuất dữ liệu từ các tài liệu. Thomson Reuters cũng đang sử dụng Gemini để hỗ trợ các công cụ pháp lý có thể so sánh các văn bản pháp lý dài và xác định những điểm không nhất quán.

Đối với các công ty lớn hơn, khó khăn khi sử dụng Google AI không phải là trở ngại lớn. Fiona Tan, giám đốc công nghệ của Wayfair, tiết lộ rằng công ty thích thú với các dịch vụ "găng tay trắng" do nhân viên Google cung cấp, những người đang hỗ trợ công ty sử dụng Gemini để chuyển đổi cơ sở dữ liệu truyền thống sang định dạng thân thiện hơn với người dùng. Dịch vụ được gọi là “găng tay trắng” thường dùng để chỉ loại dịch vụ rất chu đáo, đòi hỏi sự quan tâm và chú ý đến từng chi tiết.

Tuy nhiên, một số nhà phát triển không có ý định dùng thử Gemini vì các giải pháp hiện có của họ đủ hiệu quả. Martyn Strydom, người đang phát triển một ứng dụng có tên Dots, lưu ý rằng công ty của ông thích sử dụng Claude làm trợ lý mã hóa và mô hình GPT cũ hơn của OpenAI để phản hồi khách hàng vì họ không có thời gian và liên tục thử nghiệm các mô hình ngôn ngữ khác nhau.

Ông nói: "Hiện tại, hầu hết mọi người đều đang sử dụng OpenAI, Claude hoặc Cursor. Nếu các kỹ sư hàng đầu trên thế giới đang sử dụng những công cụ này, tại sao chúng ta nên thử những công cụ khác?" Cursor là một công cụ trí tuệ nhân tạo được xem là một cuộc cách mạng hóa việc lập trình.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top