"Con gà tức nhau tiếng gáy": Google tung mô hình AI "mạnh nhất" quyết chiến ChatGPT và DeepSeek

A-Train The Seven
A-Train The Seven
Phản hồi: 0

A-Train The Seven

...'cause for once, I didn't hate myself.
Vào thứ Tư, Google đã phát hành Gemini 2.0 - bộ mô hình trí tuệ nhân tạo (AI) "mạnh mẽ nhất" của hãng đến nay - cho tất cả mọi người. Vào tháng 12, công ty đã cấp quyền truy cập cho các nhà phát triển và người thử nghiệm đáng tin cậy, cũng như tích hợp một số tính năng vào các sản phẩm của Google, nhưng đây là "bản phát hành chung", theo Google.

Bộ mô hình này bao gồm 2.0 Flash, được coi là "mô hình ngựa thồ, tối ưu cho các tác vụ khối lượng lớn, tần suất cao trên quy mô lớn", cũng như 2.0 Pro Experimental cho hiệu suất lập trình và 2.0 Flash-Lite, mà công ty gọi là "mô hình tiết kiệm chi phí nhất của chúng tôi". Gemini Flash có giá 10 xu cho mỗi triệu token cho đầu vào văn bản, hình ảnh và video. Trong khi phiên bản tiết kiệm chi phí hơn Flash-Lite có giá 0,75 xu cho cùng một lượng dữ liệu. Token đề cập đến từng đơn vị dữ liệu riêng lẻ mà mô hình xử lý.

Việc tiếp tục phát hành là một phần của chiến lược rộng lớn hơn của Google trong việc đầu tư mạnh vào các tác nhân AI khi cuộc chạy đua vũ trang AI nóng lên giữa các gã khổng lồ công nghệ và các công ty khởi nghiệp. Meta, Amazon, Microsoft, OpenAI và Anthropic cũng đang hướng tới AI tác nhân, hoặc các mô hình có thể hoàn thành các tác vụ phức tạp nhiều bước thay cho người dùng, thay vì người dùng phải hướng dẫn chúng qua từng bước riêng lẻ.

1738815759067.png


"Trong năm qua, chúng tôi đã đầu tư vào việc phát triển các mô hình tác nhân hơn, có nghĩa là chúng có thể hiểu nhiều hơn về thế giới xung quanh bạn, suy nghĩ trước nhiều bước và hành động thay mặt bạn, dưới sự giám sát của bạn", Google viết trong một bài đăng trên blog vào tháng 12, đồng thời cho biết thêm rằng Gemini 2.0 có "những tiến bộ mới trong đa phương thức - như đầu ra hình ảnh và âm thanh gốc - và sử dụng công cụ gốc" và rằng họ mô hình "sẽ cho phép chúng tôi xây dựng các tác nhân AI mới đưa chúng ta đến gần hơn với tầm nhìn về một trợ lý toàn năng".

Anthropic, công ty khởi nghiệp AI được Amazon hậu thuẫn do các cựu giám đốc nghiên cứu của OpenAI thành lập, là một đối thủ cạnh tranh chính trong cuộc đua phát triển các tác nhân AI. Vào tháng 10, Anthropic cho biết các tác nhân AI của họ có thể sử dụng máy tính giống như con người để hoàn thành các tác vụ phức tạp. Khả năng sử dụng máy tính của Anthropic cho phép công nghệ của nó diễn giải những gì trên màn hình máy tính, chọn các nút, nhập văn bản, điều hướng các trang web và thực hiện các tác vụ thông qua bất kỳ phần mềm và trình duyệt web thời gian thực nào, công ty khởi nghiệp cho biết.

1738815807667.png


Công cụ này có thể "sử dụng máy tính về cơ bản giống như cách chúng ta làm", giám đốc khoa học Jared Kaplan của Anthropic, nói với CNBC trong một cuộc phỏng vấn vào thời điểm đó. Ông cho biết nó có thể thực hiện các tác vụ với "hàng chục hoặc thậm chí hàng trăm bước". OpenAI đã phát hành một tính năng tương tự gần đây có tên Operator sẽ tự động hóa các tác vụ như lên kế hoạch cho kỳ nghỉ, điền vào biểu mẫu, đặt chỗ nhà hàng và đặt hàng tạp hóa. Công ty khởi nghiệp được Microsoft hậu thuẫn đã mô tả Operator là "một tác nhân có thể lên mạng để thực hiện các tác vụ cho bạn".

Đầu tuần này, OpenAI đã giới thiệu Deep Research, cho phép một tác nhân AI tổng hợp các báo cáo nghiên cứu phức tạp và phân tích các câu hỏi và chủ đề mà người dùng lựa chọn. Vào tháng 12, Google đã ra mắt một công cụ tương tự có cùng tên - Deep Research - hoạt động như một "trợ lý nghiên cứu, khám phá các chủ đề phức tạp và tổng hợp các báo cáo thay mặt bạn".

"Trong lịch sử, bạn không nhất thiết phải là người đầu tiên, nhưng bạn phải thực hiện tốt và thực sự là sản phẩm tốt nhất trong phân khúc",
CEO Sundar Pichai cho biết trong một cuộc họp chiến lược vào thời điểm đó. "Tôi nghĩ đó là tất cả những gì năm 2025 hướng tới".
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top