Mình bị choáng ngợp với loạt công cụ AI vừa được Google ra mắt tại sự kiện Google I/O 2024

Vào sáng ngày 15/5/2024, Google đã công bố hàng loạt cải tiến vượt trội của Gemini, các tính năng mới của công cụ tìm kiếm và khả năng tích hợp với các ứng dụng dành cho công việc khác.

1715849637178.png

Gemini Nano giúp nhà sáng tạo nội dung xử lý công việc nhanh hơn​

Theo công bố từ Google, trình duyệt Chrome dành cho máy tính từ phiên bản 126 trở lên sẽ được tích hợp trợ lý AI Gemini Nano. Được biết, Gemini Nano là mô hình ngôn ngữ lớn nhẹ hơn so với mô hình được tích hợp vào Pixel 8 và 8 Pro. Để tích hợp vào Chrome, hãng đã tuỳ chỉnh và tối ưu để quá trình vận hành trở nên mượt mà hơn. Với Gemini Nano, các nhà sáng tạo nội dung có thể thực hiện nhanh chóng các thao tác như viết bài đánh giá sản phẩm – dịch vụ, đăng bài trên mạng xã hội và các nội dung khác.

Ra mắt tính năng Gemini Live​

Chưa hết, Google cũng công bố tính năng Gemini Live sẽ giúp giọng nói của Gemini trở nên tự nhiên và có tính cá nhân hoá hơn. Gemini Live sẽ thích ứng với cách nói chuyện của người dùng và đưa ra những câu trả lời mang tính trò chuyện và ngắn gọn hơn so với trước đây. Gemini Live cũng sẽ đi kèm với 10 tuỳ chọn giọng nói khác nhau. Với Gemini Live, người dùng có thể sử dụng công cụ này như một trợ lý cá nhân kỹ thuật số để cập nhật thông tin hoặc thông báo nhắc nhở.

1715849720941.png

Google công bố bổ sung tính năng Gemini Live (Nguồn: Google)

Google Search tích hợp “AI Overviews”​

Cụ thể hơn, với “AI Overviews” (tên gọi cũ là “Search Generative Experience”) thì khi người dùng thực hiện tìm kiếm, trang kết quả tìm kiếm sẽ có một bản tóm tắt xuất hiện ở trên cùng, tương tự như công cụ tìm kiếm AI Perplexity hoặc Arc Search. Theo Liz Reid – Head of Search @ Google, khi tích hợp trí tuệ nhân tạo tạo sinh thì Google có thể giúp quá trình tìm kiếm trở nên dễ dàng hơn, khi mà người dùng có thể tập trung vào những thứ họ muốn tìm hoặc khám phá thêm.

1715849794095.png

Tính năng "Ask Photos"​

Sắp tới đây, với tính năng “Ask Photos" của Gemini tích hợp vào Google Photos, người dùng có thể đặt ra những câu hỏi phức tạp liên quan đến hình ảnh trong thư viện ảnh, chứ không chỉ đơn giản như là tìm kiếm và sắp xếp hình ảnh có mặt thú cưng. Tại sự kiện, ông Sundar Pichai – CEO của Google đã thử nghiệm tính năng này bằng cách hỏi Gemini rằng biển số xe của ông là bao nhiêu. Kết quả là Gemini đã đưa ra câu trả lời đúng, kèm theo bức ảnh có chứa biển số xe của ông.

1715849865799.png

Ông Sundar Pichai – CEO của Google thử nghiệm tính năng “Ask Photos" tại sự kiện (Nguồn: Google)

Ra mắt Gemini 1.5 Pro​

Google cũng triển khai thêm mô hình ngôn ngữ Gemini 1.5 Pro (được xem là phiên bản phức tạp hơn của Gemini 1.5 Flash) để tích hợp vào thanh bên của các ứng dụng công việc như Docs, Sheets, Slides, Drive và Gmail. Vào tháng tới, những người dùng trả phí có thể tận dụng Gemini 1.5 Pro như một trợ lý đa năng trong các tác vụ công việc hàng ngày, chẳng hạn như soạn thảo email dựa trên các tài liệu người dùng đang xem.

1715849932959.png

Veo - công cụ tạo video bằng AI​

Google cũng thông báo ra mắt công cụ trí tuệ nhân tạo tạo sinh Veo, nhằm giúp người dùng có thể dễ dàng tạo ra video có độ phân giải cao, với nhiều phong cách hình ảnh và điện ảnh. Người dùng có thể điều chỉnh chất lượng đầu ra bằng cách đưa ra câu lệnh dựa trên văn bản, hình ảnh và video. Google cho biết các video tạo ra có sự nhất quán và mạch lạc, đồng thời mô tả được chuyển động thực tế của con người, động vật và đồ vật trong suốt các khung hình.

Theo đó, Google đang có kế hoạch tích hợp Veo vào YouTube Short trong tương lai. Không chỉ vậy, hãng công nghệ này cũng có dự định giới thiệu Veo như một công cụ chuyên nghiệp dành cho các nhà làm phim.

1715849977718.png


1715850003103.png

Hình ảnh trích từ thử nghiệm tạo ra video chất lượng bằng công cụ Veo của Google (Nguồn: Google)
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top