OpenAI ra mắt GPT-4o: Chatbot "toàn năng" xử lý được cả giọng nói và hình ảnh, người dùng miễn phí cũng được sử dụng

Mẫn Nhi

Admin xinh gái
Thành viên BQT
Hôm thứ Hai, OpenAI công bố mô hình ngôn ngữ lớn trí tuệ nhân tạo mới nhất của mình, được cho là sẽ làm cho ChatGPT thông minh hơn và dễ sử dụng hơn.

Mô hình mới, được gọi là GPT-4o, là bản cập nhật từ mô hình GPT-4 trước đó của công ty, ra mắt chỉ hơn một năm trước. Mô hình này sẽ có sẵn cho khách hàng không trả phí, nghĩa là bất kỳ ai cũng có thể truy cập công nghệ tiên tiến nhất của OpenAI thông qua ChatGPT.

Dựa trên buổi trình diễn hôm thứ Hai của công ty, GPT-4o sẽ biến ChatGPT thành một trợ lý cá nhân kỹ thuật số có thể tham gia vào các cuộc trò chuyện bằng lời nói theo thời gian thực. Nó cũng sẽ có thể tương tác bằng văn bản và "hình ảnh", nghĩa là nó có thể xem ảnh chụp màn hình, ảnh, tài liệu hoặc biểu đồ do người dùng tải lên và trò chuyện về chúng.

1715650696599.png


Giám đốc Công nghệ của OpenAI, Mira Murati, cho biết phiên bản cập nhật của ChatGPT giờ đây cũng sẽ có khả năng ghi nhớ, nghĩa là nó có thể học hỏi từ các cuộc trò chuyện trước đó với người dùng và có thể dịch thuật theo thời gian thực.

"Đây là lần đầu tiên chúng tôi thực sự tiến một bước lớn về tính dễ sử dụng," Murati cho biết trong buổi giới thiệu trực tiếp từ trụ sở của công ty ở San Francisco. "Sự tương tác này trở nên tự nhiên hơn và dễ dàng hơn rất nhiều."

Phiên bản mới ra mắt khi OpenAI tìm cách giữ vị trí dẫn đầu trong cuộc cạnh tranh ngày càng tăng trong cuộc đua vũ trang AI. Các đối thủ bao gồm Google và Meta đã và đang nỗ lực xây dựng các mô hình ngôn ngữ lớn ngày càng mạnh mẽ, cung cấp năng lượng cho chatbot và có thể được sử dụng để đưa công nghệ AI vào nhiều sản phẩm khác.

Sự kiện của OpenAI diễn ra một ngày trước hội nghị nhà phát triển I/O thường niên của Google, tại đó dự kiến sẽ công bố các bản cập nhật cho mô hình AI Gemini của mình. Giống như GPT-4o mới, Gemini của Google cũng đa phương thức, nghĩa là nó có thể diễn giải và tạo văn bản, hình ảnh và âm thanh. Bản cập nhật của OpenAI cũng diễn ra trước các thông báo về AI dự kiến từ Apple tại Hội nghị các nhà phát triển toàn cầu vào tháng tới, có thể bao gồm các cách thức mới để tích hợp AI vào iPhone hoặc iOS tiếp theo.

Trong khi đó, bản phát hành GPT mới nhất có thể là một lợi ích cho Microsoft, công ty đã đầu tư hàng tỷ đô la vào OpenAI để nhúng công nghệ AI của mình vào các sản phẩm của chính Microsoft.

Các giám đốc điều hành của OpenAI đã trình diễn một cuộc trò chuyện bằng lời nói với ChatGPT để nhận hướng dẫn theo thời gian thực về cách giải một bài toán, kể chuyện trước khi đi ngủ và nhận lời khuyên về mã hóa. ChatGPT có thể nói bằng giọng tự nhiên, giống người cũng như giọng robot - và thậm chí còn hát một phần câu trả lời. Công cụ này cũng có thể xem hình ảnh của biểu đồ và thảo luận về nó.

Họ cũng cho thấy mô hình phát hiện cảm xúc của người dùng; trong một trường hợp, nó lắng nghe hơi thở của một giám đốc điều hành và khuyến khích anh ta bình tĩnh lại.

"Anh không phải là máy hút bụi!" giọng nữ của ChatGPT (nghe rất giống giọng của Scarlett Johansson trong bộ phim "Her" năm 2013) nói đùa với nhân viên.

1715650717751.png


ChatGPT cũng có thể trò chuyện bằng nhiều ngôn ngữ bằng cách dịch và trả lời tự động. Theo OpenAI, công cụ này hiện hỗ trợ hơn 50 ngôn ngữ.

"Chế độ thoại (và video) mới là giao diện máy tính tốt nhất mà tôi từng sử dụng," Giám đốc điều hành OpenAI, Sam Altman, cho biết trong một bài đăng trên blog sau thông báo. "Nó giống như AI từ trong phim vậy; và tôi vẫn hơi ngạc nhiên khi nó có thật. Việc đạt được thời gian phản hồi và khả năng biểu đạt ở cấp độ con người hóa ra lại là một thay đổi lớn."

Murati cho biết OpenAI sẽ ra mắt ứng dụng ChatGPT trên máy tính để bàn với các tính năng của GPT-4o, mang đến cho người dùng một nền tảng khác để tương tác với công nghệ của công ty. GPT-4o cũng sẽ có sẵn cho các nhà phát triển muốn xây dựng chatbot tùy chỉnh của riêng họ từ cửa hàng GPT của OpenAI, một tính năng hiện cũng sẽ có sẵn cho người dùng không trả phí.

Công nghệ và tính năng được cập nhật sẽ được triển khai cho ChatGPT trong những tháng tới. Người dùng ChatGPT miễn phí sẽ có số lượng tương tác hạn chế với mô hình GPT-4o mới trước khi công cụ tự động hoàn nguyên về dựa vào mô hình GPT-3.5 cũ; người dùng trả phí sẽ có quyền truy cập vào số lượng tin nhắn lớn hơn với mô hình mới nhất.

OpenAI cho biết hơn 100 triệu người đã đang sử dụng ChatGPT. Tuy nhiên, trải nghiệm ChatGPT được cập nhật - và khả năng tương tác với nó trên máy tính để bàn và thông qua các cuộc trò chuyện bằng giọng nói được cải thiện - có thể mang đến cho nhiều người hơn lý do để sử dụng công nghệ của nó. Động thái này diễn ra vào thời điểm tích hợp AI vào các sản phẩm tiêu dùng được sử dụng rộng rãi hơn của Google và Meta, như Instagram và Google Assistant, có thể khiến công nghệ của các công ty này trở nên dễ tiếp cận và sử dụng rộng rãi hơn.
#chatGPT #OpenAI #GPT4o #Trítuệnhântạo #GPT4otoàntri
 


Đăng nhập một lần thảo luận tẹt ga

Gợi ý cộng đồng

Top