GPT-4o là gì? mà giới công nghệ nói là OpenAI không chừa đường sống cho người khác?

Trung Đào

Writer
GPT-4o là chatbot AI mới của OpenAI vừa ra mắt sáng nay (giờ Việt Nam) cho phép mọi người tương tác bằng giọng nói hoặc video như một trợ lý cá nhân. GPT4o hỗ trợ dịch thuật thời gian thực bằng 50 ngôn ngữ, tăng cường khả năng giao tiếp.

1715654909303.png


Giám đốc Công nghệ OpenAi Mira Murati giới thiệu GPT-4o.

GPT-4o là bản cập nhật từ mẫu GPT-4 trước đó, còn "o" là "Omni" (chung), được ra mắt chỉ hơn một năm trước. Mô hình này sẽ có sẵn cho khách hàng chưa trả phí, nghĩa là bất kỳ ai cũng sẽ có quyền truy cập vào công nghệ tiên tiến nhất của OpenAI thông qua ChatGPT.

Dựa trên cuộc trình diễn hôm thứ Hai của công ty, GPT-4o sẽ biến ChatGPT thành một trợ lý cá nhân kỹ thuật số một cách hiệu quả có thể tham gia vào các cuộc trò chuyện bằng giọng nói trong thời gian thực. Nó cũng sẽ có thể tương tác bằng cách sử dụng văn bản và “tầm nhìn”, nghĩa là nó có thể xem ảnh chụp màn hình, ảnh, tài liệu hoặc biểu đồ do người dùng tải lên và trò chuyện về chúng.

Giám đốc công nghệ OpenAI Mira Murati cho biết phiên bản cập nhật của ChatGPT giờ đây cũng sẽ có khả năng ghi nhớ, nghĩa là nó có thể học hỏi từ các cuộc trò chuyện trước đó với người dùng và có thể dịch thuật theo thời gian thực.

Murati cho biết trong buổi demo trực tiếp từ trụ sở chính của công ty ở San Francisco: “Đây là lần đầu tiên chúng tôi thực sự đạt được một bước tiến lớn về tính dễ sử dụng”. “Sự tương tác này trở nên tự nhiên hơn và dễ dàng hơn rất nhiều.”

Bản phát hành mới được đưa ra khi OpenAI tìm cách đi trước sự cạnh tranh ngày càng tăng trong cuộc chạy đua vũ trang AI. Các đối thủ bao gồm Google và Meta đang nỗ lực xây dựng các mô hình ngôn ngữ lớn ngày càng mạnh mẽ để hỗ trợ chatbot và có thể được sử dụng để đưa công nghệ AI vào nhiều sản phẩm khác.

Sự kiện OpenAI diễn ra một ngày trước hội nghị nhà phát triển I/O hàng năm của Google, nơi dự kiến sẽ công bố các bản cập nhật cho mô hình Gemini AI của mình. Giống như GPT-4o mới, Gemini của Google cũng đa phương thức, nghĩa là nó có thể diễn giải và tạo văn bản, hình ảnh và âm thanh. Bản cập nhật của OpenAI cũng đi trước các thông báo về AI dự kiến từ Apple tại Hội nghị các nhà phát triển toàn cầu vào tháng tới, có thể bao gồm những cách mới để kết hợp AI vào các phiên bản iPhone hoặc iOS tiếp theo.

1715655272202.png


Trong khi đó, bản phát hành GPT mới nhất có thể mang lại lợi ích cho Microsoft, hãng đã đầu tư hàng tỷ đô la vào OpenAI để nhúng công nghệ AI vào các sản phẩm của chính Microsoft.

Murati cho biết OpenAI sẽ ra mắt ứng dụng máy tính để bàn ChatGPT với khả năng GPT-4o, mang đến cho người dùng một nền tảng khác để tương tác với công nghệ của công ty. GPT-4o cũng sẽ có sẵn cho các nhà phát triển muốn xây dựng chatbot tùy chỉnh của riêng họ từ cửa hàng GPT của OpenAI, một tính năng hiện cũng sẽ có sẵn cho người dùng không trả tiền.

Công nghệ và tính năng cập nhật sẽ được triển khai cho ChatGPT trong những tháng tới. Người dùng ChatGPT miễn phí sẽ có số lượng tương tác hạn chế với mô hình GPT-4o mới trước khi công cụ này tự động quay lại dựa trên mô hình GPT-3.5 cũ; người dùng trả phí sẽ có quyền truy cập vào số lượng tin nhắn lớn hơn với mẫu mới nhất.

OpenAI cho biết hơn 100 triệu người đã sử dụng ChatGPT. Tuy nhiên, trải nghiệm ChatGPT được cập nhật — và khả năng tương tác với nó trên máy tính để bàn và thông qua các cuộc trò chuyện bằng giọng nói được cải thiện — có thể khiến nhiều người có lý do hơn để sử dụng công nghệ của nó. Động thái này diễn ra vào thời điểm việc tích hợp AI vào các sản phẩm tiêu dùng được sử dụng rộng rãi hơn của Google và Meta, như Instagram và Google Assistant, có thể giúp công nghệ của các công ty đó được tiếp cận rộng rãi và dễ dàng hơn.

Với sự ra mắt của GPT-4o, các trợ lý cá nhân như Google Assistant, Apple Siri, Amazon Alexa chắc chắn bị lu mờ và buộc phải chạy theo cải tiến. #GPT4otoàntri
 


Đăng nhập một lần thảo luận tẹt ga
Top