ChatGPT nhận cập nhật lớn, giờ có thể trò chuyện, nhìn hình ảnh

Theo OpenAI, ChatGPT nay có thể tương tác bằng giọng nói, mô phỏng phong cách của năm nhân vật khác nhau. Điều đặc biệt là AI cũng có khả năng xử lý hình ảnh từ người dùng. OpenAI cho biết tính năng trò chuyện này là một bước tiến quan trọng để thu hút người dùng và khuyến khích việc sử dụng ChatGPT.
"Điều này thực sự là một thách thức lớn đối với chúng tôi", ông Peter Deng, Phó Chủ tịch phụ trách Sản phẩm Tiêu dùng của OpenAI, đã chia sẻ. "Một trong những nhiệm vụ khó khăn nhất chính là sử dụng công nghệ hiện tại để làm cho nó dễ tiếp cận hơn cho khoảng 300-400 triệu người tiếp theo".
Trong bản cập nhật mới, ChatGPT giờ đây có thể trò chuyện với người dùng bằng giọng nói, kể chuyện hoặc đọc to nội dung mà họ nhập bằng văn bản. Theo đánh giá của Washington Post sau khi thử nghiệm, các phản hồi của ChatGPT có "giọng điệu mang tính trò chuyện hơn so với những trợ lý ảo phổ biến như Google Assistant, Alexa hay Siri".
ChatGPT nhận cập nhật lớn, giờ có thể trò chuyện, nhìn hình ảnh
Trên blog vào ngày 25/9, OpenAI nhấn mạnh rằng tính năng trò chuyện mới đã "mở ra cánh cửa cho nhiều ứng dụng sáng tạo và tập trung vào khả năng tiếp cận".
Với tính năng xử lý hình ảnh, người dùng có thể chụp bất cứ thứ gì xung quanh và sau đó yêu cầu ChatGPT phân tích ảnh, giúp họ "khắc phục sự cố khi lò nướng không hoạt động, kiểm tra trong tủ lạnh còn gì để lên kế hoạch ăn, hoặc phân tích biểu đồ phức tạp liên quan đến công việc". Tính năng này tương tự như Google Lens của Alphabet.
Cập nhật mới của ChatGPT dự kiến sẽ được phát hành trong hai tuần tới, nhưng chỉ dành cho những người đăng ký gói Plus và Enterprise.
OpenAI đã được thành lập vào năm 2016, trong khi ChatGPT mới được giới thiệu cuối năm ngoái và đã nhanh chóng gây sốt với khả năng trả lời câu hỏi một cách tự nhiên. Bản cập nhật mới này được dự đoán sẽ gia tăng sức mạnh của AI này và đem lại sự cạnh tranh với những trợ lý ảo truyền thống.
"Việc bổ sung khả năng trò chuyện và xử lý hình ảnh đưa ChatGPT tiến xa trên con đường trở thành một mô hình đa phương thức thực sự: một chatbot có thể 'nhìn' và 'nghe' thế giới, cũng như phản hồi bằng giọng nói và hình ảnh cùng với văn bản", nhận xét của Washington Post. Trong khi đó, các nhà nghiên cứu về AI đánh giá rằng mô hình đa phương thức là giai đoạn cạnh tranh tiếp theo trong lĩnh vực trí tuệ nhân tạo, có thể được áp dụng rộng rãi trong cuộc sống hàng ngày, từ điện thoại thông minh, TV, xe hơi đến loa thông minh.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top