Những điều cần biết về GPT-4o

Sử dụng chức năng
  1. Mục lục Xem nhanh
Mẫu trí tuệ nhân tạo (AI) mới nhất của OpenAI là GPT-4o hứa hẹn những cải tiến về khả năng văn bản, hình ảnh và âm thanh.

Dưới đây là những điều cần biết về việc ra mắt GPT-4o.

Trò chuyện bằng giọng nói được cải thiện​

Theo OpenAI, người dùng hiện có thể hiển thị nhiều ảnh của GPT-4o và trò chuyện với chatbot về hình ảnh đã tải lên.

Điều này có thể giúp học sinh giải quyết các vấn đề toán học theo cách của mình từng bước một. Một trong những phần minh họa được trình chiếu trong buổi ra mắt vào thứ Hai hướng dẫn người dùng giải một bài toán đơn giản mà không đưa ra bất kỳ câu trả lời nào.

Một video riêng do công ty giảng dạy trực tuyến Khan Academy đăng tải cho thấy mô hình mới có thể giúp dạy học sinh trong thời gian thực như thế nào. Học sinh này đã chia sẻ màn hình với cậu ấy cách giải quyết vấn đề trong thời gian thực khi chatbot hướng dẫn cậu giải quyết vấn đề đó.

Một mô hình nhanh hơn với khả năng được cải thiện​

Giám đốc Công nghệ OpenAI Murati cho biết hôm thứ Hai rằng GPT-4o cung cấp “trí thông minh ở cấp độ GPT-4” nhanh hơn và cải thiện khả năng của hệ thống trên văn bản, hình ảnh và âm thanh.

Cô nói: “Điều này thực sự đang chuyển mô hình sang tương lai của sự hợp tác, nơi mà sự tương tác này trở nên tự nhiên hơn và dễ dàng hơn rất nhiều”.

OpenAI cho biết mẫu mới của họ có thể “phản hồi âm thanh đầu vào chỉ trong 232 mili giây, trung bình là 320 mili giây”. Nó lưu ý rằng đây là khoảng thời gian tương đương để con người trả lời trong một cuộc trò chuyện.

1715656177951.png

Mẫu mới ra mắt hôm thứ Hai​

GPT-4o có sẵn bắt đầu từ thứ Hai cho tất cả người dùng chatbot ChatGPT AI của OpenAI, bao gồm cả những người đang sử dụng phiên bản miễn phí.

“Hôm nay, khả năng văn bản và hình ảnh của GPT-4o bắt đầu được triển khai trong ChatGPT. Chúng tôi đang cung cấp GPT-4o ở cấp độ miễn phí và cho người dùng Plus với giới hạn tin nhắn cao hơn tới 5 lần”, OpenAI viết trong bản cập nhật hôm thứ Hai.

Chế độ giọng nói mới sẽ ra mắt trong vài tuần tới cho người dùng ChatGPT Plus, Giám đốc điều hành OpenAI Sam Altman đã viết trên nền tảng xã hội X.

Mô hình này là chatbot 'đa phương thức'​

Altman cũng đăng trên X rằng mô hình này “có tính chất đa phương thức”, có nghĩa là mô hình có thể tạo nội dung và hiểu các lệnh thông qua giọng nói, văn bản hoặc hình ảnh.

Trong một bài đăng trên blog riêng, anh cho biết chế độ thoại và video mới “là giao diện máy tính tốt nhất” mà anh ấy từng sử dụng.

“Cảm giác giống như AI trong phim; và tôi vẫn hơi ngạc nhiên rằng nó là sự thật. Đạt được thời gian phản hồi và khả năng biểu đạt ở cấp độ con người hóa ra lại là một sự thay đổi lớn”, anhviết trong bài đăng hôm thứ Hai. #GPT4otoàntri
 


Đăng nhập một lần thảo luận tẹt ga
Top