Trời ơi! GPT-4o đơn giản là quá mạnh!

Đoàn Thúy Hà

Editor
Thành viên BQT
GPT-4o ("o" là viết tắt của chung, toàn năng) có thể chấp nhận bất kỳ sự kết hợp nào của văn bản, âm thanh và hình ảnh làm đầu vào và tạo ra bất kỳ sự kết hợp nào giữa văn bản, âm thanh và hình ảnh đầu ra.

Nó có thể phản hồi âm thanh đầu vào trong 232 mili giây và trung bình là 320 mili giây, tương tự như thời gian phản hồi của con người trong cuộc trò chuyện.

Nó hoạt động ngang bằng với GPT-4 Turbo cho văn bản tiếng Anh và mã, với những cải tiến đáng kể cho văn bản không phải tiếng Anh. Đồng thời, API nhanh hơn và rẻ hơn 50%.

GPT-4o hoạt động đặc biệt tốt trong khả năng hiểu hình ảnh và âm thanh so với các mẫu hiện có. So với GPT-4 Turbo, GPT-4o nhanh hơn 2 lần, giá chỉ bằng một nửa và nhanh gấp 5 lần GPT-4 Turbo.

1715661024637.png


Các tính năng văn bản và hình ảnh của GPT-4o sẽ bắt đầu được triển khai trong ChatGPT ngay hôm nay. GPT-4o sẽ có sẵn ở phiên bản miễn phí, với giới hạn câu lệnh bằng 1/5 lần cho người dùng Plus.

Phiên bản mới của Chế độ giọng nói với GPT-4o sẽ được ra mắt trong ChatGPT Plus trong vài tuần tới. Giờ đây, các nhà phát triển cũng có thể truy cập GPT-4o dưới dạng mô hình văn bản và hình ảnh thông qua API. #GPT4otoàntri
 


Đăng nhập một lần thảo luận tẹt ga
Top