Đó không phải là tìm kiếm, không phải GPT 5. Đây có phải là thứ OpenAI sẽ show vào thứ Hai tới không?

Sử dụng chức năng
  1. Mục lục Xem nhanh
  2. Nút xem thêm với bài dài
1715438883968.png


OpenAI sẽ ra mắt một sản phẩm hoàn toàn mới vào thứ Hai, ngày 13 tháng 5. Nhưng họ không nêu chính xác đó là dịch vụ gì, chỉ chắc chắn rằng công cụ tìm kiếm GPT-5 được cư dân mạng đồn đoán trước đó đã bị CEO OpenAI phủ nhận.

Sam Altman đã tweet: Đó không phải là GPT-5 và cũng không phải là công cụ tìm kiếm, nhưng chúng tôi luôn nỗ lực phát triển một số nội dung mới mà mọi người sẽ yêu thích! Đối với tôi, nó giống như phép thuật vậy.

1715438980984.png
Chính xác thì sản phẩm mới bí ẩn này là gì? Báo chí dẫn lời hai người quen thuộc với vấn đề này cho biết, sản phẩm mới là mô hình AI có chức năng thị giác, thính giác và có khả năng suy luận logic tốt hơn các chatbot hiện nay.

AI đa phương thức mới có thị giác và thính giác

Theo báo cáo, OpenAI có thể công khai trình diễn các sản phẩm mới ngay sau thứ Hai tới để đón đầu một loạt sản phẩm của Google được phát hành vào tuần tới.

Altman hy vọng cuối cùng sẽ phát triển được một trí tuệ nhân tạo có thể phản hồi nhanh chóng giống như trợ lý AI trong phim “Her” và sử dụng công nghệ này để hỗ trợ các trợ lý giọng nói hiện có như Siri của Apple.

Wall Street News trước đây đã đề cập rằng Apple đã đạt được thỏa thuận với OpenAI và sẽ sử dụng công nghệ của OpenAI trong iOS 18 để nâng cao các chức năng của Siri.

OpenAI đã có phần mềm có thể phiên âm âm thanh và chuyển đổi văn bản thành giọng nói, nhưng các chức năng này được thực hiện thông qua các chatbot AI riêng biệt. Sản phẩm mới tích hợp các chức năng này và có thể hiểu hình ảnh, âm thanh tốt hơn, tốc độ phản hồi cũng nhanh hơn.

OpenAI tin rằng các trợ lý có khả năng thị giác và thính giác có tiềm năng biến đổi như điện thoại thông minh. Nó có thể quan sát thông tin về môi trường của người dùng và đưa ra các đề xuất. Các ứng dụng tiềm năng bao gồm làm gia sư, dịch các biển báo, sửa chữa ô tô, v.v.

Model mới, tạm thời không có sẵn trên các thiết bị cá nhân, sau sẽ miễn phí cho tất cả người dùng

Do tính phức tạp của mô hình ngôn ngữ mới và mức độ tham số cao, cấu hình của thiết bị cá nhân hiện không thể đáp ứng được nhu cầu về hiệu suất của nó.

Phân tích truyền thông chỉ ra rằng mô hình mới dựa vào đám mây để chạy và yêu cầu kết nối Internet để hoạt động. Có thể mất vài tháng hoặc thậm chí nhiều năm trước khi các cuộc hội thoại AI phức tạp với khả năng thị giác và thính giác trở nên đủ nhỏ để chạy trên các thiết bị cá nhân như điện thoại di động.

Hiện tại vẫn chưa biết khi nào OpenAI sẽ cung cấp các tính năng này cho người dùng trả phí. Tuy nhiên, theo đánh giá từ một số công ty, mô hình mới của OpenAI có thể cải thiện các chức năng hiện có trong dịch vụ của mình, chẳng hạn như đại lý dịch vụ khách hàng tự động. Một người quen thuộc với vấn đề này nói với giới truyền thông rằng chức năng âm thanh của phần mềm mới có thể giúp nhân viên dịch vụ khách hàng hiểu rõ hơn về giọng nói của người gọi.

Ngoài ra, giới truyền thông cũng cho biết OpenAI hy vọng rằng mô hình mới cuối cùng sẽ miễn phí và mở cửa cho tất cả người dùng , vì vậy họ cần giảm chi phí vận hành xuống so với mô hình mạnh nhất hiện tại, GPT-4 Turbo. #AIđaphươngthức
 


Đăng nhập một lần thảo luận tẹt ga
Top