Đó không phải là tìm kiếm, không phải GPT 5. Đây có phải là thứ OpenAI sẽ show vào thứ Hai tới không?

Trường Sơn · 11/05/2024

OpenAI sẽ ra mắt một sản phẩm hoàn toàn mới vào thứ Hai, ngày 13 tháng 5. Nhưng họ không nêu chính xác đó là dịch vụ gì, chỉ chắc chắn rằng công cụ tìm kiếm GPT-5 được cư dân mạng đồn đoán trước đó đã bị CEO OpenAI phủ nhận.

Sam Altman đã tweet: Đó không phải là GPT-5 và cũng không phải là công cụ tìm kiếm, nhưng chúng tôi luôn nỗ lực phát triển một số nội dung mới mà mọi người sẽ yêu thích! Đối với tôi, nó giống như phép thuật vậy.

Chính xác thì sản phẩm mới bí ẩn này là gì? Báo chí dẫn lời hai người quen thuộc với vấn đề này cho biết, sản phẩm mới là mô hình AI có chức năng thị giác, thính giác và có khả năng suy luận logic tốt hơn các chatbot hiện nay.

AI đa phương thức mới có thị giác và thính giác

Theo báo cáo, OpenAI có thể công khai trình diễn các sản phẩm mới ngay sau thứ Hai tới để đón đầu một loạt sản phẩm của Google được phát hành vào tuần tới.

Altman hy vọng cuối cùng sẽ phát triển được một trí tuệ nhân tạo có thể phản hồi nhanh chóng giống như trợ lý AI trong phim “Her” và sử dụng công nghệ này để hỗ trợ các trợ lý giọng nói hiện có như Siri của Apple.

Wall Street News trước đây đã đề cập rằng Apple đã đạt được thỏa thuận với OpenAI và sẽ sử dụng công nghệ của OpenAI trong iOS 18 để nâng cao các chức năng của Siri.

OpenAI đã có phần mềm có thể phiên âm âm thanh và chuyển đổi văn bản thành giọng nói, nhưng các chức năng này được thực hiện thông qua các chatbot AI riêng biệt. Sản phẩm mới tích hợp các chức năng này và có thể hiểu hình ảnh, âm thanh tốt hơn, tốc độ phản hồi cũng nhanh hơn.

OpenAI tin rằng các trợ lý có khả năng thị giác và thính giác có tiềm năng biến đổi như điện thoại thông minh. Nó có thể quan sát thông tin về môi trường của người dùng và đưa ra các đề xuất. Các ứng dụng tiềm năng bao gồm làm gia sư, dịch các biển báo, sửa chữa ô tô, v.v.

Model mới, tạm thời không có sẵn trên các thiết bị cá nhân, sau sẽ miễn phí cho tất cả người dùng

Do tính phức tạp của mô hình ngôn ngữ mới và mức độ tham số cao, cấu hình của thiết bị cá nhân hiện không thể đáp ứng được nhu cầu về hiệu suất của nó.

Phân tích truyền thông chỉ ra rằng mô hình mới dựa vào đám mây để chạy và yêu cầu kết nối Internet để hoạt động. Có thể mất vài tháng hoặc thậm chí nhiều năm trước khi các cuộc hội thoại AI phức tạp với khả năng thị giác và thính giác trở nên đủ nhỏ để chạy trên các thiết bị cá nhân như điện thoại di động.

Hiện tại vẫn chưa biết khi nào OpenAI sẽ cung cấp các tính năng này cho người dùng trả phí. Tuy nhiên, theo đánh giá từ một số công ty, mô hình mới của OpenAI có thể cải thiện các chức năng hiện có trong dịch vụ của mình, chẳng hạn như đại lý dịch vụ khách hàng tự động. Một người quen thuộc với vấn đề này nói với giới truyền thông rằng chức năng âm thanh của phần mềm mới có thể giúp nhân viên dịch vụ khách hàng hiểu rõ hơn về giọng nói của người gọi.

Ngoài ra, giới truyền thông cũng cho biết OpenAI hy vọng rằng mô hình mới cuối cùng sẽ miễn phí và mở cửa cho tất cả người dùng , vì vậy họ cần giảm chi phí vận hành xuống so với mô hình mạnh nhất hiện tại, GPT-4 Turbo. #AIđaphươngthức

Tìm kiếm

Có thể bạn quan tâm

Đó không phải là tìm kiếm, không phải GPT 5. Đây có phải là thứ OpenAI sẽ show vào thứ Hai tới không?

Trường Sơn

Writer

Trường Sơn

AI đa phương thức mới có thị giác và thính giác

Model mới, tạm thời không có sẵn trên các thiết bị cá nhân, sau sẽ miễn phí cho tất cả người dùng

Keysight hỗ trợ Foxconn đạt chứng nhận hợp chuẩn thiết bị vô tuyến mở ngoài trời

Bằng cách nào Google Translate có thể "hiểu" và phiên dịch tới gần 250 ngôn ngữ?

Bê tông nứt tự liền, tuổi thọ đến 200 năm, cao hơn bê tông thông thường

Công nghệ VAR gây tranh cãi ở EURO 2024 vì... quá chính xác

Top những loài rắn nhanh nhất thế giới, con người mà gặp thì rất dễ "liệm"

Cách bảo vệ thông tin cá nhân trên Facebook

Huawei sắp bán TV giá rẻ hơn Sony và Samsung, chưa tới 20 triệu đồng đã có 65 inch, 86 inch chỉ 35 triệu đồng

Nhà máy Intel Việt Nam có lãnh đạo mới

Loài rắn đáng sợ nhất Việt Nam, sở hữu nọc độc mạnh hơn cả hổ mang chúa, cạp nong hay cạp nia

Những tin đồn mới thú vị nhất về iPhone 16, iFan đã biết chưa?

Không có thuốc đánh răng, vì sao sức khỏe răng miệng của người La Mã tốt đến thế?

LG ra mắt tủ lạnh InstaView French Door “made-in-Vietnam”, thiết kế dựa trên thói quen bảo quản thực phẩm của người Việt

Địa danh có nhiệt độ bề mặt 81 độ C, xứng danh "Hỏa Diệm Sơn"

Đánh giá nổi bật

Gợi ý cộng đồng

Có thể bạn quan tâm

Đó không phải là tìm kiếm, không phải GPT 5. Đây có phải là thứ OpenAI sẽ show vào thứ Hai tới không?

Writer

AI đa phương thức mới có thị giác và thính giác​

Model mới, tạm thời không có sẵn trên các thiết bị cá nhân, sau sẽ miễn phí cho tất cả người dùng​

Keysight hỗ trợ Foxconn đạt chứng nhận hợp chuẩn thiết bị vô tuyến mở ngoài trời

Bằng cách nào Google Translate có thể "hiểu" và phiên dịch tới gần 250 ngôn ngữ?

Bê tông nứt tự liền, tuổi thọ đến 200 năm, cao hơn bê tông thông thường

Công nghệ VAR gây tranh cãi ở EURO 2024 vì... quá chính xác

Gợi ý cộng đồng

AI đa phương thức mới có thị giác và thính giác

Model mới, tạm thời không có sẵn trên các thiết bị cá nhân, sau sẽ miễn phí cho tất cả người dùng