Với GPT-4o, việc "yêu" AI trở nên thực tế hơn bao giờ hết

Mẫn Nhi

Admin xinh gái
Thành viên BQT
OpenAI vừa ra mắt tính năng trợ lý giọng nói lấy cảm hứng từ bộ phim "Her," có khả năng đọc biểu cảm khuôn mặt và dịch ngôn ngữ nói theo thời gian thực — và hy vọng sẽ không bỏ rơi bạn như trong phim.


Trong buổi trình diễn trực tiếp hôm thứ Hai, các kỹ sư OpenAI và Giám đốc Công nghệ Mira Murati đã tập trung quanh một chiếc điện thoại để giới thiệu các tính năng mới. Họ khuyến khích trợ lý thể hiện cảm xúc hơn khi tạo ra một câu chuyện trước khi đi ngủ, sau đó đột ngột yêu cầu chuyển sang giọng robot, và cuối cùng yêu cầu kết thúc câu chuyện bằng giọng hát. Sau đó, họ yêu cầu trợ lý nhìn vào những gì camera điện thoại đang nhìn thấy và phản hồi lại những gì hiển thị trên màn hình. Trợ lý cũng có thể bị gián đoạn khi đang nói và phản hồi mà không cần nhắc lại liên tục trong khi đóng vai trò là một người phiên dịch.

Giọng nói của trợ lý giống hệt nhân vật Scarlett Johansson đóng trong phim "Her", nơi một người đàn ông hình thành mối quan hệ với một trợ lý AI tinh vi. Sau sự kiện, CEO OpenAI Sam Altman đã đăng một từ duy nhất trên X: "her" (cô ấy). Ông cũng từng bày tỏ rằng "Her" là bộ phim yêu thích của mình. Bộ phim khám phá các chủ đề về sự cô đơn và mối quan hệ giữa con người và AI; có vẻ như đạo diễn Spike Jonze không có ý định để thế giới tái tạo chính xác cảm giác cô lập đó.

1715667487598.png


Trong một cuộc phỏng vấn với The Verge, Murati cho biết trợ lý không thực sự được thiết kế để giống giọng Johansson và nhấn mạnh rằng OpenAI đã có những giọng nói này từ lâu. "Ai đó đã hỏi tôi trong khán giả chính xác câu hỏi tương tự, và sau đó cô ấy nói, 'Ah, có lẽ lý do tôi không nhận ra nó từ ChatGPT là vì giọng nói có rất nhiều cá tính và ngữ điệu,'" Murati nói.

Các tính năng này đại diện cho một nâng cấp đáng kể so với chế độ giọng nói hiện có của ChatGPT, có thể trò chuyện với người dùng nhưng với sự tương tác hạn chế hơn nhiều; phiên bản hiện tại không thể bị gián đoạn hoặc phản hồi những gì camera của bạn nhìn thấy, ví dụ. Các tính năng mới sẽ ra mắt trong bản phát hành "alpha" giới hạn trong "vài tuần tới" và sẽ có sẵn cho những người đăng ký ChatGPT Plus trước tiên khi bắt đầu triển khai rộng rãi hơn.

Trợ lý giọng nói mới ra mắt ngay sau báo cáo của Bloomberg cho rằng OpenAI đang gần đạt được thỏa thuận với Apple để đưa ChatGPT lên iPhone. (Khi được hỏi trong cuộc phỏng vấn, Murati nói, "Chúng tôi chưa nói về bất kỳ mối quan hệ đối tác nào.") Trợ lý giọng nói của iPhone, Siri, nổi tiếng là không đáng tin cậy, vì vậy một trợ lý lấy cảm hứng từ "Her" được tích hợp vào iPhone có thể thực sự trả lời câu hỏi của bạn thay vì "tìm kiếm trên web" dường như là nơi mà điều này đang hướng tới.

"Chế độ giọng nói (và video) mới là giao diện máy tính tốt nhất tôi từng sử dụng. Nó giống như AI từ trong phim; và tôi vẫn còn hơi ngạc nhiên rằng nó là thật," Altman nói trong một bài đăng trên blog ngay sau buổi phát trực tiếp. "Đạt được thời gian phản hồi và khả năng biểu đạt ở mức độ con người hóa ra là một thay đổi lớn."

#GPT4otoàntri

>>> Khi nào chúng ta được dùng GPT-4o?
>>> 5 tính năng mới tuyệt vời của GPT-4o, mô hình ngôn ngữ lớn mới nhất của OpenAI
 


Đăng nhập một lần thảo luận tẹt ga
Top