Mô hình AI mới GPT-4o của OpenAI có thể kể truyện, làm dịch giả cho người dùng

Thanh Phong

Editor
Thành viên BQT
OpenAI vừa chính thức ra mắt mô hình AI mới có tên GPT-4o mang GPT-4 đến với tất cả mọi người, bao gồm cả người dùng miễn phí của OpenAI.

Theo OpenAI, mô hình GPT-4o mới “nhanh hơn nhiều” với các khả năng được cải thiện về văn bản, video và âm thanh. OpenAI cho biết họ có kế hoạch cho phép người dùng trò chuyện video bằng ChatGPT.
1715651513133.png

“Đây là lần đầu tiên chúng tôi thực sự đạt được một bước tiến lớn về tính dễ sử dụng”, Mira Murati, giám đốc công nghệ của OpenAI nói khi ra mắt GPT-4o.

OpenAI, được hỗ trợ bởi Microsoft, đã được các nhà đầu tư định giá hơn 80 tỷ USD. Công ty, được thành lập vào năm 2015, đang chịu áp lực phải đứng đầu thị trường AI tổng hợp sau khi đã đầu tư khoản tiền lớn vào bộ xử lý và cơ sở hạ tầng để xây dựng và đào tạo các mô hình AI.

Chữ o trong GPT-4o là viết tắt của omni. Mira Murati cho biết, mô hình mới cho phép ChatGPT xử lý 50 ngôn ngữ khác nhau với tốc độ và chất lượng được cải thiện, đồng thời nó cũng sẽ có sẵn thông qua API của OpenAI để các nhà phát triển có thể bắt đầu xây dựng ứng dụng bằng mô hình mới ngay từ hôm nay.

Mira Murati nói thêm rằng GPT-4o nhanh gấp đôi và giá chỉ bằng một nửa so với GPT-4 Turbo.

Các thành viên nhóm OpenAI đã trình diễn khả năng âm thanh của mô hình mới, yêu cầu nó giúp ai đó bình tĩnh lại trước bài phát biểu trước công chúng. Nhà nghiên cứu OpenAI Mark Chen cho biết mô hình GPT-4o có thể “nhận biết cảm xúc của bạn”, đồng thời cho biết thêm mô hình cũng có thể xử lý việc người dùng làm gián đoạn nó. Nhóm cũng yêu cầu nó phân tích nét mặt của người dùng để nhận xét về những cảm xúc mà người đó có thể đang trải qua.

“Này, có chuyện gì vậy? Làm thế nào tôi có thể làm cho ngày hôm nay của bạn tươi sáng hơn?” Chế độ âm thanh của ChatGPT cho biết khi người dùng chào nó.

Theo một bài đăng trên blog của OpenAI, công ty có kế hoạch thử nghiệm chế độ giọng nói Voice Mode trong những tuần tới, với quyền truy cập sớm cho những người đăng ký trả phí ChatGPT Plus. OpenAI cũng cho biết mô hình mới có thể phản hồi lời nhắc bằng âm thanh của người dùng “chỉ trong 232 mili giây, trung bình là 320 mili giây, tương tự như thời gian phản hồi của con người trong một cuộc trò chuyện”.

Mark Chen đã chứng minh khả năng kể chuyện trước khi đi ngủ của mô hình GPT-4o và yêu cầu mô hình này thay đổi giọng nói để kịch tính hơn hoặc giống robot hơn. Mark Chen thậm chí còn yêu cầu nó hát câu chuyện.

Ngoài ra, mô hình GPT-4o mới của OpenAI có thể hoạt động như một dịch giả, ngay cả ở chế độ âm thanh, công ty cho biết. Chen đã chứng minh khả năng của công cụ này là nghe Murati nói tiếng Ý trong khi anh ấy nói tiếng Anh và dịch sang ngôn ngữ tương ứng khi họ trò chuyện.

Các thành viên trong nhóm cũng đã chứng minh khả năng của mô hình trong việc giải các phương trình toán học và giúp viết mã, định vị nó như một đối thủ cạnh tranh mạnh mẽ hơn với GitHub Copilot của chính Microsoft.

Đối với OpenAI, việc ra mắt GPT-4o là một trong những thông báo lớn nhất của công ty kể từ khi bắt đầu triển khai ChatGPT Enterprise vào tháng 8 năm ngoái.

OpenAI, Microsoft và Google đang dẫn đầu cơn sốt AI toàn cầu khi các công ty liên tục chạy đua bổ sung tính năng và sản phẩm AI mới để tránh bị các đối thủ cạnh tranh bỏ lại phía sau. Đầu tháng này, đối thủ của OpenAI là Anthropic đã công bố sản phẩm đầu tiên dành cho doanh nghiệp và một ứng dụng iPhone miễn phí.

Theo PitchBook, kỷ lục 29,1 tỷ USD đã được đầu tư vào gần 700 thương vụ AI sáng tạo vào năm 2023, tăng hơn 260% so với năm trước. Thị trường được dự đoán sẽ đạt doanh thu 1 nghìn tỷ USD trong vòng một thập kỷ tới.

Một số người trong ngành đã nêu lên mối lo ngại về tốc độ tung ra thị trường các dịch vụ mới chưa được thử nghiệm, đồng thời các học giả và nhà đạo đức học đang lo lắng về xu hướng truyền bá thành kiến của công nghệ.

Sau khi ra mắt ChatGPT vào tháng 11 năm 2022, ChatGPT đã phá kỷ lục vào thời điểm đó là ứng dụng tiêu dùng phát triển nhanh nhất trong lịch sử và hiện có khoảng 100 triệu người dùng hoạt động hàng tuần. OpenAI cho biết hơn 92% công ty Fortune 500 đang sử dụng nền tảng này.

Murati cho biết trong sự kiện hôm thứ Hai rằng OpenAI muốn “loại bỏ một số chủ nghĩa thần bí khỏi công nghệ”.

Cô nói: “Trong vài tuần tới, chúng tôi sẽ triển khai những khả năng này cho mọi người.

OpenAI cho biết mô hình GPT-4o mới sẽ lần đầu tiên được tung ra vào thứ Ba (14/5) cho khách hàng dùng ChatGPT Plus và Team, sau đó là cho Enterprise. GPT.4o cũng sẽ có sẵn cho người dùng ChatGPT miễn phí bắt đầu từ thứ Hai, với mức sử dụng giới hạn. Người dùng ChatGPT Plus sẽ có dung lượng tin nhắn cao gấp 5 lần so với người dùng miễn phí và khách hàng của ChatGPT Team và Enterprise sẽ có giới hạn sử dụng cao hơn nữa.

Mira Murati kết thúc sự kiện ra mắt GPT-4o được phát trực tiếp bằng cách cảm ơn Giám đốc điều hành Nvidia Jensen Huang và công ty của ông đã cung cấp các bộ xử lý đồ họa (GPU) cần thiết để hỗ trợ công nghệ của OpenAI.

“Tôi chỉ muốn cảm ơn nhóm OpenAI đáng kinh ngạc, đồng thời cũng cảm ơn Jensen và nhóm Nvidia đã mang đến cho chúng tôi những GPU tiên tiến nhất để biến bản demo này thành hiện thực ngày hôm nay”, Mira Murati nói.
#GPT4otoàntri
 


Đăng nhập một lần thảo luận tẹt ga

Gợi ý cộng đồng

Top