5 tính năng mới tuyệt vời của GPT-4o, mô hình ngôn ngữ lớn mới nhất của OpenAI

Kiều My

Editor
Thành viên BQT
Sử dụng chức năng
  1. Mục lục Xem nhanh
  2. Nút xem thêm với bài dài
Ngày 13/5, OpenAI đã chính thức ra mắt GPT-4o, mô hình ngôn ngữ lớn tiếp theo của mình. Dưới đây là những tính năng tuyệt vời nhất của GPT-4o, hứa hẹn sẽ khẳng định vị thế của ChatGPT trong thế giới AI.

Trò chuyện bằng giọng nói thời gian thực​

1715653206525.png


GPT-4o tập trung rất nhiều vào khả năng trò chuyện theo thời gian thực. Mô hình có thể nắm bắt được giọng điệu trong giọng nói của bạn và sẽ cố gắng đáp ứng lại bằng giọng điệu phù hợp của riêng nó. Trong một số trường hợp, bạn thậm chí có thể yêu cầu nó thêm nhiều hoặc ít kịch tính hơn vào phản hồi của nó, hoặc sử dụng một giọng nói khác - như giọng rô bốt cho một câu chuyện được kể bởi rô bốt, hoặc hát cho đoạn kết của một câu chuyện cổ tích.

Có lẽ đáng kể hơn, bạn có thể ngắt lời AI bất cứ lúc nào, chẳng hạn như nếu nó nhận sai yêu cầu hoặc bạn muốn thay đổi giọng điệu hoặc giọng nói giữa chừng. 4o sẽ cố gắng hết sức để tự sửa chữa, sử dụng phần còn lại của cuộc trò chuyện làm ngữ cảnh. Trong một cuộc trình diễn dàn dựng của OpenAI, tất cả điều này cảm thấy rất tự nhiên, với AI thậm chí còn xin lỗi khi ai đó chỉ ra rằng nó thiếu một số dữ liệu nguồn quan trọng.

Thật không may, bạn sẽ phải đợi để thử các tính năng thoại mới. Ban đầu, chúng chỉ được triển khai cho các thuê bao ChatGPT Plus và chỉ ở trạng thái alpha sớm vào một thời điểm nào đó trước cuối tháng Sáu.

Thị giác tốt hơn, hỗ trợ đa ngôn ngữ​

1715653216253.png


GPT-4o cũng có thể trả lời các câu hỏi về ảnh và ảnh chụp màn hình máy tính. Những câu hỏi này có thể tương tự như những câu hỏi bạn hỏi Kính thông minh Meta/Ray-Ban hoặc ghim Humane AI - chẳng hạn như "Đây là quần hiệu gì?" - nhưng có khả năng phức tạp hơn, chẳng hạn như giải thích một khối mã ứng dụng hoặc dịch menu nhà hàng. OpenAI cho biết rằng trong tương lai, 4o có thể có khả năng thực hiện các tác vụ phức tạp hơn nữa, chẳng hạn như xem các môn thể thao trực tiếp và giải thích các quy tắc liên quan. Hiện tại trọng tâm dường như là hình ảnh tĩnh hơn là video.

Liên quan đến tầm nhìn là các chức năng đa ngôn ngữ được cải thiện. 4o được cho là có hiệu suất tốt hơn trên 50 ngôn ngữ khác nhau, với API nhanh gấp đôi so với API dành cho GPT-4 Turbo.

Tạo hình ảnh với văn bản tốt hơn​

1715653225212.png


Khả năng tạo hình ảnh với văn bản rõ ràng từ lâu đã là điểm yếu của AI, nhưng GPT-4o dường như có khả năng hơn trong lĩnh vực này. Văn bản không chỉ rõ ràng mà còn được sắp xếp theo những cách sáng tạo, chẳng hạn như trang đánh máy, áp phích phim hoặc sử dụng kiểu chữ thơ. Nó cũng tỏ ra thành thạo trong việc mô phỏng chữ viết tay, đến mức một số lời nhắc có thể tạo ra hình ảnh không thể phân biệt được với sản phẩm của con người thực.

Văn bản không chỉ có thể đọc được mà còn được sắp xếp theo những cách sáng tạo, chẳng hạn như trang đánh máy, áp phích phim hoặc sử dụng kiểu chữ thơ.

Bạn thậm chí có thể yêu cầu 4o thêm các hình vẽ nguệch ngoạc vào lề.

Ứng dụng thuần cho Mac và Windows​

1715653233937.png


Ngoài phiên bản web của ChatGPT, hiện đã có một ứng dụng Mac chuyên dụng với phím tắt và hỗ trợ ảnh chụp màn hình, hiện chỉ dành riêng cho người đăng ký Plus. Ứng dụng Windows sẽ có sẵn vào cuối năm 2024. Có thể OpenAI không vội vàng đưa ứng dụng khách bên thứ nhất vào Windows 11 - xét cho cùng, GPT là nền tảng của Copilot và Microsoft có lẽ không muốn công nghệ tích hợp Windows của mình bị lu mờ.

Ai cũng có thể dùng​

1715653241484.png


Theo một cách nào đó, đây thực sự có thể là bước tiến lớn nhất. OpenAI theo truyền thống đã giới hạn các phiên bản tiên tiến nhất của GPT, nhưng 4o được miễn phí cho mọi người dùng ChatGPT ngay từ đầu. Những hạn chế chính là về cuộc trò chuyện bằng giọng nói theo thời gian thực - tính năng này sẽ chỉ dành cho những người đăng ký Plus, khi nó thực sự ra mắt - và số lượng prompt bạn có thể sử dụng. Người mua ChatGPT Plus và Team nhận được lượng lời nhắc gấp năm lần, điều này rất quan trọng, vì các cuộc trò chuyện sẽ trở về GPT-3.5 sau khi đạt đến giới hạn prompt của bạn.
#OpenAI #GPT4o #chatGPT #GPT4otoàntri
>>>OpenAI ra mắt GPT-4o: Chatbot "toàn năng" xử lý được cả giọng nói và hình ảnh, người dùng miễn phí cũng được sử dụng
 


Đăng nhập một lần thảo luận tẹt ga
Top