Mô hình AI mới của Apple ReALM 'vượt qua GPT-4'

TienCM

Pearl
Các nhà nghiên cứu đã phát hiện ra rằng hệ thống AI mới của Apple có tên ReALM đã vượt qua khả năng của GPT-4 của OpenAI.
Mô hình AI mới của Apple ReALM 'vượt qua GPT-4'
Theo trang Readwrite, bài nghiên cứu có tiêu đề “ReALM: Độ phân giải tham chiếu như mô hình ngôn ngữ” xem xét vấn đề về độ phân giải tham chiếu. Tham chiếu là một quá trình ngôn ngữ trong đó một từ trong câu hoặc diễn ngôn đề cập đến một từ hoặc thực thể khác. Nhiệm vụ giải quyết các tham chiếu này được gọi là độ phân giải tham chiếu (reference resolution).
Các nhà nghiên cứu tuyên bố rằng mặc dù các mô hình ngôn ngữ lớn (LLM) cực kỳ mạnh mẽ cho nhiều nhiệm vụ khác nhau, nhưng việc sử dụng chúng trong việc phân giải tham chiếu, đặc biệt là đối với các thực thể không hội thoại, vẫn chưa được sử dụng đúng mức.
Mô hình AI mới của Apple ReALM 'vượt qua GPT-4'
Theo nghiên cứu, phiên bản nhỏ nhất của ReALM đã được so sánh với GPT-3.5 và GPT-4 và nó đã đạt được hiệu suất tương đương với GPT-4, trong khi các phiên bản ReALM lớn hơn hoạt động tốt hơn đáng kể.
Trước WWDC 2024 và sự ra mắt dự kiến của iOS 18 vào tháng 6, rất nhiều người kỳ vọng vào sự ra mắt của Siri 2.0 tiên tiến. Liệu ReALM có được tích hợp vào Siri hay không vẫn chưa chắc chắn.
Những dự án đầu tư mạo hiểm gần đây của Apple vào lĩnh vực AI đã không gây được ấn tượng, chủ yếu là mới dừng ở việc nâng cao hiệu quả AI trên các thiết bị nhỏ cũng như các mối quan hệ đối tác chiến lược.
Việc ra mắt ReALM là nỗ lực mới nhất và có mục tiêu nhất của nhóm nghiên cứu AI của Apple nhằm cạnh tranh với các mô hình AI của các đối thủ như OpenAI, Google và Microsoft đang thống trị hiện nay.
Các tính năng chính của RealM AI của Apple
ReALM được cho là sử dụng một cách mới để chuyển đổi thông tin màn hình thành văn bản, cho phép nó bỏ qua nhu cầu về các tham số nhận dạng hình ảnh và cho phép xử lý hiệu quả hơn trên các thiết bị AI.
Do đó, mô hình ngôn ngữ lớn này sẽ cho phép người dùng cuộn qua trang web. Sau đó, Siri có thể 'xem' số điện thoại trên trang web và trực tiếp thực hiện cuộc gọi. Nhờ đó, ReALM có thể cải thiện đáng kể khả năng nhận biết ngữ cảnh của trợ lý giọng nói. Với khả năng diễn giải thông tin trên màn hình và sử dụng ngữ cảnh bổ sung, bản cập nhật cho Siri có thể giúp mang lại trải nghiệm người dùng rảnh tay và mượt mà hơn.
ReALM cũng có thể xử lý nhiều loại tài liệu tham khảo, bao gồm cả những tài liệu phụ thuộc vào ngữ cảnh hội thoại, nội dung trên màn hình và thậm chí cả thông tin cơ bản. Điều này rất quan trọng để phát triển các hệ thống AI trực quan có tốc độ phản hồi nhanh hơn, có thể thích ứng với sự phức tạp của ngôn ngữ và bối cảnh của con người.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top