Không kém cạnh OpenAI hay Google, AI của Elon Musk giờ cũng có thể nhìn, nghe, nói như con người

Kiều My

Editor
Thành viên BQT
Grok, chatbot AI được phát triển bởi xAI - công ty của Elon Musk, đang trong quá trình tích hợp khả năng xử lý thông tin đa phương tiện, cho phép người dùng tương tác bằng cả hình ảnh và văn bản. Thông tin này được tiết lộ thông qua tài liệu dành cho nhà phát triển mà xAI công bố gần đây.

Trước đó, vào tháng 3/2024, Grok đã có bước tiến đáng kể với phiên bản Grok 1.5, sở hữu khả năng lập luận được cải thiện đáng kể. Trong một bài đăng trên blog vào tháng trước, xAI cũng đã gợi ý rằng Grok-1.5V sẽ cung cấp "các mô hình đa phương thức trong một số lĩnh vực nhất định". Bản cập nhật tài liệu dành cho nhà phát triển gần đây cho thấy xAI đang chuẩn bị ra mắt một mô hình AI mới, cho phép người dùng tải ảnh lên Grok và nhận được câu trả lời bằng văn bản. Tài liệu hướng dẫn cách các nhà phát triển có thể sử dụng bộ công cụ phát triển phần mềm (SDK) của xAI để tạo ra phản hồi dựa trên cả văn bản và hình ảnh, với kịch bản Python mẫu minh họa quy trình này.

1716367128745.png


Ra mắt vào tháng 11/2023 và chỉ dành riêng cho người dùng trả phí X Premium Plus, Grok được xem là "tân binh" trong lĩnh vực AI so với các đối thủ lớn như ChatGPT của OpenAI. Điểm nổi bật của Grok là khả năng tiếp cận thông tin theo thời gian thực, bao gồm cả các bài đăng trên nền tảng X. Theo xAI, mô hình Grok được huấn luyện dựa trên nhiều nguồn dữ liệu văn bản công khai trên Internet tính đến quý 3 năm 2023 và tập dữ liệu do người đánh giá xem xét và tuyển chọn. Tuy nhiên, xAI cũng thừa nhận rằng các điểm chuẩn cho mô hình ngôn ngữ lớn thường bị chỉ trích vì các mô hình có thể hoạt động tốt trên điểm chuẩn nếu chúng được đưa vào dữ liệu đào tạo, giống như việc ghi nhớ câu trả lời trong bài kiểm tra thay vì thực sự hiểu nội dung.

Mặc dù vậy, theo bài đăng trên blog của xAI, Grok 1.5 đang dần thu hẹp khoảng cách với GPT-4 trên nhiều tiêu chuẩn đánh giá, từ cấp tiểu học đến các cuộc thi cấp trung học. Chatbot đa phương thức được xem là đích đến tiếp theo của cuộc đua AI, với nhiều ông lớn trong ngành như Google và OpenAI đã công bố những bước tiến mới. Việc thiếu hụt khả năng đa phương tiện đã khiến Grok bị tụt lại phía sau cho đến thời điểm hiện tại. Liệu với những nỗ lực nâng cấp, Grok có thể tạo nên bất ngờ trong cuộc đua đầy thử thách này hay không vẫn còn là một câu hỏi lớn.
#ElonMusk
 


Đăng nhập một lần thảo luận tẹt ga
Top