OpenAI hối hả đánh bại Google để ra mắt LLM 'Đa phương thức'

Khi mùa thu đến gần, Google và OpenAI bị cuốn vào một cuộc đua phần mềm lỗi thời, nhằm mục đích ra mắt thế hệ tiếp theo của các mô hình ngôn ngữ lớn: đa phương thức.
OpenAI hối hả đánh bại Google để ra mắt LLM 'Đa phương thức'
Các mô hình này có thể hoạt động với hình ảnh và văn bản giống nhau, tạo mã cho trang web chỉ bằng cách xem bản phác thảo về giao diện mà người dùng muốn trang web trông như thế nào, chẳng hạn hoặc đưa ra phân tích văn bản về biểu đồ trực quan để bạn không cần phải hãy hỏi người bạn kỹ sư của bạn xem những cái này có ý nghĩa gì.
Google đang tiến gần hơn. Nó đã chia sẻ LLM đa phương thức Gemini sắp tới của mình với một nhóm nhỏ các công ty bên ngoài (như tôi đã tìm hiểu vào tuần trước), nhưng OpenAI muốn đánh bại Google một cách mạnh mẽ. Theo một người am hiểu tình hình, công ty khởi nghiệp được Microsoft hậu thuẫn đang chạy đua để tích hợp GPT-4, LLM tiên tiến nhất của họ, với các tính năng đa phương thức giống như những gì Gemini sẽ cung cấp. OpenAI đã xem trước các tính năng đó khi ra mắt GPT-4 vào tháng 3 nhưng không cung cấp chúng ngoại trừ một công ty, Be My Eyes, đã tạo ra công nghệ cho những người mù hoặc có thị lực kém. Sáu tháng sau, công ty đang chuẩn bị tung ra các tính năng rộng rãi hơn, được gọi là GPT-Vision.
Tham khảo bài viết gốc tại đây:
 


Đăng nhập một lần thảo luận tẹt ga

Gợi ý cộng đồng

Top