Phân tích chi tiết về ChatGPT-4.5, so sánh với Claude 3.7

Sóng AI
Sóng AI
Phản hồi: 0

Sóng AI

Writer
lkvV8CbpbAJez1jwvDRK.webp


  • ChatGPT-4.5 của OpenAI được giới thiệu như một bản nâng cấp nhỏ của GPT-4, với những cải tiến khiêm tốn trong một số lĩnh vực cụ thể nhưng cũng bộc lộ nhiều hạn chế quan trọng.


  • Trong lĩnh vực lập trình và toán học, mô hình này thể hiện khả năng xử lý vấn đề có cấu trúc tốt hơn, với điểm chuẩn "Simple Bench" cải thiện lên 35-40%, phản ánh năng lực nâng cao trong lập trình và suy luận toán học.


  • Về lý luận khoa học, GPT-4.5 thể hiện khả năng phân tích dữ liệu và giải quyết các vấn đề khoa học đơn giản tốt hơn, nhưng vẫn gặp khó khăn với các thách thức đa bước và nhiệm vụ suy luận nâng cao.

  • Mặc dù OpenAI tuyên bố cải thiện trí thông minh cảm xúc cho GPT-4.5, mô hình này vẫn thiếu sự tinh tế và nhận thức ngữ cảnh cần thiết cho các tương tác phức tạp, đặc biệt khi so sánh với Claude 3.7.


  • Khả năng sáng tạo và kể chuyện của GPT-4.5 thường không đạt kỳ vọng, với các câu chuyện thiên về "kể" hơn là "thể hiện", dẫn đến nội dung kém hấp dẫn và sống động so với Claude 3.7.


  • Hài hước vẫn là một lĩnh vực thách thức đối với GPT-4.5, với những nỗ lực tạo hài hước thường cảm thấy chung chung hoặc thiếu ngữ cảnh, không có sự tinh tế và tương đồng mà người dùng mong đợi.


  • ChatGPT-4.5 hiện có giá 200 USD/tháng cho người dùng chuyên nghiệp, đắt hơn đáng kể so với cả GPT-4 và Claude 3.7, làm dấy lên câu hỏi về khả năng tiếp cận và giá trị tổng thể.


  • OpenAI đang cân nhắc việc tiếp tục cung cấp GPT-4.5 trong API của họ do chi phí vận hành và mức độ áp dụng hạn chế.


  • Mô hình này vẫn gặp phải các vấn đề về độ tin cậy, bao gồm ảo giác - khi mô hình tạo ra thông tin không chính xác hoặc bịa đặt, làm suy giảm tính hữu dụng trong các ứng dụng quan trọng.


  • Claude 3.7 nổi lên như một đối thủ đáng gờm, vượt trội hơn GPT-4.5 trong nhiều lĩnh vực quan trọng như trí thông minh cảm xúc, viết sáng tạo và trí thông minh xã hội.


  • Sự phát triển của GPT-4.5 phản ánh xu hướng rộng lớn hơn trong nghiên cứu AI, tập trung vào việc nâng cao khả năng suy luận và giải quyết các hạn chế hiện có thay vì chỉ mở rộng quy mô mô hình cơ sở.

📌 ChatGPT-4.5 cải thiện khiêm tốn về lập trình và suy luận khoa học nhưng thua kém Claude 3.7 về trí thông minh cảm xúc và sáng tạo. Với giá 200 USD/tháng, mô hình này khó cạnh tranh trong thị trường, khiến OpenAI phải xem xét lại chiến lược phát triển AI.

Nguồn: Songai.vn
 


Đăng nhập một lần thảo luận tẹt ga
Top