Phân tích chi tiết về ChatGPT-4.5, so sánh với Claude 3.7

Sóng AI · 14/03/2025

ChatGPT-4.5 của OpenAI được giới thiệu như một bản nâng cấp nhỏ của GPT-4, với những cải tiến khiêm tốn trong một số lĩnh vực cụ thể nhưng cũng bộc lộ nhiều hạn chế quan trọng.
Trong lĩnh vực lập trình và toán học, mô hình này thể hiện khả năng xử lý vấn đề có cấu trúc tốt hơn, với điểm chuẩn "Simple Bench" cải thiện lên 35-40%, phản ánh năng lực nâng cao trong lập trình và suy luận toán học.
Về lý luận khoa học, GPT-4.5 thể hiện khả năng phân tích dữ liệu và giải quyết các vấn đề khoa học đơn giản tốt hơn, nhưng vẫn gặp khó khăn với các thách thức đa bước và nhiệm vụ suy luận nâng cao.
Mặc dù OpenAI tuyên bố cải thiện trí thông minh cảm xúc cho GPT-4.5, mô hình này vẫn thiếu sự tinh tế và nhận thức ngữ cảnh cần thiết cho các tương tác phức tạp, đặc biệt khi so sánh với Claude 3.7.
Khả năng sáng tạo và kể chuyện của GPT-4.5 thường không đạt kỳ vọng, với các câu chuyện thiên về "kể" hơn là "thể hiện", dẫn đến nội dung kém hấp dẫn và sống động so với Claude 3.7.
Hài hước vẫn là một lĩnh vực thách thức đối với GPT-4.5, với những nỗ lực tạo hài hước thường cảm thấy chung chung hoặc thiếu ngữ cảnh, không có sự tinh tế và tương đồng mà người dùng mong đợi.
ChatGPT-4.5 hiện có giá 200 USD/tháng cho người dùng chuyên nghiệp, đắt hơn đáng kể so với cả GPT-4 và Claude 3.7, làm dấy lên câu hỏi về khả năng tiếp cận và giá trị tổng thể.
OpenAI đang cân nhắc việc tiếp tục cung cấp GPT-4.5 trong API của họ do chi phí vận hành và mức độ áp dụng hạn chế.
Mô hình này vẫn gặp phải các vấn đề về độ tin cậy, bao gồm ảo giác - khi mô hình tạo ra thông tin không chính xác hoặc bịa đặt, làm suy giảm tính hữu dụng trong các ứng dụng quan trọng.
Claude 3.7 nổi lên như một đối thủ đáng gờm, vượt trội hơn GPT-4.5 trong nhiều lĩnh vực quan trọng như trí thông minh cảm xúc, viết sáng tạo và trí thông minh xã hội.
Sự phát triển của GPT-4.5 phản ánh xu hướng rộng lớn hơn trong nghiên cứu AI, tập trung vào việc nâng cao khả năng suy luận và giải quyết các hạn chế hiện có thay vì chỉ mở rộng quy mô mô hình cơ sở.

ChatGPT-4.5 cải thiện khiêm tốn về lập trình và suy luận khoa học nhưng thua kém Claude 3.7 về trí thông minh cảm xúc và sáng tạo. Với giá 200 USD/tháng, mô hình này khó cạnh tranh trong thị trường, khiến OpenAI phải xem xét lại chiến lược phát triển AI.

Nguồn: Songai.vn

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Phân tích chi tiết về ChatGPT-4.5, so sánh với Claude 3.7

Sóng AI

Writer

Sóng AI

Bước ngoặt 1 triệu token của Claude: Nước cờ khiến Google và OpenAI phải dè chừng

Biến tướng của cơn sốt AI: Người dùng Trung Quốc ồ ạt trả tiền để "khai tử" OpenClaw

Ứng dụng Tác nhân AI Hội thoại tại Việt Nam: Cơ hội vàng cho các trung tâm chăm sóc khách hàng với giải pháp từ Agora

Công ty mẹ của Facebook "chơi lớn": Tự sản xuất hàng loạt 4 dòng chip AI thế hệ mới

Không phải robot sát thủ, đây mới là cách AI thực sự tham chiến giữa chiến sự Mỹ Isarel Iran

Anthropic lên trang bìa tạp chí Time! Thông tin gây sốc: AI tự cải tiến một cách đệ quy, có thể chỉ trong vòng một năm

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Mac Mini của Apple bất ngờ cháy hàng trên khắp Trung Quốc vì cơn sốt OpenClaw

Đánh giá nổi bật