So sánh khả năng lập trình của Gemini 2.5 Pro và Claude 3.7 Sonnet

Sóng AI

Google vừa ra mắt Gemini 2.5 Pro vào ngày 26/3/2025, tuyên bố đây là mô hình tốt nhất về coding, suy luận và nhiều lĩnh vực khác.
Gemini 2.5 Pro có cửa sổ ngữ cảnh 1 triệu token, sắp nâng cấp lên 2 triệu token, trong khi Claude 3.7 Sonnet chỉ có 200.000 token.
Gemini 2.5 Pro hiện đứng đầu bảng xếp hạng LMArena, vượt trội trong coding, toán học, khoa học và hiểu hình ảnh.
Về độ chính xác trên bộ đánh giá SWE bench, Gemini 2.5 Pro đạt 63,8% so với 62,3% của Claude 3.7 Sonnet.
Bài viết thực hiện 4 bài kiểm tra lập trình để so sánh hai mô hình: mô phỏng máy bay, giải khối Rubik, mô phỏng bóng nảy trong tesseract 4D và một bài toán LeetCode khó.
Trong bài kiểm tra mô phỏng máy bay, Gemini 2.5 Pro tạo ra mã hoạt động hoàn hảo với điểm 10/10, trong khi Claude 3.7 Sonnet gặp vấn đề với hướng máy bay và điều khiển.
Với bài toán giải khối Rubik, Gemini 2.5 Pro tạo ra giải pháp hoạt động đầy đủ trong một lần thử, trong khi Claude 3.7 Sonnet thất bại với màu sắc và không thể giải khối.
Trong bài kiểm tra mô phỏng bóng nảy trong tesseract 4D, cả hai mô hình đều thành công, nhưng Claude 3.7 Sonnet thêm màu sắc không được yêu cầu.
Với bài toán LeetCode khó (tỷ lệ chấp nhận 14,9%), Gemini 2.5 Pro giải quyết chính xác với độ phức tạp thời gian phù hợp, trong khi Claude 3.7 Sonnet gặp lỗi TLE (Time Limit Exceeded).
Gemini 2.5 Pro có sẵn miễn phí, là một lợi thế lớn so với Claude 3.7 Sonnet.
Tác giả kết luận Gemini 2.5 Pro là người chiến thắng trong cuộc so sánh này, mặc dù mã của Claude 3.7 Sonnet đôi khi đơn giản và dễ hiểu hơn.

Gemini 2.5 Pro vượt trội Claude 3.7 Sonnet trong 3/4 bài kiểm tra lập trình, với cửa sổ ngữ cảnh 1 triệu token (so với 200.000), độ chính xác 63,8% trên SWE bench (so với 62,3%) và hoàn toàn miễn phí, khẳng định vị thế dẫn đầu trong lĩnh vực AI lập trình.

Nguồn: Songai.vn