GPT-5.5 ra mắt: Thông minh hơn, đắt hơn và khó có thể quay lại như cũ

Phạm Thanh Bình · 08:19

Vào ngày 23/04 theo giờ địa phương, OpenAI chính thức giới thiệu mô hình chủ lực thế hệ mới GPT-5.5. Theo mô tả từ hãng, đây là “một lớp thông minh mới cho công việc thực tế”, đánh dấu bước tiến quan trọng trong cách con người làm việc cùng máy tính.

Bản phát hành xoay quanh hai điểm cốt lõi.

Thứ nhất là bước nhảy vọt về hiệu quả. Dù quy mô lớn hơn, GPT-5.5 vẫn giữ độ trễ tương đương, không bị chậm đi. Cửa sổ ngữ cảnh được mở rộng lên tới 1 triệu token. Điều đáng chú ý là đây không chỉ là bản nâng cấp từ GPT-5.4, mà là một cấp độ thông minh mới với hiệu suất xử lý tối ưu hơn.

Thứ hai, mô hình lần đầu tham gia trực tiếp vào việc tối ưu hóa chính hạ tầng suy luận của mình trong quá trình huấn luyện. Nói cách khác, AI bắt đầu có khả năng tự điều chỉnh và cải thiện cách nó vận hành.

Trong các bài kiểm tra, GPT-5.5 thể hiện rõ lợi thế. Ở Terminal-Bench 2.0, mô hình đạt 82,7%, vượt xa mức 69,4% của Claude Opus 4.7. Với OSWorld-Verified, tỷ lệ hoàn thành nhiệm vụ trên máy tính thực đạt 78,7%, cao hơn mức cơ bản của con người. Trong bộ kiểm tra GDPval gồm 44 nhiệm vụ chuyên môn, 84,9% kết quả đạt hoặc vượt trình độ chuyên gia.

Tuy nhiên, chi phí cũng tăng đáng kể. API của GPT-5.5 có giá 5 USD cho mỗi triệu token đầu vào, tương đương khoảng 125.000 VND, và 30 USD cho mỗi triệu token đầu ra, khoảng 750.000 VND. So với GPT-5.4, mức giá này đã tăng gấp đôi. Dù vậy, OpenAI cho biết mô hình cần ít token hơn để hoàn thành cùng một công việc, nên tổng chi phí thực tế có thể không tăng nhiều. Phiên bản GPT-5.5 Pro thậm chí có giá cao hơn, lên tới 30 USD đầu vào và 180 USD đầu ra mỗi triệu token.

Trong ChatGPT, mô hình được triển khai dưới tên “GPT-5.5 Thinking” và sẽ dần thay thế các phiên bản cũ. Một thay đổi đáng chú ý là trước khi thực hiện tác vụ, hệ thống sẽ đưa ra bản tóm tắt ngắn về hướng suy nghĩ, đồng thời cho phép người dùng can thiệp trong quá trình xử lý.

Nếu tóm gọn ý nghĩa của GPT-5.5 trong một câu, thì các mô hình trước đây giống như tập hợp công cụ, còn GPT-5.5 gần với một hệ thống làm việc hoàn chỉnh, có khả năng lập kế hoạch, kiểm tra và tự thúc đẩy tiến độ.

Trong môi trường làm việc thực tế, hiệu năng của mô hình cũng được chứng minh rõ ràng. Ở bài kiểm tra GDPval, GPT-5.5 vượt GPT-5.4, Gemini 3.1 Pro và Claude Opus 4.7 về tỷ lệ hoàn thành nhiệm vụ ở mức chuyên gia. Không chỉ điểm số, chất lượng đầu ra cũng được đánh giá cao hơn về cấu trúc, độ đầy đủ và tính ứng dụng, đặc biệt trong các lĩnh vực như kinh doanh, pháp lý, giáo dục và khoa học dữ liệu.

Nội bộ OpenAI cũng đã ứng dụng rộng rãi hệ thống này. Hơn 85% nhân viên sử dụng Codex hàng tuần cho nhiều mục đích, từ phân tích dữ liệu, xử lý tài liệu tài chính cho tới tự động hóa báo cáo. Những công việc trước đây mất hàng tuần giờ có thể hoàn thành sớm hơn đáng kể.

Ở mảng lập trình, GPT-5.5 được xem là mô hình mạnh nhất từ trước đến nay của OpenAI. Trên Terminal-Bench 2.0, điểm số đạt 82,7%, tăng gần 8 điểm phần trăm so với GPT-5.4. Hệ thống Codex đi kèm có thể tự động thực hiện toàn bộ quy trình phát triển phần mềm, từ viết mã, kiểm thử đến sửa lỗi, chỉ với một yêu cầu duy nhất.

Một số ví dụ minh họa cho thấy mô hình có thể xây dựng ứng dụng mô phỏng quỹ đạo dựa trên dữ liệu của NASA hoặc tạo hệ thống theo dõi động đất theo thời gian thực, bao gồm cả việc gọi API và trực quan hóa dữ liệu.

Trong lĩnh vực vận hành máy tính, GPT-5.5 đạt bước tiến quan trọng. Thay vì chỉ phân tích hình ảnh, mô hình có thể trực tiếp thao tác: quan sát giao diện, nhấp chuột, nhập liệu và phối hợp nhiều công cụ để hoàn thành nhiệm vụ. Điều này mở ra khả năng AI thực sự “làm việc chung” trên cùng một máy tính với con người.

Ở nghiên cứu khoa học, vai trò của AI cũng thay đổi rõ rệt. GPT-5.5 không còn chỉ hỗ trợ mà bắt đầu tham gia vào suy luận và khám phá. Trong một trường hợp đáng chú ý, mô hình đã góp phần tìm ra một chứng minh toán học mới liên quan đến số Ramsey và được xác minh bằng hệ thống Lean.

Trong sinh học và khoa học dữ liệu, mô hình có thể xử lý các bộ dữ liệu lớn, đưa ra báo cáo và đề xuất hướng nghiên cứu chỉ trong thời gian ngắn, thay vì mất hàng tháng như trước.

Một điểm quan trọng khác là hiệu quả suy luận. Dù mạnh hơn, GPT-5.5 vẫn giữ tốc độ xử lý tương đương thế hệ trước nhờ việc tối ưu toàn bộ hệ thống. Đáng chú ý, chính GPT-5.5 và Codex đã tham gia viết thuật toán cải thiện hiệu suất, giúp tăng tốc độ sinh token hơn 20%.

Về an ninh mạng, mô hình cũng cho thấy sự cải thiện, nhưng đi kèm với các cơ chế kiểm soát chặt chẽ hơn. OpenAI đánh giá năng lực ở mức cao nhưng chưa tới ngưỡng nguy hiểm, đồng thời triển khai chương trình cấp quyền truy cập đặc biệt cho các chuyên gia bảo mật nhằm cân bằng giữa khả năng phòng thủ và rủi ro.

Tổng thể, GPT-5.5 không chỉ là một bản nâng cấp về sức mạnh, mà là bước chuyển từ “công cụ thông minh” sang “hệ thống làm việc tự chủ”, nơi AI có thể lập kế hoạch, thực thi và tự tối ưu hóa trong quá trình hoạt động.