Nhai kỹ sống chậm
Writer
Có một thuật ngữ đang được các nhà phân tích nhắc đi nhắc lại tuần qua: "bức tường nhu cầu theo chiều dọc". Giám đốc tài chính OpenAI, Sarah Friar, đặt ra cụm từ này, và một báo cáo mới từ Citi ngày 25/5 vừa xác nhận nó bằng hàng loạt con số cụ thể.
Anthropic dự kiến doanh thu quý 2/2026 đạt 10,9 tỷ USD, tăng 130% chỉ trong một quý so với mức 4,8 tỷ USD trước đó. Doanh thu định kỳ hàng năm của công ty này dự kiến chạm 50 tỷ USD vào cuối quý 2, vượt xa con số 30 tỷ USD ghi nhận hồi tháng 3. OpenAI cũng không kém, đạt 5,7 tỷ USD chỉ trong quý 1/2026, trong khi cả nửa đầu 2025 mới được khoảng 4,3 tỷ USD. Google thì xử lý 3,2 triệu tỷ token mỗi tháng, gấp 7 lần cùng kỳ năm ngoái.
OpenAI vừa ra mắt mô hình "đảm bảo dung lượng", cho phép khách hàng cam kết sử dụng sức mạnh tính toán trong 1 đến 3 năm để đổi lấy chiết khấu. Đây là cách các ông lớn giữ chân khách hàng dài hạn trong bối cảnh nguồn cung vẫn còn hạn chế. Việc Andrej Karpathy gia nhập Anthropic càng nhắc nhở thị trường rằng nhân tài cấp cao vẫn là nút thắt cổ chai nghiêm trọng nhất trong toàn bộ chuỗi cung ứng AI.
Chi phí không giảm mà còn tăng.
GPT-5.5 có giá gấp đôi GPT-5.4. Phân tích của Citi trên dữ liệu OpenRouter cho thấy chi phí thực tế tăng từ 49% đến 92% tùy khối lượng công việc. Google giảm gói AI Ultra từ 250 USD xuống 200 USD mỗi tháng (khoảng 5 triệu đồng), đồng thời ra mắt gói 100 USD dành cho "người dùng chuyên nghiệp". Thị trường đang phân tầng rõ rệt, ai dùng nhiều hơn thì trả nhiều hơn.
Về bảng xếp hạng mô hình hiện tại, GPT-5.5 của OpenAI dẫn đầu với 60 điểm, giá 4,35 USD mỗi triệu token. Gemini 3.1 Pro Preview và Claude Opus 4.7 cùng đứng thứ hai với 57 điểm, nhưng Google cạnh tranh hơn ở mức 1,74 USD, còn Claude Opus 4.7 có giá 4,10 USD mỗi triệu token.
Phía trước, Citi dự báo hàng loạt mô hình mới ra mắt trong các quý tới, từ Gemini 3.5 Pro, Claude Sonnet 4.7 trong quý 2, đến GPT-6.0 trong quý 3, rồi Claude Opus 5 và DeepSeek V5 vào quý 4. Chính phủ Mỹ cũng đang chuẩn bị một khung pháp lý tự nguyện, yêu cầu các phòng lab AI chia sẻ mô hình tiên tiến với chính phủ 90 ngày trước khi công bố rộng rãi.
Câu hỏi trung tâm mà báo cáo đặt ra không phải là AI có tiếp tục tăng trưởng không, mà là ai sẽ thực sự hưởng lợi từ "lợi tức năng suất" đó: nhà cung cấp phần mềm, nền tảng AI, doanh nghiệp sử dụng, hay người lao động. Đây sẽ là chủ đề định giá cốt lõi của thị trường vốn trong giai đoạn tiếp theo.
Anthropic dự kiến doanh thu quý 2/2026 đạt 10,9 tỷ USD, tăng 130% chỉ trong một quý so với mức 4,8 tỷ USD trước đó. Doanh thu định kỳ hàng năm của công ty này dự kiến chạm 50 tỷ USD vào cuối quý 2, vượt xa con số 30 tỷ USD ghi nhận hồi tháng 3. OpenAI cũng không kém, đạt 5,7 tỷ USD chỉ trong quý 1/2026, trong khi cả nửa đầu 2025 mới được khoảng 4,3 tỷ USD. Google thì xử lý 3,2 triệu tỷ token mỗi tháng, gấp 7 lần cùng kỳ năm ngoái.
OpenAI vừa ra mắt mô hình "đảm bảo dung lượng", cho phép khách hàng cam kết sử dụng sức mạnh tính toán trong 1 đến 3 năm để đổi lấy chiết khấu. Đây là cách các ông lớn giữ chân khách hàng dài hạn trong bối cảnh nguồn cung vẫn còn hạn chế. Việc Andrej Karpathy gia nhập Anthropic càng nhắc nhở thị trường rằng nhân tài cấp cao vẫn là nút thắt cổ chai nghiêm trọng nhất trong toàn bộ chuỗi cung ứng AI.
Chi phí không giảm mà còn tăng.
GPT-5.5 có giá gấp đôi GPT-5.4. Phân tích của Citi trên dữ liệu OpenRouter cho thấy chi phí thực tế tăng từ 49% đến 92% tùy khối lượng công việc. Google giảm gói AI Ultra từ 250 USD xuống 200 USD mỗi tháng (khoảng 5 triệu đồng), đồng thời ra mắt gói 100 USD dành cho "người dùng chuyên nghiệp". Thị trường đang phân tầng rõ rệt, ai dùng nhiều hơn thì trả nhiều hơn.
Về bảng xếp hạng mô hình hiện tại, GPT-5.5 của OpenAI dẫn đầu với 60 điểm, giá 4,35 USD mỗi triệu token. Gemini 3.1 Pro Preview và Claude Opus 4.7 cùng đứng thứ hai với 57 điểm, nhưng Google cạnh tranh hơn ở mức 1,74 USD, còn Claude Opus 4.7 có giá 4,10 USD mỗi triệu token.
Phía trước, Citi dự báo hàng loạt mô hình mới ra mắt trong các quý tới, từ Gemini 3.5 Pro, Claude Sonnet 4.7 trong quý 2, đến GPT-6.0 trong quý 3, rồi Claude Opus 5 và DeepSeek V5 vào quý 4. Chính phủ Mỹ cũng đang chuẩn bị một khung pháp lý tự nguyện, yêu cầu các phòng lab AI chia sẻ mô hình tiên tiến với chính phủ 90 ngày trước khi công bố rộng rãi.
Câu hỏi trung tâm mà báo cáo đặt ra không phải là AI có tiếp tục tăng trưởng không, mà là ai sẽ thực sự hưởng lợi từ "lợi tức năng suất" đó: nhà cung cấp phần mềm, nền tảng AI, doanh nghiệp sử dụng, hay người lao động. Đây sẽ là chủ đề định giá cốt lõi của thị trường vốn trong giai đoạn tiếp theo.