The Storm Riders
Writer
Chỉ mới đầu năm nay, thông điệp từ các tập đoàn công nghệ gửi đến nhân viên vẫn vô cùng nhất quán: Hãy tích hợp trí tuệ nhân tạo vào công việc nhiều nhất có thể. Nhân viên gọi xu hướng này là "tokenmaxxing", trong đó mỗi "token" là một đơn vị dữ liệu tương đương với một mảnh từ. Tại Meta và Amazon, nhân sự thậm chí còn đua nhau trên các bảng xếp hạng nội bộ để xem ai là người tiêu thụ nhiều token nhất.
Nhưng cuộc vui ngắn chẳng tày gang khi những hóa đơn khổng lồ từ các nhà cung cấp như OpenAI hay Anthropic ập đến. Kỷ nguyên dùng AI vô tội vạ đang nhanh chóng bị khai tử để nhường chỗ cho "tokenminning" - trào lưu tối thiểu hóa lượng token sử dụng nhằm cứu vãn ngân sách.
Hậu quả nhãn tiền đã xuất hiện. Meta vừa thông báo cho nhân viên rằng họ sẽ sớm giới hạn mức sử dụng AI sau khi ghi nhận chi phí tăng theo cấp số nhân. Tập đoàn này cùng Amazon cũng đã âm thầm gỡ bỏ các bảng xếp hạng thi đua dùng token trước đó.
Trong khi đó, vào tháng 5, Uber thừa nhận đã tiêu sạch toàn bộ ngân sách AI dự kiến cho cả năm chỉ trong vòng vỏn vẹn 4 tháng. Để khắc phục, hãng gọi xe này buộc phải áp hạn mức hằng tháng đối với các công cụ hỗ trợ lập trình bằng AI. Gã khổng lồ bán lẻ Walmart cũng nhanh chóng thiết lập các ranh giới sử dụng cho nhiều công cụ AI khác nhau.
Phần lớn doanh thu của các công ty AI không đến từ những gói cá nhân vài chục USD, mà từ các tập đoàn lớn có hàng vạn nhân sự liên tục truy cập hệ thống. Một tác vụ đơn giản như tóm tắt biên bản họp chỉ tốn vài trăm token, nhưng việc viết mã nguồn để xây dựng tính năng mới có thể ngốn tới hàng chục nghìn token chỉ trong tích tắc.
Chi phí vận hành càng phình to khi các thế hệ AI mới ra đời mạnh mẽ hơn nhưng cũng tốn kém hơn. Điển hình như Fable, mô hình AI mới nhất của Anthropic, có giá đắt gấp đôi so với phiên bản Opus tiền nhiệm. Dù có sẵn các lựa chọn rẻ hơn, nhiều nhân viên vẫn giữ thói quen lạm dụng các mô hình mạnh nhất cho mọi tác vụ nhỏ nhặt.
Thói quen sử dụng cũng đã thay đổi đáng kể. Thay vì chỉ trò chuyện đơn thuần với chatbot, các kỹ sư hiện nay thường triển khai các "AI agent" (đại lý AI tự trị) chạy liên tục nhiều giờ để xử lý các tác vụ phức tạp. Hệ quả là một kỹ sư có thể dễ dàng tiêu tốn hàng chục nghìn USD tiền token mỗi tháng.
Dù vậy, các ông lớn không hoàn toàn quay lưng với công nghệ mới. Meta dự kiến vẫn chi hàng tỷ USD cho AI năm nay nhưng đang tìm mọi cách cắt giảm chi phí ở những nơi có thể mà vẫn giữ nguyên kết quả công việc. Hãng đã yêu cầu các kỹ sư chuyển sang dùng MetaCode - công cụ hỗ trợ lập trình nội bộ - thay vì các giải pháp bên thứ ba.
Salesforce cũng lên kế hoạch chi hàng trăm triệu USD cho AI nhưng đã chuyển sang đo lường bằng "đơn vị công việc của AI agent" thay vì đếm token, nhằm phản ánh chính xác đầu ra thực tế thay vì tần suất sử dụng.
Việc chuyển từ tư duy dùng tối đa sang sử dụng thông minh và có chọn lọc đang trở thành rào cản sinh tồn đầu tiên của các doanh nghiệp trong cơn sốt AI hiện tại.
Nhưng cuộc vui ngắn chẳng tày gang khi những hóa đơn khổng lồ từ các nhà cung cấp như OpenAI hay Anthropic ập đến. Kỷ nguyên dùng AI vô tội vạ đang nhanh chóng bị khai tử để nhường chỗ cho "tokenminning" - trào lưu tối thiểu hóa lượng token sử dụng nhằm cứu vãn ngân sách.
Cơn sốt phanh gấp khi ngân sách bốc hơi
Sự đảo chiều nhanh chóng chỉ sau vài tháng cho thấy các doanh nghiệp đang lúng túng thế nào trong việc định hình cách khai thác AI sao cho hợp lý. Rob May, Giám đốc điều hành của Neurometric, nhận định rằng nhiều CEO trước đây không biết cách đo lường năng lực công nghệ của nhân viên nên đã chọn cách đơn giản nhất: xem ai dùng nhiều token nhất. Cách tiếp cận này vô tình cổ xúy cho số lượng thay vì năng suất thực tế.Hậu quả nhãn tiền đã xuất hiện. Meta vừa thông báo cho nhân viên rằng họ sẽ sớm giới hạn mức sử dụng AI sau khi ghi nhận chi phí tăng theo cấp số nhân. Tập đoàn này cùng Amazon cũng đã âm thầm gỡ bỏ các bảng xếp hạng thi đua dùng token trước đó.
Trong khi đó, vào tháng 5, Uber thừa nhận đã tiêu sạch toàn bộ ngân sách AI dự kiến cho cả năm chỉ trong vòng vỏn vẹn 4 tháng. Để khắc phục, hãng gọi xe này buộc phải áp hạn mức hằng tháng đối với các công cụ hỗ trợ lập trình bằng AI. Gã khổng lồ bán lẻ Walmart cũng nhanh chóng thiết lập các ranh giới sử dụng cho nhiều công cụ AI khác nhau.
Gánh nặng từ mô hình đắt đỏ và trợ lý tự trị
Phần lớn doanh thu của các công ty AI không đến từ những gói cá nhân vài chục USD, mà từ các tập đoàn lớn có hàng vạn nhân sự liên tục truy cập hệ thống. Một tác vụ đơn giản như tóm tắt biên bản họp chỉ tốn vài trăm token, nhưng việc viết mã nguồn để xây dựng tính năng mới có thể ngốn tới hàng chục nghìn token chỉ trong tích tắc.
Chi phí vận hành càng phình to khi các thế hệ AI mới ra đời mạnh mẽ hơn nhưng cũng tốn kém hơn. Điển hình như Fable, mô hình AI mới nhất của Anthropic, có giá đắt gấp đôi so với phiên bản Opus tiền nhiệm. Dù có sẵn các lựa chọn rẻ hơn, nhiều nhân viên vẫn giữ thói quen lạm dụng các mô hình mạnh nhất cho mọi tác vụ nhỏ nhặt.
Thói quen sử dụng cũng đã thay đổi đáng kể. Thay vì chỉ trò chuyện đơn thuần với chatbot, các kỹ sư hiện nay thường triển khai các "AI agent" (đại lý AI tự trị) chạy liên tục nhiều giờ để xử lý các tác vụ phức tạp. Hệ quả là một kỹ sư có thể dễ dàng tiêu tốn hàng chục nghìn USD tiền token mỗi tháng.
Tìm lối thoát giữa vòng xoáy chi phí
Nhiều doanh nghiệp thừa nhận họ đang phải tính toán thực tế hơn vì chưa thấy được lợi nhuận rõ ràng từ các khoản đầu tư này. Andrew Macdonald, Giám đốc vận hành của Uber, chia sẻ trong một buổi podcast gần đây rằng rất khó để biện minh cho chi phí khổng lồ này khi chưa thể liên kết trực tiếp việc dùng AI với số lượng tính năng hữu ích thực tế được xuất xưởng.Dù vậy, các ông lớn không hoàn toàn quay lưng với công nghệ mới. Meta dự kiến vẫn chi hàng tỷ USD cho AI năm nay nhưng đang tìm mọi cách cắt giảm chi phí ở những nơi có thể mà vẫn giữ nguyên kết quả công việc. Hãng đã yêu cầu các kỹ sư chuyển sang dùng MetaCode - công cụ hỗ trợ lập trình nội bộ - thay vì các giải pháp bên thứ ba.
Salesforce cũng lên kế hoạch chi hàng trăm triệu USD cho AI nhưng đã chuyển sang đo lường bằng "đơn vị công việc của AI agent" thay vì đếm token, nhằm phản ánh chính xác đầu ra thực tế thay vì tần suất sử dụng.
Kết luận
Để giải quyết bài toán đau đầu này, giải pháp khả dĩ nhất là phân loại tác vụ. AT&T cho biết họ có thể tiết kiệm tới 90% chi phí bằng cách chỉ dùng các siêu mô hình cho những nhiệm vụ cực kỳ phức tạp, và chuyển dịch phần lớn công việc phổ thông còn lại sang các mô hình AI giá rẻ.Việc chuyển từ tư duy dùng tối đa sang sử dụng thông minh và có chọn lọc đang trở thành rào cản sinh tồn đầu tiên của các doanh nghiệp trong cơn sốt AI hiện tại.