Trương Quang
Writer
Liệu có cách nào giúp doanh nghiệp tận dụng AI mạnh mẽ mà không “cháy túi” vì chi phí vận hành khổng lồ?
Những mô hình AI tạo sinh hiện nay rất ấn tượng, nhưng để huấn luyện và vận hành chúng, lượng tài nguyên tính toán cần thiết là khổng lồ. Điều này khiến chi phí tăng vọt, kéo theo những lo ngại về năng lượng và môi trường. Nguyên nhân sâu xa nằm ở cách AI hiện tại tạo ra văn bản, khi nó phải xử lý từng từ, từng ký tự một cách tuần tự, gây ra điểm nghẽn hiệu suất.
Với các doanh nghiệp xử lý khối lượng dữ liệu lớn như tài chính, IoT hay thương mại điện tử, điều này khiến việc phân tích hay tạo báo cáo trở nên chậm chạp và tốn kém. Nhưng mô hình mới mang tên CALM Continuous Autoregressive Language Model có thể thay đổi toàn bộ cách AI hoạt động.
Kết quả thật ấn tượng: mô hình thử nghiệm của CALM chỉ cần ít hơn 44% FLOP cho quá trình huấn luyện và 34% cho suy luận so với một Transformer thông thường nhưng vẫn giữ hiệu năng tương đương. Với quy mô doanh nghiệp, điều này có thể tiết kiệm hàng trăm triệu đô la mỗi năm trong chi phí tính toán tương đương hơn 2.600 nghìn tỷ VNĐ trên phạm vi toàn cầu.
Tuy nhiên, việc chuyển sang không gian liên tục cũng khiến nhóm nghiên cứu phải xây dựng lại gần như toàn bộ bộ công cụ AI. CALM không thể dựa trên những cơ chế quen thuộc như softmax hay Perplexity vì nó không còn hoạt động theo xác suất truyền thống. Thay vào đó, họ giới thiệu một cơ chế mới mang tên Energy Transformer và thước đo BrierLM, giúp mô hình được “thưởng” khi dự đoán chính xác mà không cần tính xác suất.
Họ thậm chí còn phải tạo ra thuật toán lấy mẫu không xác suất, cho phép điều chỉnh độ chính xác và độ đa dạng đầu ra mà không phụ thuộc vào các phân phối thống kê phức tạp.
Nếu được phát triển thương mại, những mô hình như CALM có thể giúp doanh nghiệp triển khai AI một cách kinh tế, bền vững và ít rủi ro hơn, từ trung tâm dữ liệu cho đến các ứng dụng biên. Việc giảm FLOP trên mỗi bước xử lý không chỉ cắt giảm chi phí mà còn là lợi thế cạnh tranh mới, khi tốc độ và chi phí trở thành yếu tố sống còn trong thời đại AI hóa.
Có lẽ đã đến lúc các doanh nghiệp không chỉ hỏi “AI của tôi mạnh đến đâu?” mà nên hỏi “AI của tôi hiệu quả đến mức nào?”.
Đọc chi tiết tại đây: https://www.artificialintelligence-...ew-model-design-fix-high-enterprise-ai-costs/
Giữ bình tĩnh, vì AI có thể sắp rẻ hơn rất nhiều
Trong khi nhiều lãnh đạo doanh nghiệp đang đau đầu vì chi phí khổng lồ khi triển khai các mô hình AI, một thiết kế kiến trúc mới vừa được Tencent AI và Đại học Thanh Hoa công bố đang mở ra một hướng đi đầy hứa hẹn.Những mô hình AI tạo sinh hiện nay rất ấn tượng, nhưng để huấn luyện và vận hành chúng, lượng tài nguyên tính toán cần thiết là khổng lồ. Điều này khiến chi phí tăng vọt, kéo theo những lo ngại về năng lượng và môi trường. Nguyên nhân sâu xa nằm ở cách AI hiện tại tạo ra văn bản, khi nó phải xử lý từng từ, từng ký tự một cách tuần tự, gây ra điểm nghẽn hiệu suất.
Với các doanh nghiệp xử lý khối lượng dữ liệu lớn như tài chính, IoT hay thương mại điện tử, điều này khiến việc phân tích hay tạo báo cáo trở nên chậm chạp và tốn kém. Nhưng mô hình mới mang tên CALM Continuous Autoregressive Language Model có thể thay đổi toàn bộ cách AI hoạt động.
Khi AI không còn nghĩ từng từ
Thay vì dự đoán từng “token” (từ hoặc ký tự rời rạc), CALM chuyển sang dự đoán các vectơ liên tục, nghĩa là gộp nhiều từ lại thành một khối thông tin thống nhất. Ví dụ, thay vì xử lý “the”, “cat”, “sat” thành ba bước riêng, CALM nén chúng thành một đơn vị.Kết quả thật ấn tượng: mô hình thử nghiệm của CALM chỉ cần ít hơn 44% FLOP cho quá trình huấn luyện và 34% cho suy luận so với một Transformer thông thường nhưng vẫn giữ hiệu năng tương đương. Với quy mô doanh nghiệp, điều này có thể tiết kiệm hàng trăm triệu đô la mỗi năm trong chi phí tính toán tương đương hơn 2.600 nghìn tỷ VNĐ trên phạm vi toàn cầu.
Tuy nhiên, việc chuyển sang không gian liên tục cũng khiến nhóm nghiên cứu phải xây dựng lại gần như toàn bộ bộ công cụ AI. CALM không thể dựa trên những cơ chế quen thuộc như softmax hay Perplexity vì nó không còn hoạt động theo xác suất truyền thống. Thay vào đó, họ giới thiệu một cơ chế mới mang tên Energy Transformer và thước đo BrierLM, giúp mô hình được “thưởng” khi dự đoán chính xác mà không cần tính xác suất.
Họ thậm chí còn phải tạo ra thuật toán lấy mẫu không xác suất, cho phép điều chỉnh độ chính xác và độ đa dạng đầu ra mà không phụ thuộc vào các phân phối thống kê phức tạp.
Tương lai của AI doanh nghiệp: hiệu quả hơn, bền vững hơn
CALM có thể là dấu hiệu đầu tiên cho thấy kỷ nguyên “to hơn là tốt hơn” của AI đang dần kết thúc. Thay vì chỉ mở rộng quy mô mô hình và tiêu tốn tài nguyên khổng lồ, hướng tiếp cận mới tập trung vào hiệu quả kiến trúc làm cho mỗi bước xử lý của AI mang nhiều ý nghĩa hơn.Nếu được phát triển thương mại, những mô hình như CALM có thể giúp doanh nghiệp triển khai AI một cách kinh tế, bền vững và ít rủi ro hơn, từ trung tâm dữ liệu cho đến các ứng dụng biên. Việc giảm FLOP trên mỗi bước xử lý không chỉ cắt giảm chi phí mà còn là lợi thế cạnh tranh mới, khi tốc độ và chi phí trở thành yếu tố sống còn trong thời đại AI hóa.
Có lẽ đã đến lúc các doanh nghiệp không chỉ hỏi “AI của tôi mạnh đến đâu?” mà nên hỏi “AI của tôi hiệu quả đến mức nào?”.
Đọc chi tiết tại đây: https://www.artificialintelligence-...ew-model-design-fix-high-enterprise-ai-costs/