From Beijing with Love
Cháu đã lớn thế này rồi à. Lại đây chú ôm cái coi.
OpenAI đã công bố chip AI tùy chỉnh đầu tiên của mình, Jalapeño, một bộ tăng tốc suy luận được thiết kế riêng cho các tác vụ LLM, cung cấp năng lượng cho ChatGPT, Codex và các sản phẩm tác nhân trong tương lai, được phát triển với sự hợp tác của Broadcom.
Chip này được thiết kế từ đầu và hoàn thiện trong 9 tháng - chu kỳ ASIC nhanh nhất cho chất bán dẫn hiệu năng cao - sử dụng các mô hình của OpenAI để tối ưu hóa, với các thử nghiệm ban đầu cho thấy hiệu năng trên mỗi watt tốt hơn so với các sản phẩm dẫn đầu hiện nay.
Bằng cách tham gia vào thiết kế chip, OpenAI mở rộng nền tảng toàn diện của mình sang cơ sở hạ tầng, hướng đến mục tiêu giảm chi phí, mở rộng quy mô trí tuệ nhanh hơn và tiếp cận AI rộng rãi hơn, với các triển khai ban đầu được lên kế hoạch vào cuối năm 2026.
Thông báo của OpenAI:
Xu hướng tự thiết kế chip chuyên dụng đang rất mạnh ở các ông lớn AI để giảm phụ thuộc vào Nvidia và tối ưu chi phí vận hành. Cụ thể có Google là công ty tiên phong từ năm 2015 với dòng chip TPU (Tensor Processing Unit) qua nhiều thế hệ (từ v1 đến Trillium, TPU 8t/8i…). Chip này hỗ trợ cả training và inference, được sử dụng rộng rãi nội bộ cũng như trên Google Cloud. Các thế hệ mới nhất đã hỗ trợ tốt cho agentic AI.
Meta phát triển MTIA (Meta Training & Inference Accelerator) qua nhiều phiên bản (v1, v2i, MTIA 300/400/500…). Chip này chủ yếu dùng cho inference, đặc biệt là recommendation system và GenAI. Meta đã triển khai hàng trăm nghìn con, hợp tác với Broadcom, nhằm giảm đáng kể chi phí vận hành cho Facebook và Instagram.
Microsoft có dòng chip Maia (từ Maia 100 đến Maia 200). Maia 200 được sản xuất trên tiến trình TSMC 3nm, tối ưu mạnh cho low-precision (FP4/FP8), dùng trong Azure và hỗ trợ cả OpenAI.
Amazon (AWS) phát triển Trainium cho training và Inferentia cho inference. Hai dòng chip này được sử dụng nội bộ và cung cấp cho khách hàng trên AWS (ví dụ Anthropic).OpenAI mới nhất là Jalapeño (thế hệ đầu tiên), tập trung chuyên sâu vào inference LLM. Đây là bước đi quan trọng giúp OpenAI kiểm soát tốt hơn hạ tầng và chi phí.
Chip này được thiết kế từ đầu và hoàn thiện trong 9 tháng - chu kỳ ASIC nhanh nhất cho chất bán dẫn hiệu năng cao - sử dụng các mô hình của OpenAI để tối ưu hóa, với các thử nghiệm ban đầu cho thấy hiệu năng trên mỗi watt tốt hơn so với các sản phẩm dẫn đầu hiện nay.
Bằng cách tham gia vào thiết kế chip, OpenAI mở rộng nền tảng toàn diện của mình sang cơ sở hạ tầng, hướng đến mục tiêu giảm chi phí, mở rộng quy mô trí tuệ nhanh hơn và tiếp cận AI rộng rãi hơn, với các triển khai ban đầu được lên kế hoạch vào cuối năm 2026.
Thông báo của OpenAI:
Jalapeño được thiết kế từ đầu bởi OpenAI (hợp tác với Broadcom) chuyên tối ưu cho inference LLM (như chạy ChatGPT, Codex, API và các sản phẩm agentic tương lai). Chip này tập trung vào hiệu suất trên watt cao hơn, giúp giảm chi phí và mở rộng quy mô. OpenAI đã tape-out và nhận sample chỉ trong 9 tháng - rất nhanh so với ngành bán dẫn. Kế hoạch triển khai quy mô lớn vào cuối 2026.Chúng tôi đã thiết kế và chế tạo chip AI đầu tiên của mình: Jalapeño.
Được thiết kế từ đầu bởi OpenAI và đưa vào sản xuất cùng với @Broadcom, Jalapeño được chế tạo chuyên dụng cho các tác vụ LLM hỗ trợ ChatGPT, Codex, API và các sản phẩm tác nhân trong tương lai.
Chip là nền tảng của nền kinh tế AI. Việc tự xây dựng chip sẽ mở rộng nền tảng toàn diện của chúng tôi từ sản phẩm đến mô hình và cơ sở hạ tầng, và sẽ giúp chúng tôi mở rộng quy mô trí tuệ, phục vụ nhiều người hơn và mở rộng khả năng tiếp cận AI.
Xu hướng tự thiết kế chip chuyên dụng đang rất mạnh ở các ông lớn AI để giảm phụ thuộc vào Nvidia và tối ưu chi phí vận hành. Cụ thể có Google là công ty tiên phong từ năm 2015 với dòng chip TPU (Tensor Processing Unit) qua nhiều thế hệ (từ v1 đến Trillium, TPU 8t/8i…). Chip này hỗ trợ cả training và inference, được sử dụng rộng rãi nội bộ cũng như trên Google Cloud. Các thế hệ mới nhất đã hỗ trợ tốt cho agentic AI.
Meta phát triển MTIA (Meta Training & Inference Accelerator) qua nhiều phiên bản (v1, v2i, MTIA 300/400/500…). Chip này chủ yếu dùng cho inference, đặc biệt là recommendation system và GenAI. Meta đã triển khai hàng trăm nghìn con, hợp tác với Broadcom, nhằm giảm đáng kể chi phí vận hành cho Facebook và Instagram.
Microsoft có dòng chip Maia (từ Maia 100 đến Maia 200). Maia 200 được sản xuất trên tiến trình TSMC 3nm, tối ưu mạnh cho low-precision (FP4/FP8), dùng trong Azure và hỗ trợ cả OpenAI.
Amazon (AWS) phát triển Trainium cho training và Inferentia cho inference. Hai dòng chip này được sử dụng nội bộ và cung cấp cho khách hàng trên AWS (ví dụ Anthropic).OpenAI mới nhất là Jalapeño (thế hệ đầu tiên), tập trung chuyên sâu vào inference LLM. Đây là bước đi quan trọng giúp OpenAI kiểm soát tốt hơn hạ tầng và chi phí.