OpenAI vừa công bố chip Jalapeño "của nhà trồng được" đầu tiên

From Beijing with Love · 22:11 Hôm qua

OpenAI đã công bố chip AI tùy chỉnh đầu tiên của mình, Jalapeño, một bộ tăng tốc suy luận được thiết kế riêng cho các tác vụ LLM, cung cấp năng lượng cho ChatGPT, Codex và các sản phẩm tác nhân trong tương lai, được phát triển với sự hợp tác của Broadcom.

Chip này được thiết kế từ đầu và hoàn thiện trong 9 tháng - chu kỳ ASIC nhanh nhất cho chất bán dẫn hiệu năng cao - sử dụng các mô hình của OpenAI để tối ưu hóa, với các thử nghiệm ban đầu cho thấy hiệu năng trên mỗi watt tốt hơn so với các sản phẩm dẫn đầu hiện nay.

Bằng cách tham gia vào thiết kế chip, OpenAI mở rộng nền tảng toàn diện của mình sang cơ sở hạ tầng, hướng đến mục tiêu giảm chi phí, mở rộng quy mô trí tuệ nhanh hơn và tiếp cận AI rộng rãi hơn, với các triển khai ban đầu được lên kế hoạch vào cuối năm 2026.

Thông báo của OpenAI:

Chúng tôi đã thiết kế và chế tạo chip AI đầu tiên của mình: Jalapeño.

Được thiết kế từ đầu bởi OpenAI và đưa vào sản xuất cùng với @Broadcom, Jalapeño được chế tạo chuyên dụng cho các tác vụ LLM hỗ trợ ChatGPT, Codex, API và các sản phẩm tác nhân trong tương lai.

Chip là nền tảng của nền kinh tế AI. Việc tự xây dựng chip sẽ mở rộng nền tảng toàn diện của chúng tôi từ sản phẩm đến mô hình và cơ sở hạ tầng, và sẽ giúp chúng tôi mở rộng quy mô trí tuệ, phục vụ nhiều người hơn và mở rộng khả năng tiếp cận AI.

Jalapeño được thiết kế từ đầu bởi OpenAI (hợp tác với Broadcom) chuyên tối ưu cho inference LLM (như chạy ChatGPT, Codex, API và các sản phẩm agentic tương lai). Chip này tập trung vào hiệu suất trên watt cao hơn, giúp giảm chi phí và mở rộng quy mô. OpenAI đã tape-out và nhận sample chỉ trong 9 tháng - rất nhanh so với ngành bán dẫn. Kế hoạch triển khai quy mô lớn vào cuối 2026.

Xu hướng tự thiết kế chip chuyên dụng đang rất mạnh ở các ông lớn AI để giảm phụ thuộc vào Nvidia và tối ưu chi phí vận hành. Cụ thể có Google là công ty tiên phong từ năm 2015 với dòng chip TPU (Tensor Processing Unit) qua nhiều thế hệ (từ v1 đến Trillium, TPU 8t/8i…). Chip này hỗ trợ cả training và inference, được sử dụng rộng rãi nội bộ cũng như trên Google Cloud. Các thế hệ mới nhất đã hỗ trợ tốt cho agentic AI.

Meta phát triển MTIA (Meta Training & Inference Accelerator) qua nhiều phiên bản (v1, v2i, MTIA 300/400/500…). Chip này chủ yếu dùng cho inference, đặc biệt là recommendation system và GenAI. Meta đã triển khai hàng trăm nghìn con, hợp tác với Broadcom, nhằm giảm đáng kể chi phí vận hành cho Facebook và Instagram.

Microsoft có dòng chip Maia (từ Maia 100 đến Maia 200). Maia 200 được sản xuất trên tiến trình TSMC 3nm, tối ưu mạnh cho low-precision (FP4/FP8), dùng trong Azure và hỗ trợ cả OpenAI.

Amazon (AWS) phát triển Trainium cho training và Inferentia cho inference. Hai dòng chip này được sử dụng nội bộ và cung cấp cho khách hàng trên AWS (ví dụ Anthropic).OpenAI mới nhất là Jalapeño (thế hệ đầu tiên), tập trung chuyên sâu vào inference LLM. Đây là bước đi quan trọng giúp OpenAI kiểm soát tốt hơn hạ tầng và chi phí.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

OpenAI vừa công bố chip Jalapeño "của nhà trồng được" đầu tiên

From Beijing with Love

Cháu đã lớn thế này rồi à. Lại đây chú ôm cái coi.

From Beijing with Love

Lỗi kỹ thuật của nhà mạng, một số thuê bao nhận được tin nhắn từ năm 2024 cảnh báo bão

Samsung bắt tay Bộ Y tế thúc đẩy chăm sóc sức khỏe chủ động bằng công nghệ

Hải quân Mỹ tiếp nhận P-8A Poseidon T-1: Chiếc máy bay đầu tiên mở ra kỷ nguyên thử nghiệm mới

Trường USC Rossier ra mắt hai chương trình Tiến sĩ Giáo dục mới nhắm vào khu vực Đông Nam Á

Nga xây hầm trú ẩn khổng lồ cho máy bay ném bom chiến lược tại Engels: Động thái chưa từng có tiền lệ

Thượng nghị sĩ Bernie Sanders kêu gọi quốc hữu hóa OpenAI, Anthropic, xAI...

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Các vấn đề về bản lề của iPhone gập đã được giải quyết, việc ra mắt vào tháng 9 có thể diễn ra theo đúng kế hoạch

Đánh giá nổi bật