Trong một động thái đầy tham vọng nhằm củng cố vị thế thống trị, tập đoàn Nvidia được cho là đang hoàn tất thương vụ mua lại quyền sử dụng công nghệ của startup Groq với giá trị lên tới 20 tỷ USD. Groq – công ty do các cựu kỹ sư Google sáng lập – từng gây tiếng vang lớn nhờ kiến trúc chip LPU (Language Processing Unit) độc đáo, mang lại tốc độ xử lý vượt trội cho các tác vụ suy luận AI.
Thỏa thuận tỷ đô và sự chuyển dịch nhân sự cấp cao
Theo thông tin từ CNBC và xác nhận trên blog của Groq, đây không phải là một thương vụ mua lại toàn bộ doanh nghiệp theo cách truyền thống. Thay vào đó, Nvidia sẽ chi 20 tỷ USD để sở hữu quyền khai thác các tài sản trí tuệ và công nghệ cốt lõi của Groq. Về mặt cấu trúc, Groq vẫn tiếp tục tồn tại như một thực thể độc lập dưới sự điều hành của một CEO mới.
Tuy nhiên, "chất xám" của công ty sẽ có sự dịch chuyển lớn. Nhà sáng lập kiêm CEO Jonathan Ross, cùng Chủ tịch Sunny Madra và đội ngũ lãnh đạo cấp cao sẽ gia nhập Nvidia để trực tiếp phát triển và mở rộng quy mô của công nghệ vừa được chuyển giao. Thương vụ này được đánh giá là nước cờ chiến lược của Nvidia nhằm thâu tóm một đối thủ tiềm năng sở hữu công nghệ bổ trợ đắc lực cho hệ sinh thái GPU hiện có.
CEO Groq Jonathan Ross. Ảnh: Groq
Sức mạnh của LPU: Khi tốc độ là "vũ khí"
Groq không đi theo lối mòn của các đối thủ khác là cố gắng sao chép kiến trúc GPU. Thay vào đó, họ phát triển một kiến trúc hoàn toàn mới mang tên LPU (Language Processing Unit), được tối ưu hóa đặc biệt cho các tác vụ suy luận (inference) với độ trễ cực thấp.
Sự khác biệt nằm ở triết lý thiết kế: trong khi chip của Nvidia xử lý dữ liệu theo xác suất và theo nhóm (batch-oriented), chip Groq lại xử lý xác định theo từng token đơn lẻ. Kết quả là tốc độ tạo token (tps) của Groq vượt trội đáng kể. Các thử nghiệm độc lập cho thấy chip Groq có thể đạt tốc độ 300-500 tps với độ trễ chỉ 1-2 ms, trong khi các giải pháp tương đương của Nvidia dao động ở mức 60-100 tps với độ trễ 8-10 ms. Khi chạy mô hình ngôn ngữ lớn Llama 2 với 70 tỷ tham số, Groq đạt tốc độ 241 tps, gấp đôi nhiều đối thủ trên thị trường.
Chính nhờ ưu thế về tốc độ phản hồi gần như tức thì này, Groq đã trở thành lựa chọn hàng đầu cho các ứng dụng đòi hỏi tính thời gian thực cao như chatbot, phiên âm trực tiếp hay robot công nghiệp. Dù không thể thay thế GPU trong khâu huấn luyện (training) mô hình, nhưng ở khâu suy luận (inference), LPU của Groq đã đánh trúng vào "điểm yếu chí mạng" của các giải pháp hiện hành, như nhận định của chuyên gia AI Yann LeCun.
Hành trình từ "suýt chết" đến thương vụ lịch sử
Được thành lập năm 2016 bởi Jonathan Ross – người từng tham gia thiết kế chip TPU tại Google, Groq đã trải qua một hành trình đầy chông gai. Từng bị các nhà đầu tư từ chối vì cho rằng "không có tiềm năng lâu dài" trước cái bóng quá lớn của Nvidia, công ty đã nhiều lần đứng trước bờ vực phá sản. Ross thừa nhận: "Có lẽ chúng tôi đã bắt đầu hơi sớm".
Tuy nhiên, sự kiên định với tầm nhìn về một con chip chuyên biệt cho suy luận đã được đền đáp khi cơn sốt ChatGPT bùng nổ vào cuối năm 2022. Nhu cầu về năng lực tính toán suy luận tăng vọt đã đưa Groq trở lại đường đua. Trước khi thương vụ với Nvidia diễn ra, Groq đã huy động thành công hàng trăm triệu USD qua các vòng gọi vốn, nâng định giá công ty lên gần 7 tỷ USD vào tháng 9/2024.
Thách thức pháp lý phía trước
Mặc dù hai bên đã đạt được thỏa thuận, giới quan sát nhận định thương vụ này sẽ phải đối mặt với sự giám sát gắt gao từ các cơ quan quản lý chống độc quyền. Việc Nvidia – công ty đang nắm giữ phần lớn thị phần chip AI toàn cầu – thâu tóm một công nghệ đột phá như của Groq có thể làm dấy lên lo ngại về việc triệt tiêu sự cạnh tranh trên thị trường. Nhà phân tích Stacy Rasgon từ Bernstein nhận định rủi ro pháp lý là rào cản cuối cùng và lớn nhất mà thương vụ này cần vượt qua.
Nếu thành công, sự kết hợp giữa hệ sinh thái phần mềm hùng mạnh của Nvidia và kiến trúc xử lý siêu tốc của Groq hứa hẹn sẽ tạo ra những bước nhảy vọt mới cho ngành công nghiệp trí tuệ nhân tạo, đặc biệt là trong việc nâng cao trải nghiệm người dùng với các ứng dụng AI thời gian thực.
Thỏa thuận tỷ đô và sự chuyển dịch nhân sự cấp cao
Theo thông tin từ CNBC và xác nhận trên blog của Groq, đây không phải là một thương vụ mua lại toàn bộ doanh nghiệp theo cách truyền thống. Thay vào đó, Nvidia sẽ chi 20 tỷ USD để sở hữu quyền khai thác các tài sản trí tuệ và công nghệ cốt lõi của Groq. Về mặt cấu trúc, Groq vẫn tiếp tục tồn tại như một thực thể độc lập dưới sự điều hành của một CEO mới.
Tuy nhiên, "chất xám" của công ty sẽ có sự dịch chuyển lớn. Nhà sáng lập kiêm CEO Jonathan Ross, cùng Chủ tịch Sunny Madra và đội ngũ lãnh đạo cấp cao sẽ gia nhập Nvidia để trực tiếp phát triển và mở rộng quy mô của công nghệ vừa được chuyển giao. Thương vụ này được đánh giá là nước cờ chiến lược của Nvidia nhằm thâu tóm một đối thủ tiềm năng sở hữu công nghệ bổ trợ đắc lực cho hệ sinh thái GPU hiện có.
CEO Groq Jonathan Ross. Ảnh: Groq
Sức mạnh của LPU: Khi tốc độ là "vũ khí"
Groq không đi theo lối mòn của các đối thủ khác là cố gắng sao chép kiến trúc GPU. Thay vào đó, họ phát triển một kiến trúc hoàn toàn mới mang tên LPU (Language Processing Unit), được tối ưu hóa đặc biệt cho các tác vụ suy luận (inference) với độ trễ cực thấp.
Sự khác biệt nằm ở triết lý thiết kế: trong khi chip của Nvidia xử lý dữ liệu theo xác suất và theo nhóm (batch-oriented), chip Groq lại xử lý xác định theo từng token đơn lẻ. Kết quả là tốc độ tạo token (tps) của Groq vượt trội đáng kể. Các thử nghiệm độc lập cho thấy chip Groq có thể đạt tốc độ 300-500 tps với độ trễ chỉ 1-2 ms, trong khi các giải pháp tương đương của Nvidia dao động ở mức 60-100 tps với độ trễ 8-10 ms. Khi chạy mô hình ngôn ngữ lớn Llama 2 với 70 tỷ tham số, Groq đạt tốc độ 241 tps, gấp đôi nhiều đối thủ trên thị trường.
Chính nhờ ưu thế về tốc độ phản hồi gần như tức thì này, Groq đã trở thành lựa chọn hàng đầu cho các ứng dụng đòi hỏi tính thời gian thực cao như chatbot, phiên âm trực tiếp hay robot công nghiệp. Dù không thể thay thế GPU trong khâu huấn luyện (training) mô hình, nhưng ở khâu suy luận (inference), LPU của Groq đã đánh trúng vào "điểm yếu chí mạng" của các giải pháp hiện hành, như nhận định của chuyên gia AI Yann LeCun.
Hành trình từ "suýt chết" đến thương vụ lịch sử
Được thành lập năm 2016 bởi Jonathan Ross – người từng tham gia thiết kế chip TPU tại Google, Groq đã trải qua một hành trình đầy chông gai. Từng bị các nhà đầu tư từ chối vì cho rằng "không có tiềm năng lâu dài" trước cái bóng quá lớn của Nvidia, công ty đã nhiều lần đứng trước bờ vực phá sản. Ross thừa nhận: "Có lẽ chúng tôi đã bắt đầu hơi sớm".
Tuy nhiên, sự kiên định với tầm nhìn về một con chip chuyên biệt cho suy luận đã được đền đáp khi cơn sốt ChatGPT bùng nổ vào cuối năm 2022. Nhu cầu về năng lực tính toán suy luận tăng vọt đã đưa Groq trở lại đường đua. Trước khi thương vụ với Nvidia diễn ra, Groq đã huy động thành công hàng trăm triệu USD qua các vòng gọi vốn, nâng định giá công ty lên gần 7 tỷ USD vào tháng 9/2024.
Thách thức pháp lý phía trước
Mặc dù hai bên đã đạt được thỏa thuận, giới quan sát nhận định thương vụ này sẽ phải đối mặt với sự giám sát gắt gao từ các cơ quan quản lý chống độc quyền. Việc Nvidia – công ty đang nắm giữ phần lớn thị phần chip AI toàn cầu – thâu tóm một công nghệ đột phá như của Groq có thể làm dấy lên lo ngại về việc triệt tiêu sự cạnh tranh trên thị trường. Nhà phân tích Stacy Rasgon từ Bernstein nhận định rủi ro pháp lý là rào cản cuối cùng và lớn nhất mà thương vụ này cần vượt qua.
Nếu thành công, sự kết hợp giữa hệ sinh thái phần mềm hùng mạnh của Nvidia và kiến trúc xử lý siêu tốc của Groq hứa hẹn sẽ tạo ra những bước nhảy vọt mới cho ngành công nghiệp trí tuệ nhân tạo, đặc biệt là trong việc nâng cao trải nghiệm người dùng với các ứng dụng AI thời gian thực.