Lan Thanh
Moderator
Tại hội nghị dành cho nhà phát triển I/O năm nay, Google đã công bố TPU "tiên tiến nhất" của mình. Trillium, bộ tăng tốc thuật toán học máy, đại diện cho đỉnh cao của hơn một thập kỷ nghiên cứu về phần cứng AI chuyên dụng và là thành phần cơ bản cần thiết để xây dựng làn sóng mô hình nền tảng AI tiếp theo.
Google giải thích rằng TPU đầu tiên được phát triển vào năm 2013 và nếu không có TPU, nhiều dịch vụ phổ biến nhất của công ty sẽ không thể thực hiện được ngày nay. Tìm kiếm bằng giọng nói thời gian thực, nhận dạng đối tượng trong ảnh, dịch ngôn ngữ và các mô hình AI tiên tiến như Gemini, Imagen và Gemma đều được hưởng lợi từ TPU.
Giống như các thế hệ tiền nhiệm, Trillium đã được thiết kế từ đầu để tăng tốc các tác vụ mạng nơ-ron. TPU thế hệ thứ 6 của Google đạt hiệu suất đỉnh cao gấp 4,7 lần trên mỗi chip so với thế hệ TPU trước đó (v5e), nhờ vào việc áp dụng các đơn vị nhân ma trận lớn hơn và tốc độ xung nhịp cao hơn.
Các chip Trillium được trang bị SparseCore thế hệ thứ ba, một bộ tăng tốc chuyên dụng để xử lý "các embedding siêu lớn" phổ biến trong các tác vụ xếp hạng và đề xuất nâng cao. Ngoài ra, các TPU mới còn có dung lượng và băng thông High Bandwidth Memory tăng gấp đôi, cùng với băng thông kết nối tăng gấp đôi so với thế hệ v5e.
Không chỉ mạnh mẽ hơn nhiều, Trillium cũng "thân thiện" hơn về mặt năng lượng. Google cho biết các TPU thế hệ thứ 6 tiết kiệm năng lượng hơn 67% so với TPU v5e. Tập đoàn này đã liệt kê một số khả năng dựa trên AI tiên tiến mà Trillium dự kiến sẽ cung cấp cho khách hàng, chẳng hạn như tương tác giữa con người và ô tô mà Essential AI đang phát triển.
Trillium cũng sẽ cung cấp khả năng tăng tốc AI cho Nuro, một công ty đang phát triển các mô hình AI cho robot, Deep Genomics cho việc khám phá thuốc tiên tiến và Deloitte, công ty nhằm mục đích "chuyển đổi" doanh nghiệp thông qua AI tạo sinh. Google DeepMind cũng sẽ sử dụng TPU Trillium để đào tạo các phiên bản tương lai của các mô hình nền tảng Gemini của chính Google.
Trillium là một phần của AI Hypercomputer, một kiến trúc siêu máy tính mà Google đã thiết kế để quản lý các tác vụ AI tiên tiến nhất. Trong AI Hypercomputer, cơ sở hạ tầng được tối ưu hóa dựa trên TPU và các khung phần mềm mã nguồn mở sẽ hoạt động cùng nhau để đào tạo (và phục vụ) các mô hình AI trong tương lai.
Các công ty bên thứ ba sẽ có thể truy cập vào các phiên bản đám mây mới dựa trên Trillium vào một thời điểm nào đó trong năm nay.
#GoogleIO
Google giải thích rằng TPU đầu tiên được phát triển vào năm 2013 và nếu không có TPU, nhiều dịch vụ phổ biến nhất của công ty sẽ không thể thực hiện được ngày nay. Tìm kiếm bằng giọng nói thời gian thực, nhận dạng đối tượng trong ảnh, dịch ngôn ngữ và các mô hình AI tiên tiến như Gemini, Imagen và Gemma đều được hưởng lợi từ TPU.
Giống như các thế hệ tiền nhiệm, Trillium đã được thiết kế từ đầu để tăng tốc các tác vụ mạng nơ-ron. TPU thế hệ thứ 6 của Google đạt hiệu suất đỉnh cao gấp 4,7 lần trên mỗi chip so với thế hệ TPU trước đó (v5e), nhờ vào việc áp dụng các đơn vị nhân ma trận lớn hơn và tốc độ xung nhịp cao hơn.
Các chip Trillium được trang bị SparseCore thế hệ thứ ba, một bộ tăng tốc chuyên dụng để xử lý "các embedding siêu lớn" phổ biến trong các tác vụ xếp hạng và đề xuất nâng cao. Ngoài ra, các TPU mới còn có dung lượng và băng thông High Bandwidth Memory tăng gấp đôi, cùng với băng thông kết nối tăng gấp đôi so với thế hệ v5e.
Không chỉ mạnh mẽ hơn nhiều, Trillium cũng "thân thiện" hơn về mặt năng lượng. Google cho biết các TPU thế hệ thứ 6 tiết kiệm năng lượng hơn 67% so với TPU v5e. Tập đoàn này đã liệt kê một số khả năng dựa trên AI tiên tiến mà Trillium dự kiến sẽ cung cấp cho khách hàng, chẳng hạn như tương tác giữa con người và ô tô mà Essential AI đang phát triển.
Trillium cũng sẽ cung cấp khả năng tăng tốc AI cho Nuro, một công ty đang phát triển các mô hình AI cho robot, Deep Genomics cho việc khám phá thuốc tiên tiến và Deloitte, công ty nhằm mục đích "chuyển đổi" doanh nghiệp thông qua AI tạo sinh. Google DeepMind cũng sẽ sử dụng TPU Trillium để đào tạo các phiên bản tương lai của các mô hình nền tảng Gemini của chính Google.
Trillium là một phần của AI Hypercomputer, một kiến trúc siêu máy tính mà Google đã thiết kế để quản lý các tác vụ AI tiên tiến nhất. Trong AI Hypercomputer, cơ sở hạ tầng được tối ưu hóa dựa trên TPU và các khung phần mềm mã nguồn mở sẽ hoạt động cùng nhau để đào tạo (và phục vụ) các mô hình AI trong tương lai.
Các công ty bên thứ ba sẽ có thể truy cập vào các phiên bản đám mây mới dựa trên Trillium vào một thời điểm nào đó trong năm nay.
#GoogleIO