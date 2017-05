NVIDIA GV100: siêu chip đồ hoạ Volta 12 nm cho AI, 21,1 tỷ transistor, giá 3,4 tỷ đồng

Nghiên cứu trí tuệ nhân tạo (AI) đang là lĩnh vực "hot" trong giới công nghệ. NVIDIA, một trong các hãng công nghệ hàng đầu thế giới về đồ hoạ, vừa cho ra mắt siêu chip GV100 dựa trên kiến trúc Volta với kích thước "điên rồ".

Các fan của công ty đồ hoạ màu xanh có lẽ không lạ lùng gì với những con chip khổng lồ mà NVIDIA từng sản xuất. Với mục tiêu luôn là người dẫn đầu về đồ hoạ, hãng này không ngần ngại làm ra những con chip lớn nhất (tính tại thời điểm ra mắt) và dĩ nhiên là năng lực tính toán cũng khủng bố không kém. Mặc dù vậy, với Volta GV100, chỉ có một từ "shock" để mô tả về con chip.

Trước hết, GV100 vẫn là một chip đồ hoạ (GPU). Nó có 5376 nhân CUDA, nhiều gấp 1,4 lần chip GP100 (Pascal) ra mắt trước đó. Nhưng điểm đặc biệt ở GV100 là ngoài các đơn vị tính toán quen thuộc (INT, FP32, FP64), lần đầu trong các kiến trúc chip của NVIDIA xuất hiện nhân Tensor. Đây là nhân tính toán đặc biệt được NVIDIA phát triển để phục vụ cho các phép toán deep learning, vốn đang phổ biến trong nghiên cứu AI, đặc biệt là cái giải thuật về ma trận.

Thông số kỹ thuật, sơ đồ cấu tạo chip GV100 và cấu tạo 1 block cơ sở của GV100 (16 nhân CUDA, 16 nhân INT, 8 nhân FP64 và 2 nhân Tensor)

1 SM kiến trúc Volta gồm 4 block như trên, 1 chip GV100 hoàn chỉnh có 84 SM

Volta là kiến trúc được NVIDIA viết riêng cho tính toán AI dựa trên các giải thuật về ma trận

Do tính chất của mình, các nhân Tensor có kích thước rất to và chiếm một lượng silicon khá lớn để xây dựng nên. Dựa vào sơ đồ khối do NVIDIA công bố, trên GV100, cứ 1 nhân Tensor có kích thước gần tương đương 16 nhân CUDA (FP32) hoặc 8 nhân FP64! Tức với toàn bộ con chip GV100, chỉ có 672 nhân Tensor tương ứng với 5376 nhân CUDA và 2688 nhân FP64. Với số lượng đơn vị tính toán "khủng bố" như thế, băng thông nhớ là vấn đề rất nghiêm trọng. NVIDIA buộc phải sử dụng tới 16 GB bộ nhớ HBM2 4096-bit có bus 1750 MHz cho tổng băng thông lên đến 900 GB/s!

"Nhồi nhét" bao nhiêu thứ như vậy, bạn hình dung GV100 sẽ có kích thước đến mức nào? 815 mm2, chỉ cho một con chip 21,1 tỷ transistor duy nhất! Và GV100 được sản xuất trên dây chuyền 12 nm FFN do TSMC "ưu ái" làm riêng cho NVIDIA. Đây là phiên bản đặc biệt được TSMC phát triển từ tiến trình 16 nm FF. Nếu không áp dụng tiến trình đặc biệt này, chắc chắn kích thước của GV100 sẽ không dừng lại ở con số 815 mm2 trên. Để tiện so sánh, con chip GP100 do NVIDIA ra mắt trước đấy có 15,3 tỷ transistor, sản xuất trên tiến trình 16 nm FF và có kích thước cũng "khủng" không kém ở mức 610 mm2.

Bảng so sánh thông số kỹ thuật các dòng card Tesla của NVIDIA

Tuy vậy, việc sử dụng một tiến trình sản xuất "ưu ái riêng" khiến cho chi phí sản xuất GV100 trở nên cực kỳ đắt đỏ. Yếu tố này càng trầm trọng hơn khi đây gần như là con chip lớn nhất thế giới (tính tới khi ra mắt). Những con chip có kích thước càng lớn thì rủi ro bị lỗi trong quá trình sản xuất càng cao. Trên thực tế, sản phẩm hoàn chỉnh mà NVIDIA bán ra dựa trên chip GV100 là card Tesla V100, chỉ có 5120/5376 nhân CUDA sử dụng được. Chiếc card này có năng lực tính toán chính xác đơn (FP32) 15 TFlops, chính xác kép (FP64) 8,5 TFlops và chính xác nửa (FP16) 30 TFlops. Nếu con chip GV100 không bị lỗi, chắc chắn năng lực tính toán của nó sẽ còn cao hơn!

Song, nếu chỉ là gamer, bạn có lẽ đừng nên nghĩ tới chiếc card Tesla hay con chip GV100 này. Với tất cả các "sự khủng" mà NVIDIA đặt vào đấy, công ty có tiếng "giá không p/p" này không hề có ý định bán con chip trên cho gamer. Cụ thể hãng này chỉ bán Tesla V100 theo "bộ" 8 chiếc, nằm trong mẫu server có tên DGX-1V, với giá lên đến... 149.000 USD, tức gần 3,4 tỷ đồng! Và thậm chí ngay cả khi bạn có ý "gỡ máy bộ" ra bán "lẻ", thì điều này cũng không thể vì chiếc card này sử dụng một form thiết kế đặc biệt có tên SXM2 (sử dụng giao tiếp NVLink 2 thay vì PCI Express - PCIe). DGX-1V sẽ được bán vào Q3 này.

Card Tesla V100 sẽ có mặt đầu tiên trong các hệ thống server DGX-1V với giá gần 3,4 tỷ đồng. Phiên bản PCIe hiện chưa rõ giá thành và thời điểm ra mắt

Cũng trong sự kiện công bố GV100, NVIDIA cho biết hãng sẽ cho ra mắt 2 mẫu Tesla V100 dựa trên giao tiếp PCIe. Nhưng giá thành và thời điểm ra mắt chưa được tiết lộ.

Huyền Thế