VnReview
Hà Nội

Qualcomm tiết lộ vũ khí mới của Snapdragon 820 - Bộ xử lý Hexagon 680 DSP

Đứng trước nhiều khó khăn từ chính Snapdragon 810 và áp lực từ Samsung lẫn MediaTek, hãng sản xuất chip di động lớn nhất thế giới vừa công bố thông tin chi tiết về bộ xử tín hiệu số (DSP) Hexagon 680 của mình, hứa hẹn sẽ giúp con chip Snapdragon 820 tiết kiệm điện hơn, mát mẻ hơn.

DSP là gì?

Một chip DSP phổ thông

Bộ xử lý tín hiệu số hay digital signal processor (DSP) không phải là một món gì mới. Nó đã tồn tại từ rất lâu trong ngành kỹ thuật điện tử với rất nhiều ứng dụng mà chủ yếu để xử lý các tín hiệu thu thập được từ các bộ cảm biến, thanh lọc chúng rồi chuyển hoá thành dạng dữ liệu khác mà các bộ xử lý khác (ví dụ CPU) sẽ sử dụng sau đó. Ưu điểm của DSP là chúng "chuyên môn hoá" năng lực của mình nên sẽ cho tốc độ xử lý thậm chí hơn hẳn cả những CPU tốt nhất có tại thời điểm đó trên thị trường, nhưng tiêu tốn ít điện năng hơn.

Nhưng nếu DSP tốt đến như thế, tại sao các nhà sản xuất còn dùng tới CPU để làm gì? Vấn đề ở chỗ DSP có năng lực chuyên môn ở một số ứng dụng, và... vô dụng ở những ứng dụng khác. Nhưng CPU thì ngược lại, tuy không chuyên môn nhưng chúng lại có thể xử lý được hầu hết mọi ứng dụng (mà bộ ISA cho phép). Lấy ví dụ DSP của chip Snapdragon xử lý tốt các tín hiệu hình ảnh nhưng lại không thể... chạy WinRAR.

Có một cách đơn giản hơn để hình dung vấn đề này là môi trường làm việc trong một doanh nghiệp. Bạn có thể tuyển tới 10 sinh viên vừa tốt nghiệp với mức lương trung bình 4 triệu/người và yêu cầu họ thiết kế logo hoặc gian hàng trưng bày sản phẩm cho công ty, hoặc đơn giản là làm bảng lương cuối tháng. Về lý thuyết thì họ đều sẽ hoàn thành được việc đó, nhưng vấn đề là làm trong bao lâu và có phát sinh lỗi ngoài ý muốn hay không... Ngược lại, bạn tuyển một chuyên viên thiết kế với mức lương 15 - 20 triệu/tháng, hoặc một kế toán viên chuyên nghiệp. Về mặt tổng lương bỏ ra, rõ ràng là thấp hơn tuyển 10 sinh viên @ 4 triệu/tháng, mà hiệu quả chuyên môn cũng cao hơn hẳn.

Các chức năng của DSP Hexagon 680

Tuy vậy, kế toán viên chỉ rành kế toán, thiết kế viên chỉ rành thiết kế. Nếu bạn giao việc thiết kế cho kế toán và ngược lại, hoặc yêu cầu họ làm những việc khác như giao hàng, quản lý sản phẩm, chăm sóc khách hàng... Thì hiệu quả của họ cũng không khác lắm 10 sinh viên vừa tốt nghiệp trên, nhưng chi phí lương tính trên đầu người lại cao hơn.

Do vậy DSP tuy có lợi điểm riêng, nhưng nó cũng có nhược điểm riêng. Và đầu tư bao nhiêu silicon vào DSP, GPU, CPU, modem, trình điều khiển bộ nhớ... sẽ tuỳ thuộc vào yêu cầu thực tế của con chip.

Hexagon 680 DSP

Trong sự kiện Hot Chips (chuyên đề về thiết kế chip) 2015 hiện đang diễn ra tại California (Mỹ), Qualcomm vừa công bố thông tin về bộ DSP Hexagon 680 mới, vốn sẽ có mặt trên chip Snapdragon 820 (và có thể là các chip khác) sắp ra mắt của hãng này. Tương tự các thế hệ Hexagon trước, Hexagon 680 sẽ đóng vai trò chính trong việc xử lý các tín hiệu hình ảnh. Và trên Snapdragon 820, Hexagon 680 được phân bố trong 3 khu vực: Bộ máy Tính toán (Compute Engines bao gồm CPU và GPU), Modem mạng (GSM, 3G, LTE 4G...), Khu vực Tiết kiệm Điện (Low Power Island vốn sẽ luôn hoạt động kể cả khi CPU, GPU hoặc Modem được tắt). Trong đó đáng chú ý nhất là DSP ở Khu vực Tính toán.

Vị trí các DSP (màu đỏ) trên Snapdragon 820

Một trong những đặc điểm mới mà Hexagon 680 được trang bị là phần mở rộng xử lý vector Hexagon Vector Extensions (HVX). Ngoài khả năng xử lý dữ liệu hình ảnh đến từ các nguồn thông dụng như video (playback trên thiết bị) hoặc camera (record tại chỗ) như các thế hệ Hexagon trước, HVX trên Hexagon 680 sẽ xử lý các tín hiệu thu được từ kính thực tế ảo (VR/AR) hay phân loại ra thông tin vector (ánh mắt, nụ cười...) từ các dữ liệu bitmap (ảnh chân dung chẳng hạn) vốn có vai trò trong thuật toán nhận diện khuôn mặt (face recognition).

Những ứng dụng trên có lẽ không hề mới với bạn. Đúng thế, nhưng trước nay chúng đều được xử lý bởi CPU, một thiết bị không chuyên môn về hình ảnh. Và dù bạn "cảm giác" tốc độ xử lý của CPU nhanh, nhưng thực tế chúng vẫn chậm hơn DSP trong các ứng dụng riêng. Trong so sánh của Qualcomm, bộ xử lý đơn nhân Hexagon 680 có xung 750 MHz vẫn xử lý hình ảnh nhanh gấp 1 - 3 lần 4 nhân Krait (Snapdragon 800) có xung 2,65 Hz (gấp 3,5 lần)! Có nghĩa nếu xung nhịp 2 bên bằng nhau, một nhân Hexagon 680 sẽ nhanh gấp 3 - 10 lần 4 nhân Krait. Hoặc so sánh đơn giản, nếu 4 nhân Krait xử lý 1 hình ảnh hết 3 giây thì 1 nhân Hexagon 680 xử lý chỉ trong 1/3 - 1 giây.

So sánh hiệu năng 1 nhân Hexagon 680 @ 750 MHz với 4 nhân Krait @ 2,65 GHz

Benchmark hiệu năng 4 luồng (nhân?) Hexagon 680

Và vì xử lý tốn ít thời gian hơn, thông thường DSP sẽ tốn ít điện hơn CPU trong cùng công việc. Trong một thiết kế SoC điển hình, phần silicon dùng để xây dựng các nhân CPU thường chiếm nhiều diện tích hơn phần silicon cho DSP. Xung nhịp của nhân CPU cũng thường cao hơn (4 @ 2,65 GHz vs. 1 @ 750 MHz trong ví dụ của Qualcomm). Do vậy về cơ bản, DSP tiết kiệm điện hơn CPU đáng kể trong xử lý chuyên môn. Và vì công việc trên được "nhường cho" DSP, các CPU có "rảnh" thời gian để làm việc khác hoặc "nghỉ ngơi", giúp tiết kiệm pin hơn hoặc cho trải nghiệm ứng dụng mượt mà hơn.

Về cấu tạo chi tiết của Hexagon 680, chúng tôi không đi vào chi tiết vì có nhiều thông tin chuyên ngành. Khối xử lý của Hexagon 680 gồm 4 luồng vô hướng (scalar) VLIW 4-way và 2 luồng hữu hướng (vector) HVX. Mỗi luồng (nhân?) có xung 500 MHz. Điều đặc biệt là dữ liệu của 4 luồng vô hướng đều "chảy" vào bộ đệm L1 Cache và L2 Cache nhưng dữ liệu của 2 luồng hữu hướng chỉ "chảy" vào L2 Cache (dùng chung cho mọi luồng).

Cấu trúc Hexagon 680 và các luồng dữ liệu

Một thông tin nữa mà theo Qualcomm sẽ giúp Snapdragon 820 tiết kiệm hơn trong xử lý hình ảnh là dữ liệu do các cảm biến thu về sẽ được nạp trực tiếp vào L2 Cache của Hexagon 680 chứ không phải thông qua bộ nhớ DRAM như trước đây. Việc bỏ bước này không chỉ giúp tiết kiệm điện (chip DRAM không phải tăng điện thế hoạt động) mà còn giảm bớt độ trễ tín hiệu do tốc độ truy cập vào L2 Cache cao hơn DRAM rất nhiều.

Cảm biến hình ảnh trên điện thoại có thể gửi dữ liệu trực tiếp vào L2 Cache của Hexagon 680

Nhưng so với phần mở rộng NEON có chức năng tương tự ở kiến trúc ARM "gốc", các luồng xử lý của Hexagon 680 không có khả năng xử lý các phép toán dấu phẩy động (floating point) 64-bit. Việc "cắt giảm" này có lẽ nhằm để tiết kiệm lượng silicon dùng để xây dựng các DSP (thực tế không phải lúc nào DSP cũng có sử dụng). Ngoài ra, rất có thể các phép toán dấu phẩy động sẽ được nhân Kyro của Snapdragon 820 đảm nhận (dù hiện tại chúng ta chưa chắc chắn điều này). Do đó, việc thiếu năng lực tính toán 64-bit của Hexagon 680 có thể xem là một điểm "chấp nhận được".

Con én có làm nên mùa xuân?

Sau những thông tin trên, hẳn bạn đang hết sức "phấn khích" về sự trở lại của Qualcomm? Bạn có lẽ nên và có lẽ không...

Tại sao không? Có một thực tế là mọi con chip của Qualcomm được sản xuất từ 2006 cho tới nay đều có DSP kèm theo chúng. Tất nhiên là tuỳ theo nhu cầu của thị trường mà sức mạnh của các mẫu DSP trên cũng được nâng cấp tương ứng (480p, 720p, 1080p, 2K...). Ngay cả chip Snapdragon 810 - thất bại của Qualcomm - cũng mang trên mình bộ xử lý Hexagon V56 (chỉ thua Hexagon 680). Nhưng Hexagon V56 cũng không giúp Snapdragon 810 cứu vãn được tình hình. Vì trong thực tế, DSP không thay thế được CPU.

Snapdragon 810 không sử dụng nhân CPU tuỳ chỉnh như các đàn anh

Và tại sao nên? Snapdragon 820 không chỉ khác 810 ở DSP. Khác biệt quan trọng và lớn nhất chính là ở các nhân CPU, nhân Kyro và nhân ARMv8 "thuần chủng". Bạn có thể đã biết, thành công lớn nhất của Qualcomm là từ 2012 khi tung ra loạt sản phẩm Snapdragon 400/600/800/801/805 dựa trên nhân Krait, vốn được tuỳ chỉnh từ kiến trúc ARMv7. Do vậy tuy chỉ có 4 nhân (Krait) nhưng dòng Snapdragon 80x của Qualcomm vẫn chiếm thế thượng phong tuyệt đối trước các đối thủ ARM khác như Samsung, MediaTek, Texas Instrument, Marvell...

Tuy vậy với Snapdragon 810, Qualcomm không có đủ thời gian để tung ra một nhân Kyro tuỳ chỉnh kịp lúc. Hãng này buộc phải "vay mượn" cấu trúc big.LITTLE mà mọi công ty khác đều cùng có. Ưu thế vượt trội không còn, Snapdragon 810 bị quá nhiệt vì một số yếu tố cộng thêm khác. Một sản phẩm thất bại đã ra đời.

Vậy liệu nhân Kyro sẽ giúp Qualcomm giành lại ánh hào quang với Snapdragon 820? Ngay tại lúc này, chúng ta chưa thể khẳng định. Tuy vậy, với những sai sót đã được nhận biết và hoàn toàn có thể khắc phục, cũng như lượng thời gian cần thiết để các kỹ sư có thể tối ưu lại kiến trúc, các fan Qualcomm có quyền hy vọng vào Kyro. Vì dù sao, dựa trên những triết lý được Qualcomm áp dụng trong thiết kế ra Hexagon 680, sẽ khó mà hình dung được Kyro sẽ dựa trên cùng triết lý đó.

Theo những thông tin chúng ta được biết tới nay, Snapdragon 820 sẽ chỉ có 4 nhân Kyro chứ không phải 8 nhân như Snapdragon 810 (4 nhân Cortex-A57 và 4 nhân Cortex-A53).

Huyền Thế

Tổng hợp từ AnandTech, Tom's Hardware và Wikipedia

Chủ đề khác