VNR Content
Pearl
Nếu bạn dự định chơi game nặng, thực hiện những công việc đòi hỏi sức mạnh tính toán của GPU, dựng hình đồ họa, hỗ trợ nghiên cứu virus corona thông qua dự án Folding@home, hay khai thác tiền mã hóa bằng card đồ họa, bạn hẳn sẽ có phần lo lắng rằng GPU không sớm thì muộn cũng “tã” do xài hao quá nhiều.
Nhưng liệu chuyện đó có xảy ra hay không? Hãy cùng tìm hiểu xem.
Dùng card đồ họa để đào tiền mã hóa
Cho đến thời điểm hiện tại, có một thông tin tương đối rõ ràng như sau: theo một báo cáo vào năm 2020 của một nhà bán lẻ tại Đức, hầu hết các card đồ họa có tỉ lệ hỏng hóc khoảng từ 2 - 5% (tính dựa trên số lượng card được mang đến đổi trả). Và trong năm 2021, Nvidia vẫn cung cấp các bản cập nhật driver cho các card đã ra mắt từ 9 - 10 năm trước (ví dụ như series GTX 600), do đó chúng ta có thể tin rằng một card đồ họa được sử dụng và bảo dưỡng tốt có thể hoạt động đến một thập kỷ - dù rằng đó có lẽ chỉ là trường hợp cá biệt mà thôi.
Tạm bỏ qua những con số, hãy nói về đặc tính vật lý của loại sản phẩm này. Vật liệu và linh kiện dùng để tạo nên card đồ họa không phải làm từ ma thuật: bạn càng dùng chúng nhiều, các thành phần càng nhanh xuống cấp, và khả năng chúng hỏng hoàn toàn càng cao. Do đó sử dụng với tần suất cao chắc chắn ảnh hưởng đến tuổi thọ card đồ họa.
Liệu card đồ họa của bạn có gặp trục trặc hay không còn tùy thuộc vào nhiều yếu tố khác nhau, bao gồm tần suất sử dụng cụ thể, đặc điểm và nhiệt độ lưu thông bên trong, số lần card được bật/tắt, và môi trường hoạt động của card sạch sẽ đến mức nào.
Bởi card đồ họa là một thiết bị phức tạp với nhiều thành phần, mỗi thành phần có thể hư hỏng hoặc xuống cấp theo những cách khác nhau, nên chúng ta sẽ đi qua những thành phần chính của một card đồ họa và tìm hiểu xem chúng có thể “tã” qua thời gian như thế nào.
Trong số những thành phần có thể hỏng đầu tiên của card đồ họa, cần phải nhắc đến quạt tản nhiệt (hay ngắn gọn là quạt), vốn là thành phần di chuyển nhiều nhất. Quạt giữ cho GPU luôn mát nhờ thổi bay khí nóng khỏi chip GPU (với một cụm tản nhiệt), nhờ đó card có thể tiếp tục hoạt động trong thời gian dài.
Tại sao nhiệt lại gây hại cho card đồ họa? Nếu nhiệt đạt một mức nhất định, các bán dẫn sẽ chập chờn, đồng nghĩa card đồ họa sẽ không hoạt động như dự tính. Nếu nhiệt quá cao, bán dẫn trong chip trên card có thể bị hư hại hoàn toàn.
Qua thời gian, quạt tản nhiệt thường bị bám bụi, làm giảm khả năng thổi khí nóng của nó. Hoặc quạt có thể ngừng quay nếu chất bôi trơn bên trong bị khô. Trong cả hai trường hợp, hệ quả xảy ra là nhiệt độ của GPU sẽ tăng cao.
Mọi GPU đều có khả năng tự bảo vệ trước tình huống quá nhiệt bằng kỹ thuật “thermal throttling”, tức tạm thời giảm hoạt động của GPU để hạ nhiệt hệ thống. Cách này sẽ gây ảnh hưởng lớn đến hiệu suất. Do đó nếu GPU của bạn bất ngờ ồn ào hơn bình thường (quạt đang quay nhanh hơn), hoặc có vẻ ì ạch hơn, hãy cân nhắc lau chùi quạt tản nhiệt cùng cụm tản nhiệt của GPU bằng bình xịt khí nén.
Nếu quạt tản nhiệt của GPU bị hỏng hoàn toàn, bạn có thể thay thế nó nếu tìm được linh kiện tương đương từ một cửa hàng máy tính nào đó.
Qua thời gian, keo tản nhiệt có thể bị khô hoặc mất chức năng dẫn nhiệt. Khi điều đó xảy ra, cụm tản nhiệt sẽ không làm mát chip GPU một cách hiệu quả nữa, và nhiệt độ GPU sẽ tăng cao. Giống như trong trường hợp quạt ngừng hạt động, nhiệt độ GPU quá cao sẽ dẫn đến thermal throttling, làm chậm GPU.
Cách giải quyết tốt nhất trong tình huống này là thay keo tản nhiệt mới. Bạn có thể mua keo tại bất kỳ cửa hàng linh kiện máy tính nào.
Bên cạnh chip GPU, một card đồ họa còn bao gồm hàng chục linh kiện điện tử khác như tụ, điện trở, chip nhớ... Bất kỳ thứ gì cũng có thể bị hỏng khi sử dụng với tần suất cao hoặc tiếp xúc với quá nhiều nhiệt. Một số có khả năng dễ hỏng hơn những thứ khác.
Trong số này, tụ là linh kiện có tỉ lệ hỏng cao nhất. Chúng rất nhạy với sự thay đổi nhiệt độ thường xuyên, và một số tụ thậm chí đã hỏng ngay từ khi vừa ra khỏi nhà máy. Nếu bạn có đủ kinh nghiệm để giải quyết các vấn đề liên quan đến tụ, bạn hẳn có thể tự thay tụ hỏng trên card đồ họa một khi tìm được linh kiện thay thế.
Ngoài ra, các mối hàn nối chip và các linh kiện với bảng mạch của card đồ họa cũng có thể bị lão hóa và lỏng theo thời gian, đặc biệt sau những lần làm việc nặng nhọc (nhiệt độ thay đổi thường xuyên), những sơ suất khi lắp ráp, lưu trữ và vận chuyển không đúng cách, hoặc đơn giản là quá nóng. Do đó, sử dụng GPU với tần suất cao hoàn toàn có thể làm tăng nguy cơ lỏng mối hàn. Thay mối hàn là điều khá khó với tay mơ, nhưng không gì là không thể.
Câu hỏi đã đặt ra từ đầu bài viết: liệu chip GPU có “tã” khi sử dụng quá nhiều không? Câu trả lời là có, về mặt lý thuyết, nhưng chỉ dưới những trường hợp đặc biệt mà thôi. Dám chắc là bạn sẽ thấy các linh kiện khác trên card đồ họa bị hỏng trước khi chính bản thân con chip ra đi!
Chip GPU trên card đồ họa chứa hàng triệu, hoặc hàng tỷ, bán dẫn, tất cả được khắc lên một tấm silicon. Bán dẫn sẽ lão hóa theo thời gian, ảnh hưởng đến hiệu suất của chúng. Khi số lượng bán dẫn bị hỏng đạt đến một ngưỡng nhất định, chip sẽ ngừng hoạt động.
Theo trang Semiconductor Engineering, có nhiều lý do giải thích tại sao bán dẫn lại gặp vấn đề qua thời gian do lão hóa (một trong số đó là vì nhiệt), và kích cỡ bán dẫn trên chip càng nhỏ, lỗi càng dễ xảy ra. Các chuyên gia cho rằng chip máy tính ngày nay sẽ không có tuổi thọ cao như chip sản xuất trong thập niên 1990, nhưng tính được tuổi thọ chính xác của chúng thì vẫn là điều không ai dám trả lời, bởi công nghệ này vẫn còn quá mới mẻ.
Cho đến thời điểm hiện tại, NVIDIA không công bố chỉ số MTBF (mean time between failure - thời gian trung bình giữa hai lỗi) của các loại card đồ họa dành cho người tiêu dùng của hãng, nhưng với các card tăng tốc đồ họa doanh nghiệp và công nghiệp thì có. Ví dụ, bảng thông số của card tăng tốc đồ họa Tesla K20X cho biết MTBF của nó (ở nhiệt độ 35 độ C) là 14,7 năm trong “môi trường không được kiểm soát” và 23,8 năm trong “môi trường được kiểm soát”. (Lưu ý rằng, thông thường, phần cứng đồ họa công nghiệp sẽ mạnh hơn và bền bỉ hơn dưới tần suất sử dụng cao so với phần cứng đồ họa tiêu dùng).
Khá thú vị là, trang HowToGeek đã so sánh con số lý thuyết này với dữ liệu cứng thu thập được từ quá trình sử dụng thực tế. Một trong số ít nghiên cứu thực tế (quan sát, đánh giá) về tuổi thọ GPU được thực hiện vào năm 2020 bởi Phòng thí nghiệm quốc gia Oak Ridge đã đánh giá độ bền bỉ của 18.688 card đồ họa Nvidia K20X Kepler từng được dùng trong siêu máy tính Cray XK7 Titan (nay đã “về hưu”) trong quãng thời gian gần 7 năm (2012 - 2019).
Sau một số vướng mắc ban đầu do vấn đề kết nối, họ thấy rằng các card đồ họa của XK7 có độ bền tương đối cao cho đến năm 2016 (tức khoảng 3 - 4 năm từ lúc bắt đầu hoạt động), khi nhiều trong số chúng bắt đầu hỏng. Nhưng bạn biết gì không? Hầu hết hỏng hóc trong loạt card đầu tiên (trước khi bị thay thế) là do điện trở trên bảng mạch của card chứ không phải do chip GPU. Nhìn chung, các tác giả nghiên cứu phát hiện ra MTBF trung bình của các card đồ họa K20X với tần suất sử dụng cao là khoảng 3 năm (không phải 14 - 23 năm như Nvidia quảng cáo), và những card hỏng đầu tiên là những card nóng nhất nằm ở lõi. Kết luận rút ra là “độ bền GPU phụ thuộc vào khả năng tản nhiệt”
Siêu máy tính Cray XK7 Titan
Do đó, nguy cơ hỏng card sẽ tăng cao nếu bạn sử dụng nó với tần suất như trong những siêu máy tính lớn nhất thế giới (vào thời điểm nghiên cứu), và các linh kiện khác như quạt hay điện trở sẽ hỏng trước khi chip GPU hỏng rất lâu. Còn chính xác là bao lâu thì còn phụ thuộc vào nhiều yếu tố mà chúng ta không thể dự báo được.
Như vậy, dù bạn đang khai thác crypto hay chơi game, nếu giữ card đồ họa đủ mát và sạch sẽ, các quạt tản nhiệt hoạt động tốt, và keo tản nhiệt vẫn phát huy hiệu quả, bạn có thể tự tin chiếc card hiệu năng cao của mình sẽ sống tốt cho đến khi lỗi thời hoặc bạn quyết định lên đời.
Nếu dự định mua lại một GPU đã qua sử dụng, hãy cân nhắc quá trình sử dụng của nó, bao gồm cách chủ cũ đối xử với card. Card càng được sử dụng với tần suất cao (và vấn đang hoạt động tốt) nhiều khả năng không gặp vấn đề gì trong ngắn hạn, nhưng càng dễ hỏng trong dài hạn. Chúng ta không thể đưa ra con số chính xác về tuổi thọ card, nhưng xin khẳng định việc sử dụng với tần suất cao chắc chắn sẽ khiến card đồ họa nhanh “tã” hơn.
Chúc bạn may mắn!
Tham khảo: HowToGeek
Nhưng liệu chuyện đó có xảy ra hay không? Hãy cùng tìm hiểu xem.
Có đấy, nhưng vấn đề phức tạp hơn bạn nghĩ
Hầu hết những thông tin về tuổi thọ của card đồ họa mà bạn tìm thấy trên mạng đều mang tính chất “tin đồn”, và những con số đưa ra có thể chênh lệch khá nhiều tùy thuộc người bạn hỏi. Với hàng trăm mẫu card đồ họa khác nhau được tung ra trong thập kỷ vừa qua, rất khó để có được dữ liệu cụ thể áp dụng chung cho mọi sản phẩm.Cho đến thời điểm hiện tại, có một thông tin tương đối rõ ràng như sau: theo một báo cáo vào năm 2020 của một nhà bán lẻ tại Đức, hầu hết các card đồ họa có tỉ lệ hỏng hóc khoảng từ 2 - 5% (tính dựa trên số lượng card được mang đến đổi trả). Và trong năm 2021, Nvidia vẫn cung cấp các bản cập nhật driver cho các card đã ra mắt từ 9 - 10 năm trước (ví dụ như series GTX 600), do đó chúng ta có thể tin rằng một card đồ họa được sử dụng và bảo dưỡng tốt có thể hoạt động đến một thập kỷ - dù rằng đó có lẽ chỉ là trường hợp cá biệt mà thôi.
Tạm bỏ qua những con số, hãy nói về đặc tính vật lý của loại sản phẩm này. Vật liệu và linh kiện dùng để tạo nên card đồ họa không phải làm từ ma thuật: bạn càng dùng chúng nhiều, các thành phần càng nhanh xuống cấp, và khả năng chúng hỏng hoàn toàn càng cao. Do đó sử dụng với tần suất cao chắc chắn ảnh hưởng đến tuổi thọ card đồ họa.
Liệu card đồ họa của bạn có gặp trục trặc hay không còn tùy thuộc vào nhiều yếu tố khác nhau, bao gồm tần suất sử dụng cụ thể, đặc điểm và nhiệt độ lưu thông bên trong, số lần card được bật/tắt, và môi trường hoạt động của card sạch sẽ đến mức nào.
Bởi card đồ họa là một thiết bị phức tạp với nhiều thành phần, mỗi thành phần có thể hư hỏng hoặc xuống cấp theo những cách khác nhau, nên chúng ta sẽ đi qua những thành phần chính của một card đồ họa và tìm hiểu xem chúng có thể “tã” qua thời gian như thế nào.
Quạt tản nhiệt
Tại sao nhiệt lại gây hại cho card đồ họa? Nếu nhiệt đạt một mức nhất định, các bán dẫn sẽ chập chờn, đồng nghĩa card đồ họa sẽ không hoạt động như dự tính. Nếu nhiệt quá cao, bán dẫn trong chip trên card có thể bị hư hại hoàn toàn.
Qua thời gian, quạt tản nhiệt thường bị bám bụi, làm giảm khả năng thổi khí nóng của nó. Hoặc quạt có thể ngừng quay nếu chất bôi trơn bên trong bị khô. Trong cả hai trường hợp, hệ quả xảy ra là nhiệt độ của GPU sẽ tăng cao.
Mọi GPU đều có khả năng tự bảo vệ trước tình huống quá nhiệt bằng kỹ thuật “thermal throttling”, tức tạm thời giảm hoạt động của GPU để hạ nhiệt hệ thống. Cách này sẽ gây ảnh hưởng lớn đến hiệu suất. Do đó nếu GPU của bạn bất ngờ ồn ào hơn bình thường (quạt đang quay nhanh hơn), hoặc có vẻ ì ạch hơn, hãy cân nhắc lau chùi quạt tản nhiệt cùng cụm tản nhiệt của GPU bằng bình xịt khí nén.
Nếu quạt tản nhiệt của GPU bị hỏng hoàn toàn, bạn có thể thay thế nó nếu tìm được linh kiện tương đương từ một cửa hàng máy tính nào đó.
Keo tản nhiệt bị khô
Giữa cụm tản nhiệt và chip GPU có một lớp vật liệu dẫn nhiệt, ví dụ như một tấm keo hoặc bột nhão, có chức năng dẫn nhiệt từ chip GPU đến cụm tản nhiệt.Qua thời gian, keo tản nhiệt có thể bị khô hoặc mất chức năng dẫn nhiệt. Khi điều đó xảy ra, cụm tản nhiệt sẽ không làm mát chip GPU một cách hiệu quả nữa, và nhiệt độ GPU sẽ tăng cao. Giống như trong trường hợp quạt ngừng hạt động, nhiệt độ GPU quá cao sẽ dẫn đến thermal throttling, làm chậm GPU.
Cách giải quyết tốt nhất trong tình huống này là thay keo tản nhiệt mới. Bạn có thể mua keo tại bất kỳ cửa hàng linh kiện máy tính nào.
Hỏng các linh kiện khác, lỏng mối hàn
Trong số này, tụ là linh kiện có tỉ lệ hỏng cao nhất. Chúng rất nhạy với sự thay đổi nhiệt độ thường xuyên, và một số tụ thậm chí đã hỏng ngay từ khi vừa ra khỏi nhà máy. Nếu bạn có đủ kinh nghiệm để giải quyết các vấn đề liên quan đến tụ, bạn hẳn có thể tự thay tụ hỏng trên card đồ họa một khi tìm được linh kiện thay thế.
Ngoài ra, các mối hàn nối chip và các linh kiện với bảng mạch của card đồ họa cũng có thể bị lão hóa và lỏng theo thời gian, đặc biệt sau những lần làm việc nặng nhọc (nhiệt độ thay đổi thường xuyên), những sơ suất khi lắp ráp, lưu trữ và vận chuyển không đúng cách, hoặc đơn giản là quá nóng. Do đó, sử dụng GPU với tần suất cao hoàn toàn có thể làm tăng nguy cơ lỏng mối hàn. Thay mối hàn là điều khá khó với tay mơ, nhưng không gì là không thể.
Hỏng chip GPU
Chip GPU trên card đồ họa chứa hàng triệu, hoặc hàng tỷ, bán dẫn, tất cả được khắc lên một tấm silicon. Bán dẫn sẽ lão hóa theo thời gian, ảnh hưởng đến hiệu suất của chúng. Khi số lượng bán dẫn bị hỏng đạt đến một ngưỡng nhất định, chip sẽ ngừng hoạt động.
Theo trang Semiconductor Engineering, có nhiều lý do giải thích tại sao bán dẫn lại gặp vấn đề qua thời gian do lão hóa (một trong số đó là vì nhiệt), và kích cỡ bán dẫn trên chip càng nhỏ, lỗi càng dễ xảy ra. Các chuyên gia cho rằng chip máy tính ngày nay sẽ không có tuổi thọ cao như chip sản xuất trong thập niên 1990, nhưng tính được tuổi thọ chính xác của chúng thì vẫn là điều không ai dám trả lời, bởi công nghệ này vẫn còn quá mới mẻ.
Cho đến thời điểm hiện tại, NVIDIA không công bố chỉ số MTBF (mean time between failure - thời gian trung bình giữa hai lỗi) của các loại card đồ họa dành cho người tiêu dùng của hãng, nhưng với các card tăng tốc đồ họa doanh nghiệp và công nghiệp thì có. Ví dụ, bảng thông số của card tăng tốc đồ họa Tesla K20X cho biết MTBF của nó (ở nhiệt độ 35 độ C) là 14,7 năm trong “môi trường không được kiểm soát” và 23,8 năm trong “môi trường được kiểm soát”. (Lưu ý rằng, thông thường, phần cứng đồ họa công nghiệp sẽ mạnh hơn và bền bỉ hơn dưới tần suất sử dụng cao so với phần cứng đồ họa tiêu dùng).
Khá thú vị là, trang HowToGeek đã so sánh con số lý thuyết này với dữ liệu cứng thu thập được từ quá trình sử dụng thực tế. Một trong số ít nghiên cứu thực tế (quan sát, đánh giá) về tuổi thọ GPU được thực hiện vào năm 2020 bởi Phòng thí nghiệm quốc gia Oak Ridge đã đánh giá độ bền bỉ của 18.688 card đồ họa Nvidia K20X Kepler từng được dùng trong siêu máy tính Cray XK7 Titan (nay đã “về hưu”) trong quãng thời gian gần 7 năm (2012 - 2019).
Sau một số vướng mắc ban đầu do vấn đề kết nối, họ thấy rằng các card đồ họa của XK7 có độ bền tương đối cao cho đến năm 2016 (tức khoảng 3 - 4 năm từ lúc bắt đầu hoạt động), khi nhiều trong số chúng bắt đầu hỏng. Nhưng bạn biết gì không? Hầu hết hỏng hóc trong loạt card đầu tiên (trước khi bị thay thế) là do điện trở trên bảng mạch của card chứ không phải do chip GPU. Nhìn chung, các tác giả nghiên cứu phát hiện ra MTBF trung bình của các card đồ họa K20X với tần suất sử dụng cao là khoảng 3 năm (không phải 14 - 23 năm như Nvidia quảng cáo), và những card hỏng đầu tiên là những card nóng nhất nằm ở lõi. Kết luận rút ra là “độ bền GPU phụ thuộc vào khả năng tản nhiệt”
Do đó, nguy cơ hỏng card sẽ tăng cao nếu bạn sử dụng nó với tần suất như trong những siêu máy tính lớn nhất thế giới (vào thời điểm nghiên cứu), và các linh kiện khác như quạt hay điện trở sẽ hỏng trước khi chip GPU hỏng rất lâu. Còn chính xác là bao lâu thì còn phụ thuộc vào nhiều yếu tố mà chúng ta không thể dự báo được.
Nhiệt là kẻ thù
Tóm lại, từ mọi nguồn đã biết, yếu tố quyết định nhất đến sự tồn vong của một card đồ họa là độ nóng khi hoạt động của nó. Card càng nóng, các linh kiện của nó bị xuống cấp càng nhanh. Ngoài ra, card càng nóng, hiệu suất của nó càng bị bóp để ngăn hỏng hóc nặng hơn. Đảm bảo tản nhiệt tốt sẽ vừa kéo dài tuổi thọ card, vừa cải thiện hiệu suất của nó.Như vậy, dù bạn đang khai thác crypto hay chơi game, nếu giữ card đồ họa đủ mát và sạch sẽ, các quạt tản nhiệt hoạt động tốt, và keo tản nhiệt vẫn phát huy hiệu quả, bạn có thể tự tin chiếc card hiệu năng cao của mình sẽ sống tốt cho đến khi lỗi thời hoặc bạn quyết định lên đời.
Nếu dự định mua lại một GPU đã qua sử dụng, hãy cân nhắc quá trình sử dụng của nó, bao gồm cách chủ cũ đối xử với card. Card càng được sử dụng với tần suất cao (và vấn đang hoạt động tốt) nhiều khả năng không gặp vấn đề gì trong ngắn hạn, nhưng càng dễ hỏng trong dài hạn. Chúng ta không thể đưa ra con số chính xác về tuổi thọ card, nhưng xin khẳng định việc sử dụng với tần suất cao chắc chắn sẽ khiến card đồ họa nhanh “tã” hơn.
Chúc bạn may mắn!
Tham khảo: HowToGeek