Tại sao các trung tâm dữ liệu ngốn điện kinh khủng?

Phạm Thanh Bình
Phạm Thanh Bình
Phản hồi: 0
Ngày nào chúng ta cũng mở máy tính cá nhân làm việc từ sáng tới tối mà hóa đơn điện không tăng bao nhiêu, thế nhưng chỉ cần lướt tin tức vài tuần gần đây là lại thấy những con số khổng lồ về điện năng mà các trung tâm dữ liệu AI tiêu thụ, thậm chí nhiều quốc gia còn phải tính chuyện xây thêm nhà máy điện chỉ để nuôi những “bộ não” nhân tạo đang lớn dần lên từng ngày. Vì sao vậy?
1770945234007.png

Hiểu đơn giản, trung tâm dữ liệu là một cơ sở hạ tầng tập trung hàng nghìn máy chủ, hệ thống lưu trữ và thiết bị mạng, hoạt động 24 trên 7 để xử lý, lưu trữ và truyền tải dữ liệu. Mỗi khi bạn gửi email, xem video, lưu ảnh lên đám mây hay hỏi một mô hình AI, yêu cầu đó được xử lý tại những nơi như vậy.

Để làm được điều đó, trung tâm dữ liệu cần ba thứ cốt lõi: phần cứng tính toán hiệu năng cao, hệ thống lưu trữ dung lượng lớn và mạng kết nối tốc độ cao. Đi kèm là nguồn điện ổn định, hệ thống làm mát công nghiệp và cơ chế dự phòng để không được phép “sập” dù chỉ vài phút. Chính sự kết hợp giữa mật độ máy móc dày đặc, cường độ xử lý liên tục và yêu cầu vận hành không gián đoạn đã biến nó thành một cỗ máy tiêu thụ điện khổng lồ, khác xa chiếc máy tính yên tĩnh đặt trên bàn làm việc của chúng ta.

Bây giờ, bạn hãy tưởng tượng một chiếc máy tính văn phòng giống như một chiếc xe tay ga đi trong phố. Còn trung tâm dữ liệu AI là một đoàn xe container chạy hết ga trên đường cao tốc, ngày đêm không nghỉ. Cả hai đều là “máy tính”, nhưng mức tiêu thụ điện của chúng khác nhau một trời một vực vì ba yếu tố: loại chip, quy mô và làm mát.

Trước hết là chuyện con chip. Máy tính văn phòng chủ yếu dùng CPU, tức bộ xử lý trung tâm, để làm những việc khá nhẹ như soạn thảo văn bản, gửi email, lướt web. Khi không làm gì nặng, CPU tự giảm xung nhịp để tiết kiệm điện. Một bộ máy văn phòng thường chỉ tiêu thụ vài trăm watt, tức khoảng 0,2 đến 0,5 kW khi hoạt động mạnh.

Còn trong trung tâm dữ liệu AI, đặc biệt là nơi huấn luyện các mô hình ngôn ngữ lớn, người ta dùng hàng nghìn GPU hoặc TPU. GPU là bộ xử lý đồ họa nhưng rất giỏi làm các phép tính song song. Một GPU chuyên cho AI có thể tiêu thụ từ 250 đến 500 watt, tức gấp 2 đến 4 lần một CPU phổ thông. Và quan trọng hơn, chúng không “nhàn rỗi”. Khi huấn luyện mô hình, GPU thường chạy ở mức 93 đến 95 phần trăm công suất trong nhiều giờ, thậm chí nhiều tuần liên tục. Đó là cường độ làm việc kiểu nhà máy công nghiệp, không phải văn phòng.

Tiếp theo là quy mô. Một trung tâm dữ liệu không phải một máy tính, mà là hàng nghìn máy chủ kết nối với nhau. Mỗi máy chủ AI có thể tiêu thụ từ 5 đến 6 kW. Nếu có 5.000 máy chủ, tổng công suất riêng phần máy tính đã lên tới khoảng 25 đến 30 megawatt. Mức này tương đương điện tiêu thụ của một thị trấn nhỏ. Một chiếc máy tính văn phòng đơn lẻ thì không thể so sánh được, vì nó chỉ phục vụ một người dùng tại một thời điểm.

Nhưng điểm “ngốn điện” nhất lại nằm ở chuyện làm mát. Máy tính văn phòng chỉ cần một hoặc hai quạt nhỏ. Trung tâm dữ liệu AI thì giống như một lò nhiệt khổng lồ. Hàng nghìn chip công suất cao tỏa nhiệt liên tục, nếu không giải nhiệt tốt thì phần cứng sẽ hỏng. Vì vậy, gần một nửa tổng điện năng của trung tâm dữ liệu được dùng cho hệ thống điều hòa, bơm nước, tháp giải nhiệt và các thiết bị phụ trợ.

Ngành này dùng chỉ số PUE để đo hiệu quả sử dụng điện. PUE bằng tổng năng lượng tiêu thụ chia cho năng lượng dùng cho thiết bị IT. Một máy tính văn phòng gần như có PUE bằng 1, vì không cần hạ tầng làm mát riêng. Trung tâm dữ liệu tốt thường đạt PUE khoảng 1,2. Nghĩa là cứ 10 watt cấp cho máy tính thì phải tốn thêm 2 watt để vận hành tòa nhà và làm mát.

Vì chi phí điện lớn như vậy, các công ty đang chuyển sang làm mát bằng chất lỏng trực tiếp lên chip. Cách này có thể giúp mỗi máy chủ tiết kiệm khoảng 1 kW, giảm khoảng 16 phần trăm điện tiêu thụ so với chỉ dùng quạt gió. Trong bối cảnh một trung tâm có hàng nghìn máy chủ, tiết kiệm này là con số khổng lồ.

Máy tính văn phòng là công cụ cá nhân, làm việc gián đoạn, tải nhẹ. Trung tâm dữ liệu AI là một nhà máy tính toán 24 trên 7, chạy hàng nghìn chip hiệu năng cao gần hết công suất, kèm theo cả một hệ thống công nghiệp để giải nhiệt. Khi quy mô và cường độ tăng lên cấp số nhân, điện năng cũng tăng theo. Đây là cái giá vật lý phải trả cho tham vọng xây dựng những bộ não nhân tạo ngày càng lớn, và cũng là lý do bài toán năng lượng đang trở thành trung tâm của cuộc đua AI toàn cầu.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL3RhaS1zYW8tY2FjLXRydW5nLXRhbS1kdS1saWV1LW5nb24tZGllbi1raW5oLWtodW5nLjc5MjQxLw==
Top