Trái Đất khó có thể hỗ trợ hết nhu cầu AI, Google và Nvidia buộc phải “lên trời”

Sasha
Sasha
Phản hồi: 0

Sasha

Writer
Gần đây, Google đã chính thức khởi động dự án trung tâm dữ liệu đầy tham vọng, với mục tiêu chuyển toàn bộ sức mạnh tính toán của mình vào không gian. Họ cũng đặt cho dự án này một cái tên rất hay: Dự án Suncatcher.

Ý tưởng của Google khá đơn giản. Thay vì cạnh tranh giành giật các nguồn tài nguyên ngày càng khan hiếm trên Trái Đất, tốt hơn hết là nên tiếp cận trực tiếp năng lượng mặt trời trong không gian. Dự án hoàn toàn mới này chỉ có một mục tiêu duy nhất: xây dựng một cơ sở hạ tầng AI có khả năng mở rộng, được cung cấp năng lượng bởi năng lượng mặt trời trong không gian.

Vài ngày trước, CEO của OpenAI, Sam Altman, và CEO của Microsoft, Satya Nadella, đã phát biểu trong một podcast rằng tương lai của AI đòi hỏi nhiều đột phá hơn về năng lượng. Việc đặt hàng quá nhiều chip AI sẽ vô ích nếu các trung tâm dữ liệu và nguồn điện hỗ trợ không thể theo kịp.

1762393901865.png

CEO của OpenAI, Sam Altman, và CEO của Microsoft, Satya Nadella cảnh báo tương lai AI đòi hỏi sự đột phá về năng lượng.

Mức tiêu thụ điện năng của AI cao đến mức nào? Theo dữ liệu từ Cơ quan Năng lượng Quốc tế (IEA), đến năm 2030, mức tiêu thụ điện năng của cơ sở hạ tầng dữ liệu toàn cầu dự kiến sẽ tương đương với toàn bộ Nhật Bản.

Không chỉ là điện, mà còn là nước. Dữ liệu từ Diễn đàn Kinh tế Thế giới cho thấy một trung tâm dữ liệu công suất 1 megawatt tiêu thụ lượng nước mỗi ngày tương đương với khoảng 1000 cư dân ở các nước phát triển.

Trong 5 năm qua, nhu cầu về trung tâm dữ liệu đã bắt đầu tăng vọt, nhưng tốc độ tăng trưởng đã vượt xa tốc độ quy hoạch các năng lực sản xuất điện mới.

Để giải quyết vấn đề năng lượng tương tự, kế hoạch của Google là phóng một chòm sao vệ tinh chạy bằng năng lượng mặt trời và được trang bị chip TPU do Google tự phát triển (được sử dụng cho tính toán, tương tự như GPU của NVIDIA), và xây dựng một "trung tâm dữ liệu AI quỹ đạo" trong không gian.

Liệu không gian có thực sự rẻ hơn và hiệu quả hơn Trái Đất không?

Tại sao lại là không gian? Lý do của Google rất đơn giản.

Hiệu suất gấp 8 lần: Nếu vệ tinh mang chip nằm đúng quỹ đạo, hiệu suất của các tấm pin mặt trời cao gấp 8 lần so với trên Trái Đất.

Cung cấp điện liên tục 24/7: Không có đêm hay mây trên không gian. So với các tấm pin mặt trời trên Trái Đất, chúng có thể tạo ra điện liên tục.

Không tiêu thụ tài nguyên: Trong không gian, các trung tâm dữ liệu không cần phải chiếm dụng diện tích đất hạn chế trên Trái Đất, cũng không cần phải tiêu thụ một lượng lớn nước để làm mát.

Hiện tại, các trung tâm dữ liệu trên Trái Đất đang tiến gần hơn đến tình trạng tắc nghẽn năng lượng. Chúng được xây dựng ở Iceland và Na Uy để thích nghi với khí hậu lạnh, và ở sa mạc Nevada để cung cấp điện. Tại Trung Quốc, hầu hết các công ty quy mô lớn đều đặt trung tâm dữ liệu của họ ở những nơi như Quý Châu và Trung Vệ, Ninh Hạ, dựa vào môi trường để làm mát.

Tuy nhiên, môi trường trong không gian phức tạp hơn nhiều so với trên Trái Đất. Google đã đề cập trong bài nghiên cứu của mình về những khó khăn hiện tại và các phương pháp giải quyết chúng một cách chi tiết.

1762394079054.png

Google đã có kế hoạch đưa trung tâm dữ liệu lên trời

Để đưa AI "lên trời", Google phải giải quyết ba vấn đề chính

Vấn đề 1: Một "mạng cục bộ" trong không gian?


Việc đào tạo AI đòi hỏi số lượng lớn chip hoạt động cùng nhau, và yêu cầu về băng thông kết nối và độ trễ giữa chúng là cực kỳ cao. Trên Trái Đất, chúng ta có thể sử dụng cáp quang để truyền dữ liệu tốc độ cao. Còn trong không gian thì sao?

Giải pháp của Google: Bay thành bầy + giao tiếp laser.

Họ dự định để các vệ tinh "bay rất gần" nhau, với khoảng cách chỉ vài km hoặc ít hơn.

Trong một chòm sao mô phỏng gồm 81 vệ tinh, mỗi vệ tinh được trang bị một mảng năng lượng mặt trời, một hệ thống làm mát bức xạ và một mô-đun giao tiếp quang băng thông cao; và khoảng cách giữa các vệ tinh chỉ thay đổi động trong khoảng 100 - 200 mét.

Ở khoảng cách gần như vậy, chúng có thể đạt được kết nối tốc độ cao thông qua giao tiếp quang không gian tự do (FSO ISL, Free - Space Optical Inter - Satellite Links). Google tiết lộ trong bài báo của mình rằng trình diễn của họ đã đạt được tốc độ truyền hai chiều thành công là 1,6 Tbps.

Vấn đề 2: "Bức xạ" vũ trụ?

Môi trường không gian cực kỳ khắc nghiệt. Trong khi mặt trời cung cấp năng lượng, nó cũng phát ra các hạt năng lượng cao chết người (bức xạ), có thể gây tàn phá trực tiếp đến các con chip tiên tiến.

Giải pháp của Google: Độ bền.

Họ đã gửi chip Cloud TPU v6e (Trillium) đến phòng thí nghiệm và bắn phá chúng bằng chùm proton 67 MeV.

Kết quả là "bức xạ mạnh đến bất ngờ". Bộ nhớ băng thông cao (HBM) nhạy cảm nhất của TPU bắt đầu cho thấy những bất thường chỉ sau khi tiếp nhận liều lượng 2 krad(Si), gần gấp 3 lần liều lượng bức xạ dự kiến (750 rad(Si)) cho một sứ mệnh kéo dài 5 năm.

Điều này có nghĩa là TPU của Google có thể hoạt động liên tục trên quỹ đạo Trái Đất tầm thấp trong 5 năm mà không bị hư hại vĩnh viễn.

Google có kế hoạch hợp tác với Planet để phóng hai vệ tinh nguyên mẫu trước năm 2027 để kiểm tra môi trường hoạt động thực tế.

Vấn đề 3: Truyền dữ liệu trở về Trái Đất

Trong không gian, việc truyền dữ liệu giữa các GPU đã được thực hiện nhanh chóng và hiệu quả. Nhưng ngay cả sau khi các tính toán được thực hiện trong không gian, làm thế nào dữ liệu có thể được truyền trở về Trái Đất với tốc độ cao?

Đây là một thách thức lớn mà Google đã thừa nhận trong bài báo của mình và vẫn chưa được giải quyết.

Vấn đề độ trễ: "Quỹ đạo đồng bộ bình minh - hoàng hôn" mà Google lựa chọn, mặc dù tối đa hóa năng lượng mặt trời, nhưng sẽ làm tăng độ trễ đến một số vị trí trên mặt đất, như bài báo đã thừa nhận.

Nút thắt băng thông: Kỷ lục cao nhất hiện tại về truyền thông quang học "mặt đất - không gian" được NASA thiết lập vào năm 2023, là 200 Gbps.

200 Gbps nghe có vẻ nhanh, nhưng đối với một trung tâm dữ liệu AI không gian, "đường ống" này còn lâu mới đủ.

Tuy nhiên, bên cạnh tất cả những thách thức kỹ thuật khó khăn này (mạng cục bộ, bức xạ, truyền thông mặt đất), còn có một trở ngại cơ bản và nghiêm trọng quyết định liệu việc giải quyết tất cả các vấn đề trước đó có đáng hay không: chi phí đưa lên vũ trụ.

Đây từng là trở ngại lớn nhất. Việc gửi một kg vật gì đó lên vũ trụ từng đắt hơn một lượng vàng tương đương.

Google đã tính toán trong bài báo của mình rằng nếu chi phí phóng của SpaceX có thể giảm xuống còn 200 đô la/kg (dự kiến vào khoảng năm 2035), chi phí điện năng đơn vị của trung tâm dữ liệu vũ trụ có thể ngang bằng với chi phí của các trung tâm dữ liệu trên mặt đất, khoảng 810 đô la/kW/năm, hoàn toàn trùng khớp với mức giá từ 570–3000 đô la/kW/năm của các trung tâm dữ liệu tại Hoa Kỳ.

Nói cách khác, khi tên lửa đủ rẻ, không gian sẽ phù hợp hơn để xây dựng trung tâm dữ liệu so với Trái Đất.

Tuy nhiên, thực tế là giá phóng hiện tại cao gấp hơn mười lần so với mức giá lý tưởng.

Ai có thể làm được điều này? SpaceX

Google rõ ràng đã áp dụng giả định đường cong học tập của SpaceX trong bài báo của mình: Mỗi khi tổng khối lượng phóng tăng gấp đôi, chi phí phóng đơn vị giảm 20%.

1762394264217.png

Tham vọng đưa trung tâm dữ liệu lên không gian phụ thuộc vào chi phí phóng vệ tinh của SpaceX

Từ Falcon 1 đến Falcon Heavy, SpaceX đã giảm chi phí phóng từ 30.000 đô la/kg xuống còn 1.800 đô la/kg; và mục tiêu của Starship là 60 đô la/kg với tỷ lệ tái sử dụng gấp 10 lần, và có thể giảm xuống còn 15 đô la/kg trong trường hợp cực đoan.

Điều này có nghĩa là SpaceX rất có thể là công ty ủng hộ mô hình kinh tế của Google cho trung tâm dữ liệu không gian.

Nếu Nvidia độc quyền thị trường GPU trên Trái Đất, thì SpaceX có thể sẽ độc quyền không gian năng lượng điện toán trong không gian trong tương lai.

Trên Trái Đất, NVIDIA bán GPU; trên không gian, SpaceX bán quỹ đạo.

Vài ngày trước khi Google công bố bài báo vào ngày 2 tháng 11, GPU H100 mạnh mẽ của NVIDIA đã được "lần đầu tiên đưa vào không gian".

GPU H100 được mang trên vệ tinh của một công ty khởi nghiệp có tên là Starcloud, và sức mạnh tính toán trên quỹ đạo của nó mạnh hơn 100 lần so với bất kỳ máy tính không gian nào trước đây.

Starcloud được thành lập vào năm 2024 và ngay từ đầu đã chuyên tâm xây dựng các trung tâm dữ liệu trong không gian. Công ty đã nhận được đầu tư từ NVIDIA, YC, v.v.

Nhiệm vụ của họ đơn giản hơn: xử lý dữ liệu thời gian thực trên quỹ đạo. CEO của Starcloud đã đưa ra một ví dụ: Dữ liệu thô của vệ tinh SAR (radar khẩu độ tổng hợp) cực kỳ lớn. Thay vì tải xuống hàng trăm gigabyte dữ liệu thô, tốt hơn là phân tích chúng trên quỹ đạo bằng H100 và chỉ truyền lại kết quả có kích thước 1KB, chẳng hạn như "một con tàu đang ở một vị trí nhất định và tốc độ của nó là...".

Khi được hỏi làm thế nào để đạt được tất cả những điều này, CEO của Starcloud cũng chỉ ra Elon Musk: Tầm nhìn của họ hoàn toàn phụ thuộc vào "việc giảm chi phí do Starship của SpaceX mang lại".
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL3RyYWktZGF0LWtoby1jby10aGUtaG8tdHJvLWhldC1uaHUtY2F1LWFpLWdvb2dsZS12YS1udmlkaWEtYnVvYy1waGFpLWxlbi10cm9pLjczMjc5Lw==
Top