Sasha
Writer
“Giá bộ nhớ đã tăng quá nhiều gần đây", Lei Jun, người sáng lập Xiaomi phát biểu vào ngày 24/10. Ông nói điều này trong khi quảng cáo một mẫu điện thoại di động trên Weibo.
Samsung Electronics gần đây đã công bố mức tăng giá 60% cho chip nhớ của mình. Mức tăng giá này đã tác động trực tiếp đến các nhà sản xuất thiết bị điện tử tiêu dùng hạ nguồn, dẫn đến việc tăng giá của một loạt thiết bị, bao gồm điện thoại di động, máy tính xách tay, PC và máy tính bảng.
Nguyên nhân trực tiếp của việc tăng giá bộ nhớ là nhu cầu lưu trữ HBM từ các ông lớn AI đang vắt kiệt năng lực sản xuất chip DRAM. Đồng thời, nhu cầu suy luận tăng vọt cũng đang vắt kiệt năng lực sản xuất chip nhớ flash NAND.
Sau khi giá bộ nhớ tăng vọt, chúng được dân mạng gọi đùa là "Mao đài điện tử" và "vàng điện tử".
Việc tăng giá bộ nhớ đã ảnh hưởng đến toàn bộ ngành công nghiệp. Tại hội nghị thu nhập quý 3 của côn ty bán dẫn Trung Quốc SMIC, bộ nhớ đã được nhắc đến 38 lần. Đồng Tổng Giám đốc điều hành Zhao Haijun đã đưa ra một số nhận định quan trọng: khoảng cách cung hiện tại là hơn 5%, các nhà sản xuất thiết bị đầu cuối đang chịu áp lực ngắn hạn, việc mở rộng năng lực vẫn đang tiếp tục và điều này có lợi cho ngành sản xuất.
"Dù là trong lĩnh vực ô tô, điện thoại di động hay điện tử tiêu dùng, các nhà sản xuất thiết bị đầu cuối sử dụng chip nhớ sẽ phải đối mặt với áp lực giá và các vấn đề về an ninh nguồn cung trong năm tới. Hiện tại, chưa có bên nào có thể đưa ra cam kết cung ứng rõ ràng", Zhao Haijun cho biết.
Zhao Haijun nhấn mạnh rằng khoảng cách cung ít nhất là 5%, và giá cao sẽ tiếp tục trong một thời gian. "Tôi đã từng phân tích. Nếu có khoảng cách cung 5% trên thị trường bộ nhớ, giá có thể tăng gấp đôi; nếu cung vượt cầu 5%, giá có thể giảm một nửa."
Vậy logic đằng sau đợt tăng giá bộ nhớ lưu trữ này là gì, hay nhu cầu về AI chuyển thành lưu trữ, biến bộ nhớ thành "vàng điện tử" như thế nào?
Hoảng loạn, tích trữ và đảo ngược giá
Là một sản phẩm tiêu chuẩn hóa, sự phát triển của ngành công nghiệp bộ nhớ chịu ảnh hưởng trực tiếp từ nhu cầu hạ nguồn, thể hiện một đặc điểm chu kỳ rõ rệt.
Nhu cầu hạ nguồn mạnh mẽ dẫn đến chu kỳ tăng trưởng của ngành và giá tăng, trong khi nhu cầu hạ nguồn giảm dẫn đến chu kỳ giảm trưởng của ngành và giá giảm.
Theo Zhao Haijun, trong điều kiện cân bằng cung-cầu, độ lệch cộng hoặc trừ 5% sẽ dẫn đến giá lưu trữ tăng gấp đôi hoặc giảm một nửa.
Trong thập kỷ qua, ngành công nghiệp lưu trữ đã trải qua một số chu kỳ tăng giảm: 2012-2015, 2015-2019, 2020-2023 và 2024 cho đến nay, nhìn chung vẫn duy trì chu kỳ bốn năm. Chỉ xét về mặt thời gian, hiện tại ít nhất nó đang trong giai đoạn tăng trưởng.
Điều đáng chú ý là ba chu kỳ đầu tiên chủ yếu liên quan đến điện thoại thông minh. Mãi đến năm 2024, các nhà sản xuất lớn mới chủ động giảm sản lượng và tối ưu hóa cơ cấu cung ứng. Cùng với sự bùng nổ của AI thúc đẩy nhu cầu lưu trữ cao cấp cho máy chủ và PC, ngành công nghiệp lưu trữ đã bước vào một chu kỳ tăng trưởng mới.
Năm 2025, các nhà sản xuất hàng đầu như Micron và Samsung lần lượt tuyên bố DDR4 đang bước vào giai đoạn cuối của vòng đời - sản xuất kết thúc, doanh số bán hàng hoàn tất và hỗ trợ bị cắt giảm. Trong giai đoạn mua sắm cuối cùng, tỷ lệ đạt được nguồn cung của các nhà sản xuất ban đầu thấp hơn nhiều so với dự kiến, làm lung lay niềm tin của thị trường vào nguồn cung dài hạn.
Cốt lõi của đợt điều chỉnh này của các nhà sản xuất hàng đầu là thích ứng với nhu cầu máy chủ cao cấp, ưu tiên năng lực sản xuất cho HBM và DDR5 có lợi nhuận cao hơn. Sự thay đổi không thể đảo ngược về năng lực sản xuất này đã dẫn đến việc nguồn cung DDR4 liên tục giảm.
Về phía cầu, tình hình đang cho thấy khả năng phục hồi mạnh mẽ. Các công ty internet Bắc Mỹ đang tích trữ hàng hóa với số lượng lớn để kiểm soát chi phí và giảm thiểu rủi ro. Nhu cầu máy chủ AI của các công ty trong nước đã tăng vọt, thúc đẩy việc mua sắm DDR4. Máy chủ CNTT ở Trung Quốc đang chuyển từ DDR5 sang DDR4 do thiếu hụt dung lượng CPU. Các sản phẩm nhạy cảm về chi phí như điều khiển công nghiệp, truyền thông mạng và điện thoại di động tầm trung đến bình dân đang được tích trữ trước do lo ngại về nguồn cung.
Với việc các nhà sản xuất ban đầu tạm dừng sản xuất, các nhà phân phối kiểm soát nguồn cung và các nhà sản xuất người dùng cuối tranh giành hàng hóa, giá DDR4 đã vượt giá DDR5, dẫn đến hiện tượng "đảo ngược giá".
Mặc dù DDR5 là xu hướng tương lai, việc chuyển đổi từ DDR4 đòi hỏi sự hỗ trợ từ CPU, bo mạch chủ và hệ điều hành, và sự mất cân bằng cung cầu hiện tại không thể được cải thiện trong ngắn hạn.
Một người trong ngành nhấn mạnh rằng đợt tăng giá này chủ yếu bắt nguồn từ việc mua sắm hoảng loạn do các nhà sản xuất lớn tạm dừng sản xuất, chứ không phải do nhu cầu tiêu dùng mới. Đây là một hiện tượng thị trường không lành mạnh, không phù hợp với logic thị trường về hiệu quả chi phí và các thuộc tính sản phẩm.
"Việc tăng giá có thể sẽ tiếp tục cho đến ít nhất là năm sau, nhưng điều kiện thị trường thay đổi nhanh chóng, và lưu trữ mang tính chu kỳ cao, vì vậy điều này phụ thuộc vào các tình huống cụ thể", người này cho biết.
Sự gia tăng "muộn màng" của giá bộ nhớ
Như đã đề cập ở trên, nhu cầu cứng nhắc do AI thúc đẩy và những thay đổi trong cơ cấu cung cầu của ngành cũng đang đẩy giá bộ nhớ flash NAND lên cao.
Trước đây, nhu cầu lưu trữ NAND chủ yếu được thúc đẩy bởi các sản phẩm điện tử tiêu dùng như điện thoại di động và máy tính, với tốc độ tăng trưởng chậm và dễ bị ảnh hưởng bởi mức tiêu thụ yếu. Tuy nhiên, việc triển khai suy luận AI trên quy mô lớn đã hoàn toàn thay đổi tình trạng này.
Về nhu cầu suy luận, các lệnh gọi API hàng ngày của OpenAI và Gemini đạt gần 10 nghìn tỷ token, và ước tính các mô hình AI ở Trung Quốc cao gấp hai đến ba lần con số đó.
Ngoài ra, các kịch bản như dịch vụ khách hàng thông minh và xe tự hành đòi hỏi phải xử lý lượng dữ liệu khổng lồ, đặt ra yêu cầu cao về dung lượng lưu trữ, tốc độ và khả năng truy cập I/O ngẫu nhiên. Các sản phẩm NAND như QLC eSSD hoàn toàn phù hợp với những nhu cầu này.
Cuối tháng 8, Huawei cũng đã ra mắt sản phẩm SSD AI dựa trên bộ nhớ flash NAND SLC và 3D TLC, khi đó được gọi là "công nghệ đen" để tăng tốc suy luận AI.
Câu hỏi đặt ra là, với sự bùng nổ của AI đã kéo dài quá lâu, tại sao chỉ đến bây giờ giá lưu trữ mới tăng vọt?
Nhu cầu về DRAM, đặc biệt là bộ nhớ NAND flash, đang tương đối chậm, chủ yếu do nhu cầu đang trong giai đoạn tích lũy và chưa tạo ra sự bùng nổ trên quy mô lớn, nhưng điều này không có nghĩa là công nghệ chưa có bước tiến.
Một mặt, trong hai năm đầu, công nghệ AI chủ yếu đang ở giai đoạn huấn luyện mô hình và xác minh quy mô nhỏ. Các sản phẩm AI trên Internet chủ yếu mang tính thăm dò và thử nghiệm, với mức độ thâm nhập doanh nghiệp tương đối thấp, lượng người dùng và tần suất tương tác hạn chế. Nhu cầu lưu trữ chỉ tập trung vào các sản phẩm hiệu suất cao như HBM, và không ảnh hưởng đến DRAM và NAND, những sản phẩm hỗ trợ lưu trữ dữ liệu lớn theo tầng.
Mặt khác, đối thoại AI dựa trên tư duy nhanh, tạo ra câu trả lời dựa trên cơ sở kiến thức riêng, tiêu thụ ít token và không có sự hợp tác với các tác nhân bên ngoài. Tổng khối lượng tương tác dữ liệu cũng bị hạn chế, khiến việc thúc đẩy hai loại nhu cầu lưu trữ này trở nên khó khăn.
Nhu cầu lưu trữ tăng đột biến trong năm nay chủ yếu là do tỷ lệ thâm nhập cao của các doanh nghiệp AI: các công ty internet lớn đã ra mắt các sản phẩm AI hoàn thiện, làm tăng đáng kể tỷ lệ thâm nhập kinh doanh, trong khi các sản phẩm internet truyền thống như thanh toán và thương mại điện tử cũng đang đẩy nhanh quá trình tái cấu trúc dựa trên AI, dẫn đến sự gia tăng đáng kể tần suất tương tác của người dùng.
Báo cáo tháng 10 của SAP cho thấy các công ty Trung Quốc hiện đang dựa vào AI để hỗ trợ trung bình 28% các tác vụ kinh doanh của họ và con số này dự kiến sẽ tăng lên 44% trong hai năm tới.
Ngoài ra, cơ chế sao lưu ba bản sao của các nhà cung cấp điện toán đám mây - phân chia dữ liệu, tạo ba bản sao giống hệt nhau và sau đó lưu trữ các bản sao trên các ổ đĩa vật lý khác nhau của các máy chủ khác nhau trong cụm thông qua một thuật toán phân tán - cũng đã thúc đẩy tổng lượng dữ liệu tăng theo cấp số nhân. Dữ liệu này cần được lưu trữ theo từng lớp sử dụng DRAM và NAND, điều này trực tiếp thúc đẩy nhu cầu đối với cả hai loại sản phẩm.
Động lực cốt lõi của đợt tăng giá này cũng bao gồm nhu cầu cao bất ngờ đối với máy chủ AI. Khách hàng đám mây không chỉ khóa công suất sản xuất cho quý 4 năm 2025 mà còn đặt hàng trước cho năm 2026, dẫn đến mất cân bằng nhanh chóng giữa cung và cầu.
Cần nhấn mạnh rằng tình trạng tồn kho và cung cầu của các sản phẩm DDR4 trong chu kỳ bộ nhớ này khác với trước đây: lượng tồn kho hiện tại ở phía cung đang ở mức thấp.
Theo dữ liệu từ ngành công nghiệp, các nhà sản xuất mô-đun thường có lượng tồn kho 4 tháng, nhưng hiện tại chỉ còn 2 tháng. Khi cung vượt cầu, lượng tồn kho của các nhà sản xuất mô-đun có thể lên tới 10-12 tháng.
Tất nhiên, HBM có biên lợi nhuận từ 50%-70%, và mức tiêu thụ dung lượng của nó gấp ba lần so với DRAM tiêu chuẩn. Các nhà sản xuất ban đầu ưu tiên chi tiêu vốn cho HBM, và toàn bộ cơ cấu cung ứng bộ nhớ đã thay đổi.
Giá tăng là con dao hai lưỡi
Những ngành nào bị ảnh hưởng nhiều nhất bởi làn sóng tăng giá bộ nhớ này? Chúng ta có thể xếp hạng các ngành này theo tỷ lệ phần trăm nhu cầu bộ nhớ từ khách hàng có nhu cầu lưu trữ thiết yếu.
Biểu đồ của Morgan Stanley về "Tỷ lệ phần trăm chi phí của nhà sản xuất phần cứng".
Ngành công nghiệp điện thoại di động được đề cập trước đó có vẻ đang trong tình trạng khó khăn, nhưng bộ nhớ thực tế chỉ chiếm 18% tổng chi phí. Lý do nhiều nhà sản xuất điện thoại di động lên tiếng là vì quy mô tổng thể của thị trường điện thoại di động rất lớn và gần gũi hơn với người tiêu dùng.
Sự mất cân bằng giữa cung và cầu bộ nhớ liên quan đến việc các nhà sản xuất lưu trữ đầu nguồn kiểm soát biên lợi nhuận: họ ưu tiên phân bổ năng lực sản xuất cho những khách hàng có biên lợi nhuận cao hơn.
Trước đây, các nhà sản xuất điện thoại di động có thể chốt được 70%-80% nhu cầu của họ thông qua các chương trình khuyến mãi hàng quý. Giờ đây, các nhà sản xuất lưu trữ ưu tiên cung cấp cho khách hàng máy chủ AI những đơn hàng lớn và biên lợi nhuận cao, đẩy các nhà sản xuất điện thoại di động xuống vai trò hỗ trợ.
Các thương hiệu Trung Quốc hàng đầu chỉ có thể đảm bảo lưu trữ cho 80% doanh số của họ vào năm tới, trong khi các nhà sản xuất hạng hai chỉ có thể đảm bảo 60%.
Với khoảng cách cung-cầu từ 20%-40% và áp lực giá cao do các yếu tố thị trường thúc đẩy, các nhà sản xuất điện tử tiêu dùng, đặc biệt là các nhà sản xuất điện thoại di động, sẽ phải đối mặt với những thử thách khắc nghiệt về năng lực chuỗi cung ứng của họ.
Do đó, không có gì ngạc nhiên khi những người dẫn đầu ngành điện thoại di động như Lei Jun lại "than phiền" trực tuyến.
Trong ngắn hạn, các nhà sản xuất điện thoại di động có thể duy trì lợi nhuận gộp thông qua giá tồn kho trung bình. Tuy nhiên, khi hàng tồn kho được tiêu thụ hết, áp lực chi phí do giá lưu trữ tăng sẽ dần tăng lên. Ngoài ra, lưu trữ chiếm gần 20% tổng chi phí BOM của thiết bị. Các mẫu máy cấp thấp với biên lợi nhuận mỏng sẽ bị ảnh hưởng đáng kể hơn, và xu hướng hợp nhất ngành, nơi các công ty lớn trở nên lớn mạnh hơn, sẽ trở nên rõ nét hơn.
Bên cạnh các thương hiệu điện tử tiêu dùng, ngành OEM/ODM phần cứng cũng đang phải đối mặt với áp lực biên lợi nhuận đáng kể do siêu chu kỳ lưu trữ gây ra.
Các xu hướng dài hạn như AI tạo sinh và sự gia tăng dữ liệu đang hỗ trợ nhu cầu ngày càng tăng, nhưng giá NAND và DRAM đã tăng lần lượt 50% và 300% trong sáu tháng qua, dẫn đến chi phí đầu vào tăng mạnh.
Dựa trên kinh nghiệm lịch sử từ chu kỳ 2016-2018, trong báo cáo ngành OEM phần cứng đầu tháng 11, Morgan Stanley dự đoán biên lợi nhuận gộp trung bình của ngành sẽ giảm 60% vào năm 2026, và thu nhập trung bình trên mỗi cổ phiếu sẽ thấp hơn 11% so với dự báo của ngành, điều này có thể dẫn đến sự thu hẹp hệ số định giá. Dell, HP, ASUS và các công ty khác được Morgan Stanley xếp vào nhóm "dễ bị tổn thương nhất".
Nhìn rộng hơn, việc tăng giá cũng có thể gây ra những tác động tiêu cực đến các ngành công nghiệp.
Hiện nay, DDR5 đã trở thành xu hướng chủ đạo trong các sản phẩm quốc tế, và các nền tảng thế hệ mới của các công ty CPU hàng đầu như Intel và AMD đã được áp dụng.
Theo báo cáo Quý 1 năm 2025 của TrendForce, DDR5 đã chiếm hơn 90% thị trường DRAM máy chủ toàn cầu, trở thành nguồn cung chính cho các ứng dụng tính toán cao như đào tạo AI và điện toán đám mây. Hiện tại, việc mở rộng sản xuất do "sự đảo ngược giá" của DDR4 có thể làm chậm tốc độ nâng cấp của ngành.
"Nếu các nhà sản xuất DRAM ưu tiên lợi nhuận ngắn hạn từ giá DDR4 đảo ngược và tiếp tục duy trì hoặc mở rộng sản xuất, trong một ngành công nghiệp mà dung lượng là vua, điều đó đồng nghĩa với việc giảm đầu tư vào các sản phẩm cao cấp hơn như DDR5, bỏ lỡ việc nâng cấp sản phẩm và cuối cùng là mất khả năng cạnh tranh trên thị trường DRAM đang biến đổi nhanh chóng", một chuyên gia trong ngành bộ nhớ cho biết.
Câu chuyện mới về lưu trữ
Trong vài năm qua, HBM dựa trên chip DRAM đã chiếm được cảm tình của các ông lớn chip AI nhờ băng thông cao, nhưng dung lượng lưu trữ của nó lại là một điểm yếu cố hữu. Do đó, các nhà sản xuất như SanDisk đã bắt đầu đề xuất công nghệ HBF dựa trên chip NAND.
Sơ đồ mặt cắt kiến trúc HBF, được đóng gói với GPU.
HBF mượn khái niệm xếp chồng từ HBM, xếp chồng 16 lớp chip lõi và kết nối chúng thông qua các via silicon, đạt được băng thông tương đương với HBM.
SanDisk nhấn mạnh rằng, với chi phí tương đương, chip HBF cung cấp dung lượng gấp 8-16 lần chip HBM, với dung lượng một ngăn xếp đơn lên đến 512GB, điều này đơn giản có nghĩa là chúng tiết kiệm hơn.
Ngoài ra, theo kiến trúc điện toán hiện tại, quy trình nhận dữ liệu là SSD → HBM → GPU. HBM chịu trách nhiệm cho cả bộ nhớ tính toán và cổng bộ nhớ đệm, từ đó tạo ra nút thắt về độ trễ.
HBF cung cấp dữ liệu trực tiếp cho GPU, điều này sẽ dẫn đến một loạt các phản ứng dây chuyền: tăng tốc độ tạo mã thông báo → giảm thời gian nhàn rỗi của GPU → giảm tổng chi phí sở hữu (TCO) cho trí tuệ nhân tạo → giảm chi phí đơn vị của các dịch vụ mô hình ngôn ngữ lớn.
Hiệu quả kinh tế, mức tiêu thụ điện năng thấp, độ trễ thấp, khả năng mở rộng cao và tính thực tiễn của nó càng mở rộng các kịch bản ứng dụng của HBF.
Về mặt kịch bản ứng dụng, công nghệ HBF phù hợp để đọc các tác vụ suy luận AI chuyên sâu và có thể được sử dụng trong các tình huống như định vị các mô hình lớn trên thiết bị di động và lái xe tự động. SanDisk dự kiến sẽ cung cấp mẫu vào nửa cuối năm 2026 và cũng đang hợp tác với SK Hynix để thúc đẩy việc chuẩn hóa công nghệ của mình.
Tuy nhiên, điều này không có nghĩa là HBF, giải pháp lưu trữ mới này, hoàn hảo.
Thứ nhất, chip DRAM không có giới hạn tuổi thọ, trong khi NAND có tuổi thọ hạn chế. Một khi NAND được đóng gói cùng với GPU, khi hết tuổi thọ, bo mạch GPU sẽ bị hư hỏng, đây là một chi phí không thể chấp nhận được đối với một GPU trị giá hàng chục nghìn đô la.
Thứ hai, bộ nhớ flash NAND có yêu cầu tương đối khắt khe về môi trường làm việc, từ 80 đến 85 độ C, trong khi DRAM có thể đạt tới 125 độ C.
Nói cách khác, ngành công nghiệp có thể thúc đẩy việc triển khai kiến trúc lai HBM+HBF trong tương lai để giảm đáng kể chi phí suy luận mô hình. Trong kiến trúc này, HBF đóng vai trò là bộ nhớ phụ dung lượng lớn kết hợp với HBM.
Mặc dù HBM sẽ không bị thay thế, nhưng tốc độ tăng trưởng nhu cầu về nó dự kiến sẽ chậm lại, điều này sẽ làm chậm nhu cầu về chip DRAM và làm tăng sự phụ thuộc vào chip NAND.
Nguồn: Tech.sina.cn
Samsung Electronics gần đây đã công bố mức tăng giá 60% cho chip nhớ của mình. Mức tăng giá này đã tác động trực tiếp đến các nhà sản xuất thiết bị điện tử tiêu dùng hạ nguồn, dẫn đến việc tăng giá của một loạt thiết bị, bao gồm điện thoại di động, máy tính xách tay, PC và máy tính bảng.
Nguyên nhân trực tiếp của việc tăng giá bộ nhớ là nhu cầu lưu trữ HBM từ các ông lớn AI đang vắt kiệt năng lực sản xuất chip DRAM. Đồng thời, nhu cầu suy luận tăng vọt cũng đang vắt kiệt năng lực sản xuất chip nhớ flash NAND.
Sau khi giá bộ nhớ tăng vọt, chúng được dân mạng gọi đùa là "Mao đài điện tử" và "vàng điện tử".
Việc tăng giá bộ nhớ đã ảnh hưởng đến toàn bộ ngành công nghiệp. Tại hội nghị thu nhập quý 3 của côn ty bán dẫn Trung Quốc SMIC, bộ nhớ đã được nhắc đến 38 lần. Đồng Tổng Giám đốc điều hành Zhao Haijun đã đưa ra một số nhận định quan trọng: khoảng cách cung hiện tại là hơn 5%, các nhà sản xuất thiết bị đầu cuối đang chịu áp lực ngắn hạn, việc mở rộng năng lực vẫn đang tiếp tục và điều này có lợi cho ngành sản xuất.
"Dù là trong lĩnh vực ô tô, điện thoại di động hay điện tử tiêu dùng, các nhà sản xuất thiết bị đầu cuối sử dụng chip nhớ sẽ phải đối mặt với áp lực giá và các vấn đề về an ninh nguồn cung trong năm tới. Hiện tại, chưa có bên nào có thể đưa ra cam kết cung ứng rõ ràng", Zhao Haijun cho biết.
Zhao Haijun nhấn mạnh rằng khoảng cách cung ít nhất là 5%, và giá cao sẽ tiếp tục trong một thời gian. "Tôi đã từng phân tích. Nếu có khoảng cách cung 5% trên thị trường bộ nhớ, giá có thể tăng gấp đôi; nếu cung vượt cầu 5%, giá có thể giảm một nửa."
Vậy logic đằng sau đợt tăng giá bộ nhớ lưu trữ này là gì, hay nhu cầu về AI chuyển thành lưu trữ, biến bộ nhớ thành "vàng điện tử" như thế nào?
Hoảng loạn, tích trữ và đảo ngược giá
Là một sản phẩm tiêu chuẩn hóa, sự phát triển của ngành công nghiệp bộ nhớ chịu ảnh hưởng trực tiếp từ nhu cầu hạ nguồn, thể hiện một đặc điểm chu kỳ rõ rệt.
Nhu cầu hạ nguồn mạnh mẽ dẫn đến chu kỳ tăng trưởng của ngành và giá tăng, trong khi nhu cầu hạ nguồn giảm dẫn đến chu kỳ giảm trưởng của ngành và giá giảm.
Theo Zhao Haijun, trong điều kiện cân bằng cung-cầu, độ lệch cộng hoặc trừ 5% sẽ dẫn đến giá lưu trữ tăng gấp đôi hoặc giảm một nửa.
Trong thập kỷ qua, ngành công nghiệp lưu trữ đã trải qua một số chu kỳ tăng giảm: 2012-2015, 2015-2019, 2020-2023 và 2024 cho đến nay, nhìn chung vẫn duy trì chu kỳ bốn năm. Chỉ xét về mặt thời gian, hiện tại ít nhất nó đang trong giai đoạn tăng trưởng.
Điều đáng chú ý là ba chu kỳ đầu tiên chủ yếu liên quan đến điện thoại thông minh. Mãi đến năm 2024, các nhà sản xuất lớn mới chủ động giảm sản lượng và tối ưu hóa cơ cấu cung ứng. Cùng với sự bùng nổ của AI thúc đẩy nhu cầu lưu trữ cao cấp cho máy chủ và PC, ngành công nghiệp lưu trữ đã bước vào một chu kỳ tăng trưởng mới.
Năm 2025, các nhà sản xuất hàng đầu như Micron và Samsung lần lượt tuyên bố DDR4 đang bước vào giai đoạn cuối của vòng đời - sản xuất kết thúc, doanh số bán hàng hoàn tất và hỗ trợ bị cắt giảm. Trong giai đoạn mua sắm cuối cùng, tỷ lệ đạt được nguồn cung của các nhà sản xuất ban đầu thấp hơn nhiều so với dự kiến, làm lung lay niềm tin của thị trường vào nguồn cung dài hạn.
Cốt lõi của đợt điều chỉnh này của các nhà sản xuất hàng đầu là thích ứng với nhu cầu máy chủ cao cấp, ưu tiên năng lực sản xuất cho HBM và DDR5 có lợi nhuận cao hơn. Sự thay đổi không thể đảo ngược về năng lực sản xuất này đã dẫn đến việc nguồn cung DDR4 liên tục giảm.
Về phía cầu, tình hình đang cho thấy khả năng phục hồi mạnh mẽ. Các công ty internet Bắc Mỹ đang tích trữ hàng hóa với số lượng lớn để kiểm soát chi phí và giảm thiểu rủi ro. Nhu cầu máy chủ AI của các công ty trong nước đã tăng vọt, thúc đẩy việc mua sắm DDR4. Máy chủ CNTT ở Trung Quốc đang chuyển từ DDR5 sang DDR4 do thiếu hụt dung lượng CPU. Các sản phẩm nhạy cảm về chi phí như điều khiển công nghiệp, truyền thông mạng và điện thoại di động tầm trung đến bình dân đang được tích trữ trước do lo ngại về nguồn cung.
Với việc các nhà sản xuất ban đầu tạm dừng sản xuất, các nhà phân phối kiểm soát nguồn cung và các nhà sản xuất người dùng cuối tranh giành hàng hóa, giá DDR4 đã vượt giá DDR5, dẫn đến hiện tượng "đảo ngược giá".
Mặc dù DDR5 là xu hướng tương lai, việc chuyển đổi từ DDR4 đòi hỏi sự hỗ trợ từ CPU, bo mạch chủ và hệ điều hành, và sự mất cân bằng cung cầu hiện tại không thể được cải thiện trong ngắn hạn.
Một người trong ngành nhấn mạnh rằng đợt tăng giá này chủ yếu bắt nguồn từ việc mua sắm hoảng loạn do các nhà sản xuất lớn tạm dừng sản xuất, chứ không phải do nhu cầu tiêu dùng mới. Đây là một hiện tượng thị trường không lành mạnh, không phù hợp với logic thị trường về hiệu quả chi phí và các thuộc tính sản phẩm.
"Việc tăng giá có thể sẽ tiếp tục cho đến ít nhất là năm sau, nhưng điều kiện thị trường thay đổi nhanh chóng, và lưu trữ mang tính chu kỳ cao, vì vậy điều này phụ thuộc vào các tình huống cụ thể", người này cho biết.
Sự gia tăng "muộn màng" của giá bộ nhớ
Như đã đề cập ở trên, nhu cầu cứng nhắc do AI thúc đẩy và những thay đổi trong cơ cấu cung cầu của ngành cũng đang đẩy giá bộ nhớ flash NAND lên cao.
Trước đây, nhu cầu lưu trữ NAND chủ yếu được thúc đẩy bởi các sản phẩm điện tử tiêu dùng như điện thoại di động và máy tính, với tốc độ tăng trưởng chậm và dễ bị ảnh hưởng bởi mức tiêu thụ yếu. Tuy nhiên, việc triển khai suy luận AI trên quy mô lớn đã hoàn toàn thay đổi tình trạng này.
Về nhu cầu suy luận, các lệnh gọi API hàng ngày của OpenAI và Gemini đạt gần 10 nghìn tỷ token, và ước tính các mô hình AI ở Trung Quốc cao gấp hai đến ba lần con số đó.
Ngoài ra, các kịch bản như dịch vụ khách hàng thông minh và xe tự hành đòi hỏi phải xử lý lượng dữ liệu khổng lồ, đặt ra yêu cầu cao về dung lượng lưu trữ, tốc độ và khả năng truy cập I/O ngẫu nhiên. Các sản phẩm NAND như QLC eSSD hoàn toàn phù hợp với những nhu cầu này.
Cuối tháng 8, Huawei cũng đã ra mắt sản phẩm SSD AI dựa trên bộ nhớ flash NAND SLC và 3D TLC, khi đó được gọi là "công nghệ đen" để tăng tốc suy luận AI.
Câu hỏi đặt ra là, với sự bùng nổ của AI đã kéo dài quá lâu, tại sao chỉ đến bây giờ giá lưu trữ mới tăng vọt?
Nhu cầu về DRAM, đặc biệt là bộ nhớ NAND flash, đang tương đối chậm, chủ yếu do nhu cầu đang trong giai đoạn tích lũy và chưa tạo ra sự bùng nổ trên quy mô lớn, nhưng điều này không có nghĩa là công nghệ chưa có bước tiến.
Một mặt, trong hai năm đầu, công nghệ AI chủ yếu đang ở giai đoạn huấn luyện mô hình và xác minh quy mô nhỏ. Các sản phẩm AI trên Internet chủ yếu mang tính thăm dò và thử nghiệm, với mức độ thâm nhập doanh nghiệp tương đối thấp, lượng người dùng và tần suất tương tác hạn chế. Nhu cầu lưu trữ chỉ tập trung vào các sản phẩm hiệu suất cao như HBM, và không ảnh hưởng đến DRAM và NAND, những sản phẩm hỗ trợ lưu trữ dữ liệu lớn theo tầng.
Mặt khác, đối thoại AI dựa trên tư duy nhanh, tạo ra câu trả lời dựa trên cơ sở kiến thức riêng, tiêu thụ ít token và không có sự hợp tác với các tác nhân bên ngoài. Tổng khối lượng tương tác dữ liệu cũng bị hạn chế, khiến việc thúc đẩy hai loại nhu cầu lưu trữ này trở nên khó khăn.
Nhu cầu lưu trữ tăng đột biến trong năm nay chủ yếu là do tỷ lệ thâm nhập cao của các doanh nghiệp AI: các công ty internet lớn đã ra mắt các sản phẩm AI hoàn thiện, làm tăng đáng kể tỷ lệ thâm nhập kinh doanh, trong khi các sản phẩm internet truyền thống như thanh toán và thương mại điện tử cũng đang đẩy nhanh quá trình tái cấu trúc dựa trên AI, dẫn đến sự gia tăng đáng kể tần suất tương tác của người dùng.
Báo cáo tháng 10 của SAP cho thấy các công ty Trung Quốc hiện đang dựa vào AI để hỗ trợ trung bình 28% các tác vụ kinh doanh của họ và con số này dự kiến sẽ tăng lên 44% trong hai năm tới.
Ngoài ra, cơ chế sao lưu ba bản sao của các nhà cung cấp điện toán đám mây - phân chia dữ liệu, tạo ba bản sao giống hệt nhau và sau đó lưu trữ các bản sao trên các ổ đĩa vật lý khác nhau của các máy chủ khác nhau trong cụm thông qua một thuật toán phân tán - cũng đã thúc đẩy tổng lượng dữ liệu tăng theo cấp số nhân. Dữ liệu này cần được lưu trữ theo từng lớp sử dụng DRAM và NAND, điều này trực tiếp thúc đẩy nhu cầu đối với cả hai loại sản phẩm.
Động lực cốt lõi của đợt tăng giá này cũng bao gồm nhu cầu cao bất ngờ đối với máy chủ AI. Khách hàng đám mây không chỉ khóa công suất sản xuất cho quý 4 năm 2025 mà còn đặt hàng trước cho năm 2026, dẫn đến mất cân bằng nhanh chóng giữa cung và cầu.
Cần nhấn mạnh rằng tình trạng tồn kho và cung cầu của các sản phẩm DDR4 trong chu kỳ bộ nhớ này khác với trước đây: lượng tồn kho hiện tại ở phía cung đang ở mức thấp.
Theo dữ liệu từ ngành công nghiệp, các nhà sản xuất mô-đun thường có lượng tồn kho 4 tháng, nhưng hiện tại chỉ còn 2 tháng. Khi cung vượt cầu, lượng tồn kho của các nhà sản xuất mô-đun có thể lên tới 10-12 tháng.
Tất nhiên, HBM có biên lợi nhuận từ 50%-70%, và mức tiêu thụ dung lượng của nó gấp ba lần so với DRAM tiêu chuẩn. Các nhà sản xuất ban đầu ưu tiên chi tiêu vốn cho HBM, và toàn bộ cơ cấu cung ứng bộ nhớ đã thay đổi.
Giá tăng là con dao hai lưỡi
Những ngành nào bị ảnh hưởng nhiều nhất bởi làn sóng tăng giá bộ nhớ này? Chúng ta có thể xếp hạng các ngành này theo tỷ lệ phần trăm nhu cầu bộ nhớ từ khách hàng có nhu cầu lưu trữ thiết yếu.
Biểu đồ của Morgan Stanley về "Tỷ lệ phần trăm chi phí của nhà sản xuất phần cứng".
Ngành công nghiệp điện thoại di động được đề cập trước đó có vẻ đang trong tình trạng khó khăn, nhưng bộ nhớ thực tế chỉ chiếm 18% tổng chi phí. Lý do nhiều nhà sản xuất điện thoại di động lên tiếng là vì quy mô tổng thể của thị trường điện thoại di động rất lớn và gần gũi hơn với người tiêu dùng.
Sự mất cân bằng giữa cung và cầu bộ nhớ liên quan đến việc các nhà sản xuất lưu trữ đầu nguồn kiểm soát biên lợi nhuận: họ ưu tiên phân bổ năng lực sản xuất cho những khách hàng có biên lợi nhuận cao hơn.
Trước đây, các nhà sản xuất điện thoại di động có thể chốt được 70%-80% nhu cầu của họ thông qua các chương trình khuyến mãi hàng quý. Giờ đây, các nhà sản xuất lưu trữ ưu tiên cung cấp cho khách hàng máy chủ AI những đơn hàng lớn và biên lợi nhuận cao, đẩy các nhà sản xuất điện thoại di động xuống vai trò hỗ trợ.
Các thương hiệu Trung Quốc hàng đầu chỉ có thể đảm bảo lưu trữ cho 80% doanh số của họ vào năm tới, trong khi các nhà sản xuất hạng hai chỉ có thể đảm bảo 60%.
Với khoảng cách cung-cầu từ 20%-40% và áp lực giá cao do các yếu tố thị trường thúc đẩy, các nhà sản xuất điện tử tiêu dùng, đặc biệt là các nhà sản xuất điện thoại di động, sẽ phải đối mặt với những thử thách khắc nghiệt về năng lực chuỗi cung ứng của họ.
Do đó, không có gì ngạc nhiên khi những người dẫn đầu ngành điện thoại di động như Lei Jun lại "than phiền" trực tuyến.
Trong ngắn hạn, các nhà sản xuất điện thoại di động có thể duy trì lợi nhuận gộp thông qua giá tồn kho trung bình. Tuy nhiên, khi hàng tồn kho được tiêu thụ hết, áp lực chi phí do giá lưu trữ tăng sẽ dần tăng lên. Ngoài ra, lưu trữ chiếm gần 20% tổng chi phí BOM của thiết bị. Các mẫu máy cấp thấp với biên lợi nhuận mỏng sẽ bị ảnh hưởng đáng kể hơn, và xu hướng hợp nhất ngành, nơi các công ty lớn trở nên lớn mạnh hơn, sẽ trở nên rõ nét hơn.
Bên cạnh các thương hiệu điện tử tiêu dùng, ngành OEM/ODM phần cứng cũng đang phải đối mặt với áp lực biên lợi nhuận đáng kể do siêu chu kỳ lưu trữ gây ra.
Các xu hướng dài hạn như AI tạo sinh và sự gia tăng dữ liệu đang hỗ trợ nhu cầu ngày càng tăng, nhưng giá NAND và DRAM đã tăng lần lượt 50% và 300% trong sáu tháng qua, dẫn đến chi phí đầu vào tăng mạnh.
Dựa trên kinh nghiệm lịch sử từ chu kỳ 2016-2018, trong báo cáo ngành OEM phần cứng đầu tháng 11, Morgan Stanley dự đoán biên lợi nhuận gộp trung bình của ngành sẽ giảm 60% vào năm 2026, và thu nhập trung bình trên mỗi cổ phiếu sẽ thấp hơn 11% so với dự báo của ngành, điều này có thể dẫn đến sự thu hẹp hệ số định giá. Dell, HP, ASUS và các công ty khác được Morgan Stanley xếp vào nhóm "dễ bị tổn thương nhất".
Nhìn rộng hơn, việc tăng giá cũng có thể gây ra những tác động tiêu cực đến các ngành công nghiệp.
Hiện nay, DDR5 đã trở thành xu hướng chủ đạo trong các sản phẩm quốc tế, và các nền tảng thế hệ mới của các công ty CPU hàng đầu như Intel và AMD đã được áp dụng.
Theo báo cáo Quý 1 năm 2025 của TrendForce, DDR5 đã chiếm hơn 90% thị trường DRAM máy chủ toàn cầu, trở thành nguồn cung chính cho các ứng dụng tính toán cao như đào tạo AI và điện toán đám mây. Hiện tại, việc mở rộng sản xuất do "sự đảo ngược giá" của DDR4 có thể làm chậm tốc độ nâng cấp của ngành.
"Nếu các nhà sản xuất DRAM ưu tiên lợi nhuận ngắn hạn từ giá DDR4 đảo ngược và tiếp tục duy trì hoặc mở rộng sản xuất, trong một ngành công nghiệp mà dung lượng là vua, điều đó đồng nghĩa với việc giảm đầu tư vào các sản phẩm cao cấp hơn như DDR5, bỏ lỡ việc nâng cấp sản phẩm và cuối cùng là mất khả năng cạnh tranh trên thị trường DRAM đang biến đổi nhanh chóng", một chuyên gia trong ngành bộ nhớ cho biết.
Câu chuyện mới về lưu trữ
Trong vài năm qua, HBM dựa trên chip DRAM đã chiếm được cảm tình của các ông lớn chip AI nhờ băng thông cao, nhưng dung lượng lưu trữ của nó lại là một điểm yếu cố hữu. Do đó, các nhà sản xuất như SanDisk đã bắt đầu đề xuất công nghệ HBF dựa trên chip NAND.
Sơ đồ mặt cắt kiến trúc HBF, được đóng gói với GPU.
HBF mượn khái niệm xếp chồng từ HBM, xếp chồng 16 lớp chip lõi và kết nối chúng thông qua các via silicon, đạt được băng thông tương đương với HBM.
SanDisk nhấn mạnh rằng, với chi phí tương đương, chip HBF cung cấp dung lượng gấp 8-16 lần chip HBM, với dung lượng một ngăn xếp đơn lên đến 512GB, điều này đơn giản có nghĩa là chúng tiết kiệm hơn.
Ngoài ra, theo kiến trúc điện toán hiện tại, quy trình nhận dữ liệu là SSD → HBM → GPU. HBM chịu trách nhiệm cho cả bộ nhớ tính toán và cổng bộ nhớ đệm, từ đó tạo ra nút thắt về độ trễ.
HBF cung cấp dữ liệu trực tiếp cho GPU, điều này sẽ dẫn đến một loạt các phản ứng dây chuyền: tăng tốc độ tạo mã thông báo → giảm thời gian nhàn rỗi của GPU → giảm tổng chi phí sở hữu (TCO) cho trí tuệ nhân tạo → giảm chi phí đơn vị của các dịch vụ mô hình ngôn ngữ lớn.
Hiệu quả kinh tế, mức tiêu thụ điện năng thấp, độ trễ thấp, khả năng mở rộng cao và tính thực tiễn của nó càng mở rộng các kịch bản ứng dụng của HBF.
Về mặt kịch bản ứng dụng, công nghệ HBF phù hợp để đọc các tác vụ suy luận AI chuyên sâu và có thể được sử dụng trong các tình huống như định vị các mô hình lớn trên thiết bị di động và lái xe tự động. SanDisk dự kiến sẽ cung cấp mẫu vào nửa cuối năm 2026 và cũng đang hợp tác với SK Hynix để thúc đẩy việc chuẩn hóa công nghệ của mình.
Tuy nhiên, điều này không có nghĩa là HBF, giải pháp lưu trữ mới này, hoàn hảo.
Thứ nhất, chip DRAM không có giới hạn tuổi thọ, trong khi NAND có tuổi thọ hạn chế. Một khi NAND được đóng gói cùng với GPU, khi hết tuổi thọ, bo mạch GPU sẽ bị hư hỏng, đây là một chi phí không thể chấp nhận được đối với một GPU trị giá hàng chục nghìn đô la.
Thứ hai, bộ nhớ flash NAND có yêu cầu tương đối khắt khe về môi trường làm việc, từ 80 đến 85 độ C, trong khi DRAM có thể đạt tới 125 độ C.
Nói cách khác, ngành công nghiệp có thể thúc đẩy việc triển khai kiến trúc lai HBM+HBF trong tương lai để giảm đáng kể chi phí suy luận mô hình. Trong kiến trúc này, HBF đóng vai trò là bộ nhớ phụ dung lượng lớn kết hợp với HBM.
Mặc dù HBM sẽ không bị thay thế, nhưng tốc độ tăng trưởng nhu cầu về nó dự kiến sẽ chậm lại, điều này sẽ làm chậm nhu cầu về chip DRAM và làm tăng sự phụ thuộc vào chip NAND.
Nguồn: Tech.sina.cn