Cơn sốt AI đẩy giá bộ nhớ tăng 50%, gây khan hiếm nguồn cung đến 2026

Minh Nguyệt
Minh Nguyệt
Phản hồi: 0

Minh Nguyệt

Intern Writer
Chào các bạn, hôm nay mình muốn chia sẻ một câu chuyện đang rất "nóng" trong thế giới công nghệ, đó là về thị trường bộ nhớ, đặc biệt là DRAM, đang bước vào giai đoạn "của người bán" cho đến tận năm 2026. Lý do chính ư? Chính là sự bùng nổ của Trí tuệ nhân tạo (AI) đang đẩy nhu cầu lên cao ngất ngưởng, dù khoảng cách hiệu suất giữa bộ xử lý và bộ nhớ giờ đây đã trở thành một thách thức cực kỳ lớn.

Bộ nhớ flash NAND dùng cho lưu trữ AI cũng đang được hưởng lợi từ đà tăng trưởng của DRAM. Trong khi đó, các loại bộ nhớ mới nổi như MRAM, ReRAM và FRAM vẫn đang tìm kiếm những thị trường ngách, với khối lượng sản xuất thấp hơn và phải vật lộn với bài toán kinh tế theo quy mô.
1767753037851.png

Theo báo cáo "Memory Outlook Report 2026" của TechInsights, AI đang đứng trước một ngã ba đường. Các công nghệ bộ nhớ truyền thống dường như không còn đủ sức đáp ứng yêu cầu về năng lượng và hiệu suất, biến công nghệ bộ nhớ thành nút thắt cổ chai của nền kinh tế dữ liệu. Năm tới sẽ là một năm cực kỳ quan trọng để các nhà sản xuất bộ nhớ phải tăng cường khả năng mở rộng, đáp ứng trực tiếp nhu cầu của AI.

Trong một buổi trao đổi với EE Times, anh Mike Howard, Giám đốc thị trường DRAM và bộ nhớ tại TechInsights, đã chia sẻ rằng khoảng cách hiệu suất giữa bộ xử lý và bộ nhớ sẽ thúc đẩy việc áp dụng bộ nhớ băng thông cao (HBM) và giao thức CXL để giải quyết cái mà chúng ta gọi là "rào cản bộ nhớ".

Tuy nhiên, anh Howard cũng nhấn mạnh rằng "rào cản bộ nhớ" không phải là thách thức duy nhất trong năm tới. Việc các nhà cung cấp dịch vụ đám mây lớn (hyperscalers) "chi bạo" từ cuối năm 2023 để xây dựng năng lực sản xuất cho năm 2025 đã khiến ngành công nghiệp thiếu hụt năng lực sản xuất wafer. Sản xuất đang dịch chuyển từ DDR và LPDDR sang HBM để đáp ứng nhu cầu AI. Anh ấy nói vui rằng "lợi nhuận từ HBM quá béo bở, khiến các nhà sản xuất đổ xô vào tăng cường năng lực HBM".

Anh Howard cũng băn khoăn rằng chúng ta vẫn chưa rõ đâu là giới hạn của nhu cầu AI. "Chúng ta đơn giản là không thể đáp ứng kịp về năng lực sản xuất", anh ấy chia sẻ.

Thiết bị tiêu dùng sẽ chịu ảnh hưởng nặng nề từ việc thiếu hụt DRAM

Anh Howard lưu ý rằng các trung tâm dữ liệu AI không chỉ cần HBM. Nhiều tác vụ AI cần máy chủ truyền thống, và những máy chủ này cũng đang có nhu cầu rất cao. "Không đủ DRAM để cung cấp cho tất cả mọi người đâu", anh ấy nói.

TechInsights dự báo SK Hynix sẽ sản xuất khoảng 40.000 wafer vào năm 2026, phần lớn trong số đó sẽ được phân bổ cho HBM. Samsung có một số năng lực sản xuất ở Pyeongtaek, nhưng nhà máy thứ hai của Micron Technology ở Idaho sẽ không đi vào hoạt động cho đến năm 2027.

Tình trạng thiếu hụt này dẫn đến giá cao hơn và biên lợi nhuận tốt hơn cho các nhà sản xuất DRAM, do nguồn cung thiếu hụt đáng kể và nhu cầu mạnh mẽ.

Sự bùng nổ này không phải là chưa từng có tiền lệ. Thị trường DRAM và flash từ trước đến nay vẫn tuân theo một chu kỳ bùng nổ rồi suy thoái. Đợt tăng nhu cầu bộ nhớ gần đây nhất diễn ra sau giai đoạn chững lại hậu đại dịch, nhưng ngay cả những mức thấp hiện tại cũng cao hơn so với trước đây. Anh Howard nói: "Chúng ta không còn thấy các công ty phá sản nữa. Quá trình hợp nhất đã kết thúc rồi".

Bất kỳ nguồn cung nào có sẵn, dù là HBM hay DDR5, đều sẽ được phân bổ cho các công ty công nghệ lớn có tiềm lực tài chính. Điều này có nghĩa là việc thiếu hụt DRAM sẽ dẫn đến tình trạng khan hiếm cho các thiết bị tiêu dùng, chẳng hạn như điện thoại thông minh.

Dự báo về tình trạng thiếu hụt bộ nhớ của TechInsights cũng được lặp lại trong báo cáo hai tuần một lần "Memory Solutions for GenAI" của Counterpoint Research, được công bố vào cuối tháng 11. Báo cáo này dự đoán giá bộ nhớ có thể tăng 50% so với mức hiện tại cho đến quý 2 năm 2026 do tình trạng thiếu chip nghiêm trọng.

Anh Howard cho rằng các dự báo về nhu cầu DRAM cao cần được cân nhắc với sự không chắc chắn đi kèm với AI. Sự xuất hiện nhanh chóng của nó vào năm 2023 có thể là khởi đầu của một bong bóng có thể vỡ trong năm tới. "Cứ mỗi câu chuyện bạn đọc về nhu cầu tăng trưởng mạnh mẽ, lại có một câu chuyện tương ứng về bong bóng AI", anh ấy chia sẻ.

Anh Howard nói thêm rằng các nhà sản xuất DRAM không quên cuộc suy thoái năm 2018, và nhiều người đã trải qua cuộc suy thoái năm 2008. "Họ đã thấy tính chu kỳ của thị trường. Họ là những người thực tế".

Điều này có nghĩa là họ sẽ tăng chi tiêu vốn (capex) thêm 20% vào năm tới, nhưng với các kế hoạch dự phòng trong trường hợp phải "phanh gấp". "Họ có thể đang 'nhấm nháp' cơ hội, nhưng không 'uống cạn' một cách vội vàng", anh ấy ví von.

Trong khi đó, việc tập trung vào DRAM có nghĩa là NAND sẽ nhận được ít sự chú ý hơn một chút. Anh Howard cho rằng NAND rõ ràng sẽ được hưởng lợi từ xu hướng này, nhưng điều đó càng trầm trọng hơn bởi tình trạng thiếu hụt ổ cứng HDD.

Anh ấy nói rằng các nhà sản xuất ổ cứng đang xem xét khoảng thời gian 18 tháng để tăng năng lực sản xuất, nhưng họ không muốn rơi vào tình trạng cung vượt cầu. "Tình trạng thiếu hụt HDD đang thúc đẩy nhiều nhu cầu hơn đối với SSD".

Thiếu đầu tư vào NAND gây áp lực lên lưu trữ AI


Kể từ khi AI ra đời, thông lượng đã trở nên quan trọng hơn, điều này là một lợi thế lớn cho SSD. Tuy nhiên, NAND đã chứng kiến sự thiếu hụt đầu tư trong năm năm qua. Lợi nhuận kém và sự miễn cưỡng đầu tư đã khiến tình hình trở nên khó khăn.

Anh Sebastien Jean, CTO của nhà sản xuất SSD Phison USA, chia sẻ với EE Times rằng công ty đang theo dõi sát sao nguồn cung NAND. "Ngành công nghiệp NAND có tính chu kỳ, và chúng ta đã trải qua một giai đoạn mà việc cắt giảm sản xuất và nhu cầu do AI thúc đẩy đã thắt chặt nguồn cung".

Anh ấy nói rằng Phison có cái nhìn hơi khác so với một nhà sản xuất NAND thuần túy vì công ty ở vị trí trung tâm của hệ sinh thái. "Chúng tôi hợp tác chặt chẽ với tất cả các nhà cung cấp NAND lớn và với một lượng lớn khách hàng trên các lĩnh vực máy chủ, ô tô, công nghiệp và trò chơi, vì vậy chúng tôi có cái nhìn rõ ràng về cả hai phía của phương trình cung cầu".

Từ góc độ vận hành, Phison đã lên kế hoạch cho nguồn cung thắt chặt hơn. Anh Jean cho biết: "Chúng tôi đủ điều kiện cho các bộ điều khiển và SSD của mình trên nhiều thế hệ và nhà cung cấp NAND. Chúng tôi giảm thiểu tình trạng thiếu hụt NAND thông qua quan hệ đối tác lâu dài và phối hợp chặt chẽ với các nhà cung cấp và khách hàng của mình".

Anh ấy cũng nói rằng Phison có tùy chọn để kích hoạt nhiều nguồn NAND song song. "Mặc dù ngành công nghiệp sẽ cần tiếp tục đầu tư để theo kịp AI và lộ trình SSD mật độ cao, chúng tôi tự tin vào khả năng hỗ trợ khách hàng doanh nghiệp và AI của mình trong các chu kỳ sắp tới".

Anh Jean giải thích rằng AI đã biến bộ nhớ lưu trữ từ một dịch vụ nền thành một thành phần hiệu suất hàng đầu, đóng vai trò quan trọng trong cách các đường ống AI hoạt động. Chúng cần SSD có thể duy trì băng thông và IOPS cao trong khi vẫn kiểm soát được độ trễ đuôi. "Đó là một lý do lớn khiến chúng tôi thấy các doanh nghiệp chuyển các bộ dữ liệu AI quan trọng từ ổ đĩa sang bộ nhớ flash", anh ấy nói.

Phison đang nhận thấy nhu cầu về các loại SSD mới được tối ưu hóa đặc biệt cho AI theo những cách vượt xa tốc độ và độ trễ cơ bản. "Kích thước mô hình và cửa sổ ngữ cảnh ngày càng lớn".

Điều đó có nghĩa là SSD phải đáp ứng đồng thời hai yêu cầu khắt khe: nhiều bộ nhớ hơn gần GPU và nhiều dung lượng hơn ở tầng lưu trữ. Anh Jean chia sẻ: "Chúng tôi đang thấy sự phối hợp nhiều hơn giữa GPU và SSD để cải thiện đáng kể trải nghiệm người dùng mà không tăng rủi ro khi đặt bộ nhớ trực tiếp lên GPU".

Điện toán biên và ô tô cũng thúc đẩy nhu cầu bộ nhớ

Ngoài các trung tâm dữ liệu siêu lớn và doanh nghiệp, anh Jean cho biết Phison nhận thấy nhu cầu SSD mạnh mẽ trong các hệ thống biên và nhúng, cũng như các thiết bị khách hàng và các thị trường dọc như ô tô và chính phủ.

"Ở điện toán biên, robot, IoT công nghiệp và các nút viễn thông đang bắt đầu chạy suy luận AI cục bộ, điều này làm cho bộ nhớ flash bền bỉ, độ trễ thấp trở nên thiết yếu", anh ấy nói. "Các nền tảng ô tô đang áp dụng nhiều bộ nhớ flash hơn cho ADAS, hệ thống thông tin giải trí trong xe và ghi dữ liệu, và chúng tôi cũng đang thấy các triển khai AI an toàn, tại chỗ trong chính phủ và quốc phòng".

Anh Jean nói thêm rằng điểm chung xuyên suốt tất cả các phân khúc này là một khi AI trở thành một phần của quy trình làm việc, các ổ đĩa quay không thể đáp ứng các yêu cầu về độ trễ, năng lượng và độ bền, vì vậy flash trở thành lựa chọn mặc định.

Anh Howard của TechInsights khẳng định những xu hướng này. Có hàng nghìn tỷ thiết bị biên cần nhiều bộ nhớ và lưu trữ hơn để chạy AI. Phân khúc ô tô cũng là một động lực thúc đẩy nhu cầu, mặc dù chậm hơn. Anh ấy nói: "Hàm lượng bán dẫn của họ tăng đều đặn theo thời gian".

Người mua bộ nhớ ô tô đang chứng kiến giá tăng, và anh Howard cho biết các khách hàng nhỏ hơn đối với DRAM sẽ phải tranh giành phân bổ. Anh ấy nói rằng việc thiếu hụt DRAM, cùng với sự thay đổi trong kiến trúc phần cứng, có thể tạo ra cơ hội cho các bộ nhớ mới nổi. "Chúng ta đã chuyển từ mô hình tính toán chủ yếu dựa vào CPU sang mô hình chủ yếu dựa vào GPU".

Và với việc giá DRAM tăng "chóng mặt", các bộ nhớ mới nổi mà sáu tháng trước còn có vẻ không kinh tế, giờ đây lại trở nên hấp dẫn hơn. "Nếu bạn kết hợp điều đó với một số hình thức tăng cường hiệu suất hoặc sự khác biệt, thì có một cơ hội lớn ở đó".

Cơ hội cho bộ nhớ mới nổi không phụ thuộc vào AI

Trong một hội thảo trực tuyến gần đây do nhà phân tích chính Jim Handy của Objective Analysis và chủ tịch Tom Coughlin của Coughlin Associates đồng tổ chức, chủ đề chính là việc áp dụng các bộ nhớ mới nổi, như MRAM, PCM, ReRAM và FRAM, không phải do AI thúc đẩy.

Tất cả các bộ nhớ này đều có những đặc điểm chung. Anh Handy cho biết, trong số đó có một ô bóng bán dẫn duy nhất và tốc độ cao hơn so với bộ nhớ flash. Chúng đều là bộ nhớ không bay hơi, không giống như DRAM và SRAM. "Đó là một điểm cộng lớn", anh ấy nhấn mạnh.

Công nghệ 3D Xpoint PCM của Intel, Optane, là một nỗ lực để đưa tính bền vững gần hơn với quy trình, điều này có những lợi thế riêng. Tuy nhiên, anh Handy nói rằng việc xây dựng cơ sở hạ tầng để hỗ trợ nó đã mất rất nhiều thời gian.

Tất cả các bộ nhớ mới nổi đều có khả năng ghi tại chỗ mà không có sẵn trong SRAM, NAND và NOR flash, điều này có nghĩa là chúng có giới hạn mở rộng tốt hơn. Chúng cũng cung cấp độ bền tốt hơn đáng kể so với bộ nhớ flash NAND. "Các cơ chế hao mòn không khó khăn bằng việc xử lý flash", anh ấy giải thích.

Bộ nhớ mới nổi có thể là cả dạng nhúng và rời rạc. Anh Coughlin cho biết có rất nhiều hoạt động nhúng xung quanh MRAM, đặc biệt là khi NOR flash đang bị loại bỏ trong các ứng dụng nhúng vì nó không mở rộng được dưới 28 nanomet. "Nó cũng có vấn đề về độ bền nếu bạn đang cập nhật bộ nhớ mã", anh ấy nói.

Có một số loại MRAM đang được sản xuất bởi nhiều công ty, bao gồm Everspin, TSMC, Samsung và GlobalFoundries. "Có sự hỗ trợ rộng rãi. Nó đang ở vị trí dẫn đầu hiện tại về các ứng dụng thực tế", anh Coughlin nhận định.

Anh Coughlin cho biết đối thủ lớn khác là ReRAM, có nhiều loại cho các ứng dụng rời rạc và nhúng, và có tiềm năng vượt lên trên các bộ nhớ mới nổi khác về lâu dài. "Nó sử dụng các vật liệu đã phổ biến trong sản xuất, và nó cũng có thể chịu được bức xạ", anh ấy nói. "Có rất nhiều nhà sản xuất khác nhau và nhiều cách tiếp cận khác nhau đối với nó".

Nhưng có lẽ bộ nhớ mới nổi được sử dụng nhiều nhất là FRAM, có khối lượng sản xuất cao ở một số dạng, nhưng tốc độ chạy wafer thấp.

FRAM đã được sử dụng trong các ứng dụng thẻ thông minh tài chính, thanh toán giao thông và hộp giải mã tín hiệu. So với các công nghệ EEPROM hiện có, FRAM có khả năng chống hỏng dữ liệu tốt hơn thông qua trường điện và bức xạ.

Anh Coughlin nói rằng sức hấp dẫn của FRAM là năng lượng thấp, tốc độ cao và độ bền cao. Nhược điểm của bộ nhớ này là nó không tương thích với các quy trình truyền thống và một số vật liệu không thân thiện trong môi trường nhà máy bán dẫn.

Bộ nhớ mới nổi thứ tư có tiềm năng là PCM, mà anh Coughlin nói rằng đã gặp thách thức do năng lượng cao và độ nhạy nhiệt. "Các vật liệu khá thách thức", anh ấy nhận xét.

Dạng PCM đáng chú ý nhất là 3D Xpoint, được Micron và Intel đồng phát triển, mà Intel đã đưa ra thị trường dưới tên Optane. Anh Coughlin cho biết có tin đồn về các công ty đang phát triển một công nghệ dựa trên PCM khác, nhưng hiện tại chưa có nỗ lực thương mại hóa lớn nào.

Bộ nhớ mới nổi vẫn vật lộn với kinh tế theo quy mô

Anh Handy cho biết các yếu tố thị trường ảnh hưởng đến mức độ chấp nhận các bộ nhớ mới nổi so với các bộ nhớ đã có chỗ đứng vững chắc, vốn là những tiêu chuẩn lớn như DRAM và flash NAND.

Việc bộ nhớ là dạng nhúng hay rời rạc là một yếu tố chính, và chúng là những thị trường rất khác nhau. Anh Handy nói rằng cơ hội tổng thể cho các bộ nhớ mới nổi là dành cho các ứng dụng ngách, nơi cả chip bộ nhớ rời rạc và độc lập đang được bán hiện nay.

Quân sự và hàng không vũ trụ là hai thị trường mà bộ nhớ mới nổi sẽ tìm thấy nhu cầu, một phần nhờ khả năng chịu bức xạ của chúng, dù là cho hệ thống vũ khí hay vệ tinh. Quỹ đạo Trái đất có rất nhiều bức xạ. Anh ấy nói: "Thị trường đó có thể có khối lượng đơn vị thấp, nhưng họ trả giá cực kỳ cao. Đó là một cứu cánh cho rất nhiều công ty này".

Thị trường công nghiệp cũng đang áp dụng các bộ nhớ mới nổi, cũng như phân khúc thiết bị đeo y tế vì mức tiêu thụ điện năng thấp cho phép thời lượng pin dài hơn trong các thiết bị như máy trợ thính và máy tạo nhịp tim. Anh Handy cho biết độ bền và độ tin cậy trên phạm vi nhiệt độ rộng cũng là những đặc điểm hấp dẫn của bộ nhớ mới nổi, đặc biệt là trong ô tô.

Khi NOR flash và SRAM đang đạt đến giới hạn mở rộng, điều đó sẽ tạo ra một "cơ hội lớn" cho các bộ nhớ mới nổi, anh ấy nói.

Dự báo tổng thể của anh Handy và anh Coughlin cho các bộ nhớ mới nổi là các dạng nhúng sẽ thúc đẩy khối lượng ban đầu và khối lượng wafer tiếp tục thúc đẩy kinh tế theo quy mô, điều này sẽ mở ra các thị trường mới cho các chip độc lập.

Tuy nhiên, việc đạt được kinh tế theo quy mô vẫn là yếu tố lớn nhất ảnh hưởng đến việc áp dụng các bộ nhớ mới nổi. Anh Handy nói: "Bạn có thể có kích thước khuôn nhỏ hơn với các công nghệ mới này, nhưng điều đó không đảm bảo rằng linh kiện sẽ rẻ hơn".

Khối lượng wafer ảnh hưởng rất lớn đến chi phí sản xuất của một bộ nhớ mới nổi và giá thấp luôn thắng thế so với các tính năng tốt hơn. "Bạn đang gặp phải một vấn đề con gà quả trứng thực sự. Cho đến khi bạn tăng được khối lượng, bạn không thể thực sự cạnh tranh với các công nghệ đã có", anh Handy kết luận.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL2Nvbi1zb3QtYWktZGF5LWdpYS1iby1uaG8tdGFuZy01MC1nYXkta2hhbi1oaWVtLW5ndW9uLWN1bmctZGVuLTIwMjYuNzY5NzMv
Top