AI风向

【AI风向】美光CEO再发预警:AI算力狂飙,内存短缺至少持续到2028年

全球最大存储芯片厂商之一美光科技正式定性:内存已成"战略资产",AI产业尚在"早期阶段"却已经把存储器抢购一空。

事件回顾

5月26日,摩根大通年度科技峰会上,美光科技(Micron Technology)管理层发出了一个让整个AI行业都坐不住的警告:受人工智能算力需求爆发式增长驱动,HBM(高带宽内存)、DRAM和NAND存储芯片的供应紧张局面将远不止于2026年——大规模新增产能最早要到2028年才能集中释放

这已经不是美光第一次拉响警报。早在5月4日,美光CEO桑杰·梅赫罗特拉(Sanjay Mehrotra)在接受CNBC采访时就已断言:"AI的发展仍处于'早期阶段'(First Inning),但内存已经被抢购到疯狂状态。"他还首次将内存定性为"战略资产"——这个措辞的分量,半导体行业的人都懂。

到了5月23日,梅赫罗特拉再次通过IT之家等媒体放话:短缺将持续至2026年之后,根源在于AI需求增速"远远超过行业扩产速度"。

而这次在摩根大通峰会上的最新表态,直接把时间线推到了2028年。

内存已成AI战略资产

▲ 内存已成AI战略资产:HBM成本占比、产能释放时间线、显存涨幅一览

为什么内存成了AI的"卡脖子"环节?

很多人的注意力一直放在GPU上——英伟达的H200、B200供货紧不紧张,价格涨没涨。但真正决定AI算力天花板的,可能不是GPU核心芯片本身,而是绑在GPU旁边的那几颗HBM内存

简单科普一下:HBM(High Bandwidth Memory)是一种垂直堆叠的高带宽内存,它和GPU芯片封装在同一个基板上,负责在GPU和内存之间高速搬运数据。大模型训练和推理需要频繁地在GPU核心与内存之间搬运海量参数——以GPT-5级别的大模型为例,每次前向传播都需要把几千亿个参数从内存加载到计算核心。如果HBM带宽跟不上,GPU算力再强也是"空转"。

美光CEO的原话是:性能提升的窗口正在收窄,芯片晶粒(die)尺寸持续增大,加上极紫外光刻(EUV)工艺的产能爬坡存在结构性瓶颈——这三重因素叠加,意味着即便厂商全力推进扩产,供给端的弹性也极其有限。

翻译成人话就是:不是不想造,是造不出来那么快。

对AI创业者的实际影响

1. 云服务成本可能继续上涨

HBM占GPU物料成本的比重已经从几年前的个位数飙升至30%以上。内存涨价会直接传导到GPU售价,再传导到云服务商的GPU实例定价。对于依赖云端GPU训练模型或跑推理的AI创业者来说,算力账单只会越来越难看。

2. 本地部署的硬件门槛被抬高

2026年"本地AI"是一大趋势——越来越多的开发者和中小企业选择在本地部署开源模型(如DeepSeek-V4、Llama 4等),以避免云服务的持续开销。但显卡价格持续上行(2026年显卡价格同比涨幅已超20%),其中显存被AI需求虹吸是核心原因。本地部署的"性价比"正在被侵蚀。

3. 模型效率优化从"锦上添花"变成"生存技能"

既然硬件成本下不来,软件层面的优化就变得至关重要。量化(quantization)、蒸馏(distillation)、MoE(混合专家)架构、投机解码(speculative decoding)等技术,不再只是学术界的研究课题,而是实实在在能帮你"省显卡"的手段。2026年,不会做模型优化的AI团队将面临严重的成本劣势。

4. HBM供应格局的变化

目前HBM市场由SK海力士、三星、美光三巨头把控。美光作为后发者正在拼命追赶——其HBM4样品已送样主要客户,专为下一代AI平台设计。这场"内存军备竞赛"的赢家,将在未来3-5年内获得巨大的议价权。对于AI创业者来说,关注上游供应链动态不再是可有可无的选择题。

2026年AI算力降本四大路径

▲ 2026年AI算力降本四大路径:量化、MoE、KV Cache压缩、动态批处理

我们能学到什么

第一,算力成本是AI创业的第一性原理。 很多AI创业者热衷于讨论模型架构、提示词工程、Agent框架,但常常忽略了物理层的约束——最终一切都要落在硅片上。内存供应链的紧张状况说明,算力成本在可预见的未来只会上升不会下降。在做商业计划时,请用最悲观的算力成本假设。

第二,"效率"正在成为核心竞争力。 2023-2024年AI行业的关键词是"规模"(scale)——更大的模型、更多的参数、更长的上下文。但2025-2026年的关键词正在变成"效率"(efficiency)——如何用更少的算力做更多的事。美光的警告只是为这个趋势加了一个注脚。

第三,关注替代方案和新兴架构。 当传统冯·诺依曼架构的"内存墙"越来越难以逾越时,存内计算(Processing-in-Memory)、近存计算(Near-Memory Computing)、甚至光学互连等替代方案的价值就会凸显。这些技术虽然距离大规模商用还有距离,但方向已经明确。

行动建议

  1. 如果你在用云端GPU:锁定长期预留实例(Reserved Instances)或承诺使用折扣(Committed Use Discounts),避免现货市场价格波动。
  2. 如果你在做本地部署:优先考虑内存效率更高的模型架构(如MoE),在显存有限的硬件上最大化推理性能。
  3. 如果你在做AI infra/工具:模型量化、KV Cache压缩、动态批处理等降本技术,在2026年会有巨大的市场需求——这是一个明确的创业方向。
  4. 保持关注:美光、SK海力士、三星的季度财报和产能规划,是判断AI算力成本走势的先行指标。5月底到6月初是存储芯片厂商密集发布Q2指引的时间窗口。

#AI创业 #算力成本 #内存短缺 #HBM #美光 #一人公司

本文由AI辅助创作,经人工审核编辑发布