【AI风向】美光CEO再发预警：AI算力狂飙，内存短缺至少持续到2028年

全球最大存储芯片厂商之一美光科技正式定性：内存已成"战略资产"，AI产业尚在"早期阶段"却已经把存储器抢购一空。

事件回顾

5月26日，摩根大通年度科技峰会上，美光科技（Micron Technology）管理层发出了一个让整个AI行业都坐不住的警告：受人工智能算力需求爆发式增长驱动，HBM（高带宽内存）、DRAM和NAND存储芯片的供应紧张局面将远不止于2026年——大规模新增产能最早要到2028年才能集中释放。

这已经不是美光第一次拉响警报。早在5月4日，美光CEO桑杰·梅赫罗特拉（Sanjay Mehrotra）在接受CNBC采访时就已断言："AI的发展仍处于'早期阶段'（First Inning），但内存已经被抢购到疯狂状态。"他还首次将内存定性为"战略资产"——这个措辞的分量，半导体行业的人都懂。

到了5月23日，梅赫罗特拉再次通过IT之家等媒体放话：短缺将持续至2026年之后，根源在于AI需求增速"远远超过行业扩产速度"。

而这次在摩根大通峰会上的最新表态，直接把时间线推到了2028年。

▲ 内存已成AI战略资产：HBM成本占比、产能释放时间线、显存涨幅一览

为什么内存成了AI的"卡脖子"环节？

很多人的注意力一直放在GPU上——英伟达的H200、B200供货紧不紧张，价格涨没涨。但真正决定AI算力天花板的，可能不是GPU核心芯片本身，而是绑在GPU旁边的那几颗HBM内存。

简单科普一下：HBM（High Bandwidth Memory）是一种垂直堆叠的高带宽内存，它和GPU芯片封装在同一个基板上，负责在GPU和内存之间高速搬运数据。大模型训练和推理需要频繁地在GPU核心与内存之间搬运海量参数——以GPT-5级别的大模型为例，每次前向传播都需要把几千亿个参数从内存加载到计算核心。如果HBM带宽跟不上，GPU算力再强也是"空转"。

美光CEO的原话是：性能提升的窗口正在收窄，芯片晶粒（die）尺寸持续增大，加上极紫外光刻（EUV）工艺的产能爬坡存在结构性瓶颈——这三重因素叠加，意味着即便厂商全力推进扩产，供给端的弹性也极其有限。

翻译成人话就是：不是不想造，是造不出来那么快。

对AI创业者的实际影响

1. 云服务成本可能继续上涨

HBM占GPU物料成本的比重已经从几年前的个位数飙升至30%以上。内存涨价会直接传导到GPU售价，再传导到云服务商的GPU实例定价。对于依赖云端GPU训练模型或跑推理的AI创业者来说，算力账单只会越来越难看。

2. 本地部署的硬件门槛被抬高

2026年"本地AI"是一大趋势——越来越多的开发者和中小企业选择在本地部署开源模型（如DeepSeek-V4、Llama 4等），以避免云服务的持续开销。但显卡价格持续上行（2026年显卡价格同比涨幅已超20%），其中显存被AI需求虹吸是核心原因。本地部署的"性价比"正在被侵蚀。

3. 模型效率优化从"锦上添花"变成"生存技能"

既然硬件成本下不来，软件层面的优化就变得至关重要。量化（quantization）、蒸馏（distillation）、MoE（混合专家）架构、投机解码（speculative decoding）等技术，不再只是学术界的研究课题，而是实实在在能帮你"省显卡"的手段。2026年，不会做模型优化的AI团队将面临严重的成本劣势。

4. HBM供应格局的变化

目前HBM市场由SK海力士、三星、美光三巨头把控。美光作为后发者正在拼命追赶——其HBM4样品已送样主要客户，专为下一代AI平台设计。这场"内存军备竞赛"的赢家，将在未来3-5年内获得巨大的议价权。对于AI创业者来说，关注上游供应链动态不再是可有可无的选择题。

▲ 2026年AI算力降本四大路径：量化、MoE、KV Cache压缩、动态批处理

我们能学到什么

第一，算力成本是AI创业的第一性原理。 很多AI创业者热衷于讨论模型架构、提示词工程、Agent框架，但常常忽略了物理层的约束——最终一切都要落在硅片上。内存供应链的紧张状况说明，算力成本在可预见的未来只会上升不会下降。在做商业计划时，请用最悲观的算力成本假设。

第二，"效率"正在成为核心竞争力。 2023-2024年AI行业的关键词是"规模"（scale）——更大的模型、更多的参数、更长的上下文。但2025-2026年的关键词正在变成"效率"（efficiency）——如何用更少的算力做更多的事。美光的警告只是为这个趋势加了一个注脚。

第三，关注替代方案和新兴架构。 当传统冯·诺依曼架构的"内存墙"越来越难以逾越时，存内计算（Processing-in-Memory）、近存计算（Near-Memory Computing）、甚至光学互连等替代方案的价值就会凸显。这些技术虽然距离大规模商用还有距离，但方向已经明确。

行动建议

如果你在用云端GPU：锁定长期预留实例（Reserved Instances）或承诺使用折扣（Committed Use Discounts），避免现货市场价格波动。
如果你在做本地部署：优先考虑内存效率更高的模型架构（如MoE），在显存有限的硬件上最大化推理性能。
如果你在做AI infra/工具：模型量化、KV Cache压缩、动态批处理等降本技术，在2026年会有巨大的市场需求——这是一个明确的创业方向。
保持关注：美光、SK海力士、三星的季度财报和产能规划，是判断AI算力成本走势的先行指标。5月底到6月初是存储芯片厂商密集发布Q2指引的时间窗口。

#AI创业 #算力成本 #内存短缺 #HBM #美光 #一人公司

本文由AI辅助创作，经人工审核编辑发布