博客
文章系列日历
归档关于搜索

鄂ICP备19019526号

© 2026 博客

  1. 文章
  2. HBM 算力供应链 2026:SK hynix、Samsung、Micron 三巨头产能格局与 CoWoS 隐形瓶颈

HBM 算力供应链 2026:SK hynix、Samsung、Micron 三巨头产能格局与 CoWoS 隐形瓶颈

2026年6月16日·约 18 分钟·5286 字·2 次阅读
AI 行业趋势
HBM 算力供应链 2026:SK hynix、Samsung、Micron 三巨头产能格局与 CoWoS 隐形瓶颈

目录

  • HBM 的「物理不可替代性」
  • 三巨头格局:SK hynix 领先一个身位
  • CoWoS:被忽视的隐形瓶颈
  • 三个可预见的格局重排
  • 伪代码:HBM 产能与算力需求的耦合模型
  • 云厂商的算力囤积策略
  • 投资视角下的供应链标的
  • 长期展望:HBM 之后的下一代瓶颈在哪里?
  • 参考文献

当整个 AI 行业把 2026 年定义为「基础模型上半场结束、下半场进入规模应用」的拐点时,绝大多数公开讨论都集中在模型能力、Agent 框架与商业化路径上。但决定这场竞赛走向的、最难复制的、最被低估的环节,是算力供应链——尤其是 HBM(High Bandwidth Memory,高带宽内存)与先进封装。2026 年上半年三大存储厂(SK hynix、Samsung、Micron)的 HBM 产能爬坡曲线、TSMC 的 CoWoS 封装产线扩张节奏、以及 NVIDIA 单颗 GPU 消耗的 HBM 容量代际跃迁,已经成为比模型架构更隐蔽的护城河。本文试图回答三个问题:HBM 为什么从「显存」变成了 AI 时代的战略物资?2026 年的供应格局到底有多紧绷?以及当供应瓶颈最终缓解时,行业格局会发生哪些可预见的重排?

HBM 的「物理不可替代性」

HBM 之所以成为 AI 训练的瓶颈,根本原因是它与 GPU 算力的耦合关系已经突破了过去「显存只是显存」的范畴。我们可以用一个简化的耦合公式描述这种关系:

Ttrain∝PFLOPs⋅Nparams⋅Bbytes/paramηMFU⋅BWHBMT_{\text{train}} \propto \frac{P_{\text{FLOPs}} \cdot N_{\text{params}} \cdot B_{\text{bytes/param}}}{\eta_{\text{MFU}} \cdot B W_{\text{HBM}}}Ttrain​∝ηMFU​⋅BWHBM​PFLOPs​⋅Nparams​⋅Bbytes/param​​

其中 BWHBMBW_{\text{HBM}}BWHBM​ 是单卡的 HBM 带宽,ηMFU\eta_{\text{MFU}}ηMFU​ 是 Model FLOPs Utilization,Bbytes/paramB_{\text{bytes/param}}Bbytes/param​ 是每个参数在训练时的字节占用(包括 optimizer state、gradient、activation)。当 BWHBMBW_{\text{HBM}}BWHBM​ 不足时,GPU 算力单元就会出现「饥饿」,从而压低 ηMFU\eta_{\text{MFU}}ηMFU​——这意味着即使买了再多的 GPU 集群,没有匹配的 HBM 供应也是无效算力。

以 NVIDIA H100 为例,单卡搭载 80GB HBM3,提供约 3.35 TB/s 带宽;而到了 B200 这一代,单卡 HBM3e 容量跃升至 192GB,带宽达到约 8 TB/s。带宽 2.4 倍、容量 2.4 倍的代际跃迁,意味着训练同一个 700B 参数模型所需的「GPU 卡数」会大幅下降,但对 HBM 总容量的需求不减反增——因为更大的模型上下文、更长的训练序列都把 HBM 消耗往上推。

图表加载中…

这个反馈环路解释了为什么从 2024 年起,HBM 需求曲线不是线性增长,而是指数级斜率——每一代 GPU 把 HBM 容量推到更高水位,模型架构师立刻把更大的上下文、更长的 CoT(Chain-of-Thought,思维链)塞进训练预算。

三巨头格局:SK hynix 领先一个身位

截至 2026 年中,HBM 市场呈现「一超一强一追赶」的三足鼎立。根据公开财报口径,SK hynix 在 HBM3e 世代占据全球 HBM 市场份额约 50%,主要客户包括 NVIDIA 与 AMD;Samsung 占比约 30% 左右,正以 HBM3e 8 层 / 12 层堆叠追赶;Micron 起步较晚但增长最快,2025 年下半年进入 NVIDIA 供应链后份额爬升至接近 20%。

三个玩家之间的差距不是营销数字,而是认证节奏。NVIDIA 的 HBM 供应商认证流程涉及可靠性测试(高温高湿、长时间负载、TSV 良率),完整周期通常需要 12-18 个月。SK hynix 在 H100 时代就拿到了「首发位」,到 B200 时代延续领先地位,本质上是早期押注 TSV(Through-Silicon Via,硅通孔)堆叠技术的复利效应。

关键工艺分水岭:HBM4 世代。三家厂商都在 2026 年加速 HBM4 研发,预期 2027 年量产。HBM4 的关键变化是单 stack 容量从 HBM3e 的 24GB 跃升到 36-48GB,带宽从约 1 TB/s/stack 提升到 1.5 TB/s/stack。Wikipedia 公开页面已确认 TSMC 将继续作为 HBM base die 的主要代工厂(来源:Wikipedia "High Bandwidth Memory",2026 年 6 月版本),这意味着HBM 不再是存储厂独占的工艺——先进制程与先进封装的耦合度越来越高。

CoWoS:被忽视的隐形瓶颈

如果说 HBM 是 AI 算力的「血液」,那么 TSMC 的 CoWoS(Chip-on-Wafer-on-Substrate,晶圆上芯片级封装)就是「血管」——它负责把 GPU die、HBM die、I/O die 封装到同一块 interposer 上。截至 2026 年中,CoWoS 月产能仍然显著供不应求,这是 NVIDIA、AMD 乃至自研 ASIC(如 Google TPU、AWS Trainium)共同面对的瓶颈。

CoWoS 的产能爬坡遵循 TSMC 经典的「蛙跳」节奏:

季度CoWoS 月产能(wafer)主要客户关键事件
2024 Q4~32kNVIDIA H100/H200出现排队 6+ 月
2025 Q4~55kH200/B200 首批TSMC 宣布扩产
2026 Q2~75kB200 量产爬坡Samsung HBM3e 认证通过
2026 Q4(预估)~95kB200/Rubin 切换国产替代客户首期

来源:综合 TSMC 财报、TrendForce 公开报告、Wikipedia HBM 词条交叉验证。注:具体数字为公开口径估算,未上市公司内部数据不可得。

这张表的关键洞察是:即使 HBM 产能跟上,CoWoS 仍是卡点。这是 2026 年很多云厂商「GPU 到了但装不进服务器」的根因——他们买的 H200 / B200 板卡可能已经下产线,但 interposer 还在 TSMC 排队。

三个可预见的格局重排

基于上述供需分析,我对 2026 年下半年到 2027 年的格局演变做出三个未公开验证的猜想(标注为前瞻观点):

猜想 1:Micron 将在 HBM4 世代翻盘至接近 30% 份额。Micron 的 HBM3e 起步虽晚,但 HBM4 的工艺路径选择上押注了 advanced packaging 与 base die 集成,与 TSMC 的耦合度比 SK hynix 更紧密。如果 HBM4 是「封装与存储一体化」的拐点,Micron 的后发优势会显现。不确定性:Samsung 也在押注同一路径,竞争烈度极高。

猜想 2:CoWoS 国产替代窗口期将在 2027 年下半年打开。国内长电科技、通富微电、华天科技均在 2025-2026 年密集投资 2.5D / 3D 先进封装产线,对标 CoWoS-S / CoWoS-L 工艺。如果国产 interposer 良率在 2027 年达到 70%+ 阈值,国产 ASIC 厂商(如华为昇腾、寒武纪、海光)的封装自主率会显著提升,从而部分绕开 TSMC 的产能排队。

猜想 3:「算力即地缘」的政治化定价将出现。截至 2026 年 6 月,HBM / CoWoS 的供应分配已经不再是纯商业问题——美国对华先进存储出口管制、欧盟 AI Act 对训练算力的披露要求、各国对「主权算力」的补贴政策,都在把这条供应链推向「关键基础设施」属性。这意味着 HBM 价格不再只由 DRAM 周期决定,而是叠加了地缘溢价。已经能看到早期信号:美国国防部高级研究计划局(DARPA)在 2025 年下半年启动「Microelectronics Commons」二期,把 HBM 国产化纳入补贴清单。

伪代码:HBM 产能与算力需求的耦合模型

为了把上述分析抽象成可复用的工具链,下面给出一个简化的产能-需求耦合模型伪代码(注意:参数未经过生产环境验证,仅供思路演示):

def hbm_supply_demand_balance(
    gpu_demand_units: dict,       # {gpu_model: units_per_quarter}
    hbm_per_gpu: dict,            # {gpu_model: hbm_capacity_gb}
    hbm3e_quarterly_capacity: float,  # in GB, per quarter
    cowos_quarterly_capacity: float,  # in wafer-equivalents
    cowos_per_gpu: dict,          # {gpu_model: cowos_die_area}
) -> dict:
    """
    计算每个季度 HBM 与 CoWoS 的供需平衡。
    返回 {quarter: {hbm_surplus_pct, cowos_surplus_pct}}
    """
    results = {}
    for quarter, units in gpu_demand_units.items():
        hbm_demand = sum(units.get(g, 0) * hbm_per_gpu.get(g, 0)
                         for g in units)
        cowos_demand = sum(units.get(g, 0) * cowos_per_gpu.get(g, 0)
                           for g in units)
        hbm_surplus = (hbm3e_quarterly_capacity - hbm_demand) / hbm_demand
        cowos_surplus = (cowos_quarterly_capacity - cowos_demand) / cowos_demand
        results[quarter] = {
            'hbm_surplus_pct': round(hbm_surplus * 100, 1),
            'cowos_surplus_pct': round(cowos_surplus * 100, 1)
        }
    return results

实际生产环境中,这个模型要叠加:①HBM 良率(typical 70-85%)②CoWoS interposer 良率(约 90%)③客户优先级(NVIDIA / AMD / Google / 自研 ASIC 的排队位置)④地缘管制因子。核心结论是:在 HBM4 量产 + CoWoS 扩产到位之前(预估 2027 年下半年),供需缺口将持续存在,算力租赁价格的下行空间非常有限。

云厂商的算力囤积策略

2026 年 H1 出现一个值得注意的反常现象:北美三大云厂商(AWS / Azure / GCP)的资本开支同比增速史无前例地达到 50%+,其中相当一部分并非投入到 GPU 本体,而是投入到 HBM / CoWoS 的 long-term reservation(长期预留)合同。这是云计算行业首次出现「为零部件而非整机锁产能」的采购范式。

背后的逻辑是:当 HBM 的供需缺口收窄节奏由 12-18 个月延长到 24+ 个月时,云厂商宁可提前 24 个月支付 5-15% 的 commitment fee,也要锁住 2027-2028 年的关键训练算力。这种「算力期货」模式的兴起,本质上是把 HBM 当作类大宗商品来交易,而非传统的硬件采购。

从公开财报数据反推,截至 2026 Q1,AWS / Azure / GCP 三家合计持有约 35 万张 H100/H200 等效卡的「committed inventory」,其中约 40% 锁定到 2027 年。未公开验证的猜想:这一比例将在 2026 H2 进一步推高到 50% 以上,因为 Anthropic、xAI、DeepSeek 等头部模型公司的训练算力需求仍在指数级增长,而供给端在 2027 H2 前难以显著释放。

投资视角下的供应链标的

如果把视角切换到二级市场,HBM / CoWoS 供应链的投资逻辑可以拆解为三个层级:

第一层(HBM 厂商):SK hynix 作为 HBM 份额最大、且 NVIDIA 优先级最高的供应商,是这一波「AI 内存牛」最直接的 beta。但 Samsung 与 Micron 的弹性可能更高,因为它们的起点份额低、扩产空间大。风险点:HBM 是周期品,价格波动剧烈,2024 年的 HBM2e 过剩与 2025 年的 HBM3e 紧缺形成鲜明对比,单纯押注「AI 故事」而忽略周期的投资者可能踩到下一轮库存调整。

第二层(先进封装 / 设备):TSMC 仍是 CoWoS 的绝对主导者,但其设备供应链(ASML、Applied Materials、Lam Research)也将受益于扩产周期。国产替代视角下:长电科技、通富微电、华天科技在 2.5D 封装的产能扩张值得长期跟踪。

第三层(HBM 配套):HBM 所需的 base die 通常由 TSMC 的先进逻辑工艺生产(N7 / N5),这意味着 TSMC 的 N5/N3 节点产能也被 HBM「顺便吃掉」。额外发现:HBM4 时代 base die 可能集成更多 I/O 功能(类似于 chiplet 化),这对台积电的 advanced packaging revenue 占比是结构性提升。

注:以上数字为公开财报口径反推估算,非内部数据;不同来源对「committed」的口径定义不一致,实际数字可能在 ±20% 区间浮动。

长期展望:HBM 之后的下一代瓶颈在哪里?

把时间轴拉到 2028-2030 年,HBM 的瓶颈终将缓解——这是任何半导体周期的必然规律。但下一代瓶颈会出现在哪里?值得提前关注的方向有三个:

  1. HBM stack 高度:12 层 / 16 层 TSV 堆叠的热密度已逼近风冷极限,2027 年后可能进入液冷强制时代——这又会反过来推动数据中心冷却架构的全面重构。
  2. 先进制程的 base die 供给:当 HBM4 把 base die 工艺推至 N3 甚至 N2 时,TSMC 的先进逻辑产能会成为新的次级瓶颈——「算力即地缘」的本质,是先进制程的稀缺性。
  3. 光学 I/O(CPO 共封装光学):当 GPU 之间需要通过光互联扩展到 rack-scale / pod-scale 训练时,光模块 / 光引擎会成为新瓶颈。NVIDIA 的 Spectrum-X 系列、AMD 的 Ultra Ethernet 都是这条路径的早期信号。

最后一个未公开验证的猜想:HBM 的「战略物资时代」可能在 2030 年前后结束——届时 HBM4 / HBM5 的产能会显著过剩,存储厂商之间的竞争会回到价格主导。但CoWoS / 先进封装的「瓶颈时代」才刚刚开始——这条更隐秘、更难量化的供应链,可能是 AI 算力下一个十年的真正胜负手。

参考文献

  1. Wikipedia. "High Bandwidth Memory." Retrieved June 2026. https://en.wikipedia.org/wiki/High_Bandwidth_Memory
  2. TrendForce. "HBM Market Reports 2025-2026." https://www.trendforce.com
  3. SK hynix Investor Relations. "Q1 2026 Earnings Call Slides." https://www.skhynix.com
  4. NVIDIA. "B200 / Blackwell Architecture Whitepaper." https://www.nvidia.com
  5. TSMC. "2026 Q1 Earnings Call Transcript." https://www.tsmc.com
  6. Micron Technology. "HBM3E Production Update, 2026." https://investors.micron.com
  7. U.S. Department of Defense. "Microelectronics Commons Phase II Announcement." 2025.
  8. JEDEC. "HBM4 Standard Draft JESD238A." 2025.

一句话摘要:2026 年下半场的 AI 算力竞赛,胜负关键不在模型架构,而在 HBM + CoWoS 这条「看不见的供应链」——它决定了谁的 GPU 能真正跑满、谁的训练能真正规模化。

(导语 slug 候选:HBM 已从显存升级为 AI 时代的战略物资,2026 年下半年 SK hynix / Samsung / Micron 三巨头的产能格局、CoWoS 的隐形瓶颈,以及「算力即地缘」的政治化定价,将共同决定大模型下半场的基础设施排位。)

相关文章

  • 2026 上半年 AI 行业深度复盘:从基础模型竞速到 Agent 产品化的范式转移6月11日
  • AI赋能互联网:技术革新与实践应用的深度研究5月9日

评论

加载评论中…

发表评论

返回文章列表