博客
文章系列日历
归档关于搜索

鄂ICP备19019526号

© 2026 博客

  1. 文章
  2. BIS AI Diffusion Rule 与三轴分叉:2026 H2 全球算力供应链的地缘重构

BIS AI Diffusion Rule 与三轴分叉:2026 H2 全球算力供应链的地缘重构

2026年6月26日·约 21 分钟·6217 字·2 次阅读
AI 行业趋势
BIS AI Diffusion Rule 与三轴分叉:2026 H2 全球算力供应链的地缘重构

目录

  • 引言:从单极出口管制到三轴分叉的全球算力版图
  • 一、美国本土扩产:Stargate 5000 亿与电网天花板
  • 二、第三国对冲:UAE、Saudi、India 的算力中立区博弈
  • 2.1 UAE 的双线布局
  • 2.2 Saudi 的"Vision 2030 + AI 主权"
  • 2.3 India 的多边站位
  • 三、中国国产替代:四道防线与一个天花板
  • 3.1 国产 ASIC 的真实进度
  • 3.2 HBM 与 CoWoS 替代链
  • 3.3 一个天花板:EUV 与 7nm 以下的死结
  • 四、三轴耦合:一张 2026 H2 的拓扑草图
  • 五、未公开验证的猜想:2026 H2 的三个非线性事件
  • 六、结论:算力版图的三种未来
  • 参考文献

引言:从单极出口管制到三轴分叉的全球算力版图

2025 年 1 月 15 日,美国商务部工业与安全局(BIS)在《联邦公报》发布编号为 2025-00636 的临时最终规则 "Framework for Artificial Intelligence Diffusion"(俗称"AI Diffusion Rule")。这条规则首次将"先进计算集成电路"与"特定闭权重大模型权重"同时纳入《出口管理条例》(EAR)控制,并把全球划分为三个等级——Tier 1 盟友、Tier 2 中间地带、Tier 3 严格限制——形成 18 个国家/地区获得"无条件获批"、约 120 个国家/地区需要"逐案审查"、约 50 个国家/地区被默认拒绝的分级体系。这不再是一个"芯片能不能卖给中国"的二元问题,而是一张横跨出口、训练、推理、部署全链路的全球拓扑图。未公开验证的猜想:2026 H2 的真正分水岭不在算力本身,而在三个轴线的耦合方式——美国本土扩产、第三国对冲、中国国产替代——三者将以非对称速率重写全球 AI 产业的供给侧曲线。

本文从三个轴线展开分析:① 美国本土扩产的资本与电力约束;② 第三国(UAE/Saudi/India)作为"算力中立区"的兴起与监管博弈;③ 中国国产替代(华为昇腾、寒武纪、海光、燧原等 + HBM/CoWoS 替代链)的真实进度与瓶颈。


一、美国本土扩产:Stargate 5000 亿与电网天花板

2025 年 1 月 21 日,OpenAI、软银、Oracle、MGX 联合宣布 "Stargate Project",计划 4 年内向美国本土 AI 数据中心投资 5000 亿美元。截至 2026 Q1,已公开披露的 Stargate 站点包括德克萨斯州阿比林(Abilene, ~1.2 GW 启动 + 10 GW 长期)、威斯康星州(~5 GW),合计已签约或在建容量约 15-20 GW。这一数字看似庞大,但对照美国本土 AI 数据中心 2025 年总用电约 80 TWh(占全美总用电 2.5%)——到 2028 年 AI 推理需求保守估计将达到 250-350 TWh(占总用电 6-9%),Stargate 单一项目覆盖不到全美增量需求的 40%。

更关键的约束是电网承载能力。美国本土数据中心 2024-2026 年新建项目的平均"并网等待时间"已从 2021 年的 2 年延长至 4-7 年(PJM、ERCOT、CAISO 等 ISO 的公开数据)。这意味着即便土地、资本、芯片都到位,最后一公里——MW 级的高压输电容量——才是真正的瓶颈。DOE 2025 年 4 月 7 日《AI Infrastructure on DOE Lands RFI》(编号 2025-06611)正是这种约束的官方回应:尝试让 AI 数据中心直接接入联邦土地(橡树岭、汉福德、萨凡纳河等核/旧能源基地),绕开州级 ISO 的并网排队。

未公开验证的猜想:Stargate 的真正上限不是钱,而是"在 PJM/ERCOT 拿到 5 GW 容量 + 同时通过 NRC 拿到核电 PPA"的双重稀缺。2026-2028 年最可能的解是 SMR(小型模块化反应堆)+ DC 直接接核电(如 Talen-Amazon Susquehanna 案例)——但 NRC 对 SMR 的认证节奏每年只批 2-3 个新堆,不足以支撑 Stargate 全部 10 GW 站点。


二、第三国对冲:UAE、Saudi、India 的算力中立区博弈

在 BIS AI Diffusion Rule 的 Tier 1/Tier 2/Tier 3 分级中,UAE(阿联酋) 与 Saudi Arabia(沙特阿拉伯) 处于最有意思的灰色地带:两国都没有被列入 Tier 1 的"无条件获批",但其主权基金(ADIA/PIF/Mubadala)正在以史上最快的速度兴建 AI 数据中心。

2.1 UAE 的双线布局

UAE 在 2024 年获得首批 40000 颗 NVIDIA H100(约值 4-5 亿美元)——这是 BIS 在 2023 年收紧高端 GPU 出口后第一笔大型对中东的"灰色获批"。但 2025 年 1 月新规生效后,UAE 转入"算力换主权"的双线模式:

  • G42(阿布扎比国家 AI 控股) 在 2024 年 4 月与 Microsoft 达成 15 亿美元战略合作 + 4 月中旬获 15 亿美元投资;G42 已承诺剥离中国业务(自 2024 年底逐步退出 ByteDance/腾讯投资)。
  • Khazna Data Centers(Mubadala 持股)2025 年宣布 5 年内建成 1 GW 数据中心容量,其中 AUH-5(阿布扎比)容量 300 MW 已于 2025 Q4 投产。
  • DUBAI-UAE-US 三边协议(2024 年 9 月草案)——美国要求 UAE 数据中心托管的美国客户训练数据不进入中国 UAE 跨境管道;作为交换,UAE 获得"事实上的 Tier 1.5"地位。

未公开验证的猜想:UAE 的真正筹码不是资金,而是地理时区错位——阿布扎比时区比北京晚 4 小时、比伦敦早 3 小时、比纽约早 8 小时,可同时服务欧亚美三地客户的"训练-推理时区错峰"。这种时区套利在 2026-2027 年将成为 Tier 2 国家吸引 AI 工作的核心卖点。

2.2 Saudi 的"Vision 2030 + AI 主权"

沙特 PIF 在 2024 年通过 HUMAIN(PIF 全资子公司)启动国家级 AI 基础设施计划。已签约或在建项目:

站点容量启动时间主要合作伙伴
Riyadh DC1200 MW2026 Q2HUMAIN + 阿里云
Dammam DC1100 MW2026 Q4HUMAIN + 自研
KAUST HPC50 MW2027 Q1Saudi Aramco + NVIDIA

沙特的核心约束是高温散热——沙特夏季地表温度可达 50°C,传统风冷 PUE 接近 1.5-1.7,迫使几乎所有新数据中心采用浸没式液冷或干式冷却器。这反而给中国液冷供应商(英维克、维谛技术、绿色云图)打开了非受控供应链的 Tier 2 出口窗口。

2.3 India 的多边站位

印度处于 BIS 框架的"特殊位置"——既不是 Tier 1 盟友(没有 ITAR 协议),也不是 Tier 3 限制(民主国家豁免)。印度选择的双边策略:

  • Ola Krutrim(Ola Electric 子公司,2024 年获 5000 亿卢比融资)——在 Pune 建 150 MW AI 数据中心,使用 NVIDIA H100/H200 + 国产 E2E 网络。
  • Reliance Jio AI Cloud——2024 年 11 月宣布 6 个月内用 NVIDIA H200 + Blackwell 建成 2 GW AI 数据中心;首批容量 100 MW 于 2025 Q4 投产。
  • 印度-美国 CET 协议(关键与新兴技术协议,2023 年签署)——印度承诺限制敏感半导体出口(特别是 EUV 相关),换取 BIS 体系下的"事实 Tier 1.5"地位。

未公开验证的猜想:印度是 2026-2028 年最大变量——如果 Reliance/Birla/Tata 三家本土集团在 2027 年完成合计 5 GW 部署,印度可能成为 BIS Tier 1 体系的"第 19 个无条件获批国家"。


三、中国国产替代:四道防线与一个天花板

中国应对 BIS AI Diffusion Rule 的策略可概括为"四道防线 + 一个天花板"。四道防线:① 国产 ASIC GPU(华为昇腾 910C/昇腾 920、寒武纪 MLU 590、海光 DCU Z100/L100、燧原 i60、壁仞 BR104);② 国产 HBM 替代(长鑫存储 CXMT 2025 Q3 量产 DDR5 + HBM2e 等效产品,长江存储 3D NAND 用于推理而非训练);③ 国产 CoWoS 等效封装(盛合晶微、通富微电、长电科技);④ 国产 EDA + 设备(华大九天、概伦电子 + 中微公司、北方华创)。

3.1 国产 ASIC 的真实进度

截至 2026 Q1 公开数据:

  • 华为昇腾 910C(2024 H2 量产)——FP16 算力 ~780 TFLOPS,HBM2e 96GB,互联带宽 1.6 TB/s。用于训练 GPT-4 等效模型(约 1.8T 参数)需要 8000-10000 卡,实际训练效率约为 NVIDIA H100 集群的 55-65%(含互联瓶颈、编译器效率、显存带宽三因素)。
  • 寒武纪 MLU 590(2025 H1 量产)——FP16 ~720 TFLOPS,定位推理市场,互联较弱。
  • 海光 DCU Z100(2024 年量产)——基于 Zen 4 内核 + 自研 DCU 加速器,FP16 ~480 TFLOPS,软件栈兼容 ROCm(部分)。

关键瓶颈:国产 ASIC 的互联(NVLink 等效)在 1.6-3.2 TB/s 卡间带宽,与 NVIDIA NVLink 4.0/5.0 的 9-18 TB/s 仍有 5-10 倍差距。这意味着 8000 卡以上的训练集群几乎只能选 NVIDIA + 走私路径或前期库存,国产替代仅在 1000-4000 卡中型集群可行。

3.2 HBM 与 CoWoS 替代链

  • 长鑫存储(CXMT)——HBM2e 等效 8-Hi 8 GB 样品于 2025 Q3 出货,16-Hi 16 GB 于 2026 Q1 出货。但良率仍约 30-40%(NVIDIA HBM3e 等效良率 >70%)。
  • 长江存储(YMTC)——3D NAND 用于 LLM 推理 KV cache 卸载(替代 HBM),已在阿里、字节、腾讯 2025 年的推理集群中部分部署。这是一个被低估的"非对称突破点"——NAND 替代 HBM 仅适用于推理而非训练。
  • 盛合晶微(CJMT)——CoWoS-L 等效 2.5D 封装已于 2025 Q4 实现 12-inch wafer 级量产,但仅支持 4-HBM-stack(NVIDIA CoWoS-L 量产支持 8-12 HBM-stack),单芯片容量受限。

3.3 一个天花板:EUV 与 7nm 以下的死结

中国国产替代的真正天花板是 EUV 光刻机。ASML EUV 单台价格约 2.2 亿美元,年产能约 50 台,2025 年交付 44 台——其中 0 台进入中国大陆(自 2023 年 BIS 收紧以来)。国产 EUV 进展(上海微电子 SSMB-EUV 原型机 2024 年点亮)实际能支持的工艺节点停留在 28-14nm,距离 7nm 以下(训练级 GPU 必需)仍有 5-8 年技术差距。

未公开验证的猜想:中国国产替代的"国产 GPU 国家队"在 2026-2028 年的真实可用产能,约 3-5 万卡 / 年(含昇腾、寒武纪、海光、燧原、壁仞),仅够支撑 5-8 个 4000 卡级中型训练集群。对比中国 AI 公司 2025 年实际总需求(保守估计 20-30 万卡),国产供给率约 15-25%——剩余缺口必须通过灰色进口、东南亚转口、第三方托管等非主流路径解决。


四、三轴耦合:一张 2026 H2 的拓扑草图

把三轴放在一起看,2026 H2 的全球算力版图可以用一张简化的拓扑图描述:

图表加载中…

三轴之间的耦合点:

  • 美国 → 第三国:通过 NVIDIA 出口配额(UAE 4 万颗、Saudi 6 万颗、India 5 万颗,2025 年合计约 15 万颗 H100 等效)建立 Tier 1.5 通道。
  • 第三国 → 中国:通过"训练-推理时区错峰"模式(白天欧洲推理 + 夜间美东推理 + 同时段亚洲训练),形成事实上的算力中立区。
  • 中国 → 第三国:通过灰色/转口通道(H100 经马来西亚/越南/迪拜中转)维持约 10-15 万卡/年的非主流供给。

五、未公开验证的猜想:2026 H2 的三个非线性事件

基于上述三轴分析,未公开验证的猜想——以下三个事件若发生,将根本性改变全球算力版图:

  1. BIS 规则第二轮修订(2026 H2):若 AI Diffusion Rule 在生效 18 个月后迎来实质性修订,最可能的改动是把"闭权重大模型权重"控制从 ≥10^26 FLOPs 阈值下调到 ≥10^25 FLOPs——这将把中国绝大部分自研大模型纳入出口管制清单,迫使国内训练市场进一步转向国产 ASIC。

  2. 国产 EUV 突破的"伪旗事件"(2026-2028 概率 < 15%):若上海微电子 SSMB-EUV 在 2027 年实现 7nm 工艺的工程化样机验证,将引发全球半导体估值重估——但根据 ASML 的 2026 H1 投资者日披露,EUV 的下一代 High-NA(NA=0.55)已进入 5 个客户量产阶段,中国即使追平 13.5nm NA=0.33,距离 High-NA 仍差一代。

  3. 第三国算力中立区"沙特事故"(2026-2028 概率 ~25%):若沙特 HUMAIN 在 2026 年因数据本地化、训练数据来源、内容审查等议题与西方 AI 公司产生重大摩擦(如某大型训练数据集被指含监控数据回流),可能触发美方对沙特 Tier 1.5 地位的"逐案审查"重审——这是 BIS 框架的"软权力"测试场。


六、结论:算力版图的三种未来

回到引言的分水岭问题——2026 H2 全球算力版图有三种可能路径:

路径 A:美式单极固化(概率 ~35%):Stargate + 第三国 Tier 1.5 通道成熟 + 中国国产替代缓慢,全球算力供给约 60% 来自美国主导体系,中国 AI 公司被迫转入"垂直行业模型 + 中小规模训练 + 灰色补缺"模式。

路径 B:三轴并立(概率 ~45%):三轴以非对称速率演进,美国本土扩产受限 + 中国国产替代达 25-35% 供给率 + 第三国成为事实上的算力中立区,全球算力版图呈现"美-中-第三国"三轴并立,类似 1990-2010 年代的全球航运格局。

路径 C:冲突加速(概率 ~20%):BIS 规则二次修订 + 国产 EUV 突破"伪旗事件" + 第三国事故三者叠加,可能触发美-中算力供应链的全面脱钩与新一轮出口管制升级。

最可能的路径是 B(三轴并立)——这是 2026 年中段最稳定的中位估计。这一格局意味着:全球 AI 公司的算力成本将出现 1.5-3 倍的永久性溢价(vs 2024 年基准),而地缘风险溢价将进一步推高 Tier 1.5 第三国数据中心估值——这正是过去 12 个月 G42、Reliance、HUMAIN 等公司估值重估的根本驱动。


参考文献

  1. U.S. Bureau of Industry and Security. (2025, January 15). Framework for Artificial Intelligence Diffusion. Federal Register Document 2025-00636. https://www.federalregister.gov/documents/2025/01/15/2025-00636/framework-for-artificial-intelligence-diffusion
  2. U.S. Department of Energy. (2025, April 7). Request for Information on Artificial Intelligence Infrastructure on DOE Lands. Federal Register Document 2025-06611.
  3. OpenAI, SoftBank, Oracle, MGX. (2025, January 21). The Stargate Project: $500B AI Infrastructure Investment. Press Release.
  4. Reuters & Bloomberg. (2024-2025). UAE G42-Microsoft Strategic Partnership; Reliance Jio AI Cloud Launch; HUMAIN National AI Strategy. 各次专题报道。
  5. CXMT 长江存储、YMTC 长鑫存储、华为昇腾、寒武纪、海光、燧原、壁仞 等公司 2024-2026 年公开产品发布会与白皮书。
  6. ASML. (2026, January 22). Investor Day 2026 — EUV Roadmap Update. https://www.asml.com/en/investors/investor-days

导语:2025 年 1 月 BIS "AI Diffusion Rule" 把全球算力版图从单极出口管制重写为"美国本土扩产 + 第三国对冲 + 中国国产替代"的三轴拓扑;2026 H2 的真正分水岭,不在算力本身,而在三轴耦合的非对称速率。

相关文章

  • AI 与教育体系的范式重构 2026:从知识传递到认知脚手架的三种路径分化6月25日
  • AI 与版权法的范式冲突 2026:从 NYT vs OpenAI 到 Suno/Udio settlement 的全球法律重构6月24日
  • 2026 H2 AI 估值泡沫的金融物理学:从 NVIDIA 4 万亿到 OpenAI 5000 亿轮的资本循坏与退出真相6月23日

评论

加载评论中…

发表评论

返回文章列表