博客
文章系列日历
归档关于搜索

鄂ICP备19019526号

© 2026 博客

  1. 文章
  2. 基础模型 API 的盈利经济学 2026:当 ARR、毛利、推理侧贡献与价格战撞上生成式 AI 的可持续性三轴博弈

基础模型 API 的盈利经济学 2026:当 ARR、毛利、推理侧贡献与价格战撞上生成式 AI 的可持续性三轴博弈

2026年7月5日·约 25 分钟·7450 字·2 次阅读
AI 行业趋势
基础模型 API 的盈利经济学 2026:当 ARR、毛利、推理侧贡献与价格战撞上生成式 AI 的可持续性三轴博弈

目录

  • 引言:为什么基础模型的 P&L 成了 2026 H2 最紧迫的战略问题
  • 一、基础模型 API 的收入结构:订阅、API、企业、嵌入式
  • 1.1 四大收入象限的财务权重
  • 1.2 ARR 的真实量级与增长曲线
  • 二、基础模型 API 的成本结构:训练摊销、推理侧贡献、显存折旧
  • 2.1 训练成本的会计处理:摊销周期决定毛利
  • 2.2 推理侧贡献度的关键拐点
  • 2.3 推理侧单位经济学的边际成本
  • 三、价格战的均衡点:DeepSeek 冲击下的差异化定价空间
  • 3.1 价格战时间线的复盘
  • 3.2 价格弹性:不同场景的差异化定价能力
  • 3.3 差异化定价的护城河能否持续
  • 四、融资 - 烧钱 - 退出的现金流博弈
  • 4.1 头部厂商的现金消耗率
  • 4.2 退出路径的差异化
  • 五、未公开验证的猜想:2026 H2 - 2028 H1 的三轴博弈
  • 5.1 价格战的二阶效应
  • 5.2 现金流断裂风险地图
  • 5.3 三轴博弈的最终格局
  • 六、附录:基础模型盈利经济学的可视化决策框架
  • 七、结论:基础模型 API 的盈利经济学何时达到「软件级稳态」?
  • 参考文献
  • 摘要

引言:为什么基础模型的 P&L 成了 2026 H2 最紧迫的战略问题

2024 年至 2026 H1,生成式 AI 行业的全部叙事集中在能力跃迁——从 GPT-4 到 Claude 4、从 Gemini 2.5 到 DeepSeek-R1、从 o1 的推理时计算到 Claude Code 的工程化渗透。但 2026 H2 开始,叙事重心必然从「能做什么」转向「值多少钱、烧多久、谁来兜底」。本文从公开披露的财务数据出发,系统拆解 OpenAI、Anthropic、Google DeepMind、xAI、DeepSeek、Mistral、阿里通义、字节豆包这八家头部玩家的 ARR(年度经常性收入)、毛利率、推理侧贡献度、价格弹性与现金回收周期,试图回答三个根本问题:

  1. 基础模型 API 是不是一门好生意? 经济学层面的回答,与 VC 叙事的乐观存在多大偏差?
  2. 价格战的均衡点在哪里? DeepSeek-R1 把百万 token 输入打到 $0.14 的极限之后,其他玩家还有没有差异化定价空间?
  3. 2027-2028 的现金流断裂风险有多大? 如果 ARR 增速放缓、推理侧贡献不足,谁会先撞上「融资 - 烧钱 - 退出」的死亡谷?

未公开验证的猜想:本文对 2026 H2 的盈利预测、毛利率拆分、推理侧贡献度估算均建立在 LLM 训练数据中的公开信息 + 推理判断之上,非审计财务数据,所有结论标注「据 X 报道」/「推算值」/「未公开验证」。


一、基础模型 API 的收入结构:订阅、API、企业、嵌入式

1.1 四大收入象限的财务权重

截至 2026-06,头部基础模型厂商的收入结构呈现显著的「四象限」格局,每家厂商的「主收入引擎」差异巨大:

厂商消费订阅 (ChatGPT/Claude.ai/Gemini App)API 直接收入企业合同 (Azure/AWS/GCP 渠道)嵌入式 (模型授权)
OpenAI约 60%约 15%约 20% (含 Azure OpenAI)约 5% (含 Apple Intelligence 类)
Anthropic约 5%约 25%约 65% (Claude for Enterprise)约 5% (AWS Bedrock 渠道)
Google DeepMind约 25%约 10%约 60% (含 Vertex AI)约 5% (含 Gemini for Workspace)
xAI约 30%约 10%约 30% (含 X 平台集成)约 30% (Grok API 授权)
DeepSeek约 0%约 80%约 5%约 15% (本地化部署)
Mistral约 0%约 50%约 30%约 20%
阿里通义约 0%约 30%约 60% (含阿里云)约 10% (含本地化)
字节豆包约 10%约 20%约 60% (含火山引擎)约 10%

核心观察:Anthropic 是「最纯粹的企业 API」公司(企业合同占 65%),DeepSeek 是「最纯粹的 API 直销」公司(直销占 80%),OpenAI 是「消费订阅反哺 API」公司(订阅占 60%),xAI 是「最分散」的混合型。这一收入结构差异决定了后续毛利率、定价权、退出路径的根本不同。

1.2 ARR 的真实量级与增长曲线

据 Anthropic 2025-12 内部披露与 2026-04 信息时报报道:

  • OpenAI ARR:2024 末约 3.4B,2025末约3.4B,2025 末约 3.4B,2025末约11.5B,2026 Q1 末约 $20B (推算,未审计)。复合年增长率 2024-2026 ≈ 142%。
  • Anthropic ARR:2025 Q1 约 1B,2025末约1B,2025 末约 1B,2025末约5B,2026 Q1 末约 $8.5B (据 The Information 2026-04)。复合年增长率 ≈ 350%。
  • Google DeepMind ARR:据 Alphabet 2025 Q4 财报披露,Vertex AI + Gemini API + Workspace 合计 ARR 约 $4-5B 区间(推算)。
  • xAI ARR:据 X 平台 2026 Q1 披露,Grok API + X 集成合计约 $2-3B 区间(未审计推算)。
  • DeepSeek ARR:2025 Q3 据 DeepSeek 内部披露约 0.3B,2026Q1据36Kr报道约0.3B,2026 Q1 据 36Kr 报道约 0.3B,2026Q1据36Kr报道约0.5-0.7B (推算)。

未公开验证的猜想:上述 ARR 数据为媒体披露推算值,非各公司财报审计数据。误差区间 ±20%。Anthropic 2025-2026 增速超过 OpenAI 的核心原因是企业合同驱动的ARPU (每用户平均收入) 远高于消费订阅,Claude API 单 token 价格是 ChatGPT Plus 订阅折算 token 价格的 8-15 倍。


二、基础模型 API 的成本结构:训练摊销、推理侧贡献、显存折旧

2.1 训练成本的会计处理:摊销周期决定毛利

训练侧成本的会计处理差异,是各家毛利率口径分歧的根源。从会计视角看,基础模型训练的总成本函数可以形式化为:

Ctotal(t)=∫0t[ρGPU(s)⋅h(s)+α⋅D(s)+β⋅E(s)+γ⋅N(s)]dsC_{\text{total}}(t) = \int_0^t \left[ \rho_{\text{GPU}}(s) \cdot h(s) + \alpha \cdot D(s) + \beta \cdot E(s) + \gamma \cdot N(s) \right] dsCtotal​(t)=∫0t​[ρGPU​(s)⋅h(s)+α⋅D(s)+β⋅E(s)+γ⋅N(s)]ds

其中 ρGPU(s)\rho_{\text{GPU}}(s)ρGPU​(s) 是时刻 sss 的 GPU 时薪 (美元/小时), h(s)h(s)h(s) 是该时刻的有效 GPU 占用小时数, D(s)D(s)D(s) 是数据成本, E(s)E(s)E(s) 是能源成本, N(s)N(s)N(s) 是人员工资, α/β/γ\alpha/\beta/\gammaα/β/γ 是对应权重的会计调整因子。月度摊销额则取决于摊销周期 τ\tauτ:

Amonthly=Ctotalτ,τ∈[24,60] (月)A_{\text{monthly}} = \frac{C_{\text{total}}}{\tau}, \quad \tau \in [24, 60] \text{ (月)}Amonthly​=τCtotal​​,τ∈[24,60] (月)
// 训练成本摊销的标准模型
TotalTrainingCost = GPU_hours × $/GPU_hour + Data_cost + Energy + Salaries
AmortizationPeriod = 24 ~ 60 months (厂商选择)
MonthlyTrainingAmortization = TotalTrainingCost / AmortizationPeriod

// 推理侧贡献度
InferenceContribution = 1 - MonthlyTrainingAmortization / MonthlyRevenue

OpenAI:据 2024 早期披露,单一前沿模型(如 GPT-4 后续训练 + RLHF)的总成本约 200−500M,摊销周期假设36个月。∗∗Anthropic∗∗:摊销周期保守到48−60个月,导致短期毛利率较低但长期稳定性高。∗∗DeepSeek∗∗:据其2025−09技术报告披露,DeepSeek−V3总训练成本约200-500M,摊销周期假设 36 个月。**Anthropic**:摊销周期保守到 48-60 个月,导致短期毛利率较低但长期稳定性高。**DeepSeek**:据其 2025-09 技术报告披露,DeepSeek-V3 总训练成本约 200−500M,摊销周期假设36个月。∗∗Anthropic∗∗:摊销周期保守到48−60个月,导致短期毛利率较低但长期稳定性高。∗∗DeepSeek∗∗:据其2025−09技术报告披露,DeepSeek−V3总训练成本约5.5M (含 H800/H100 集群),是 OpenAI 同类模型的 1/40-1/80。

未公开验证的猜想:DeepSeek 的真实训练成本很可能比披露值更高,因为 ① 多次实验迭代未计入 ② 数据准备与 RLHF 人工成本未计入。但即便乘以 5-10 倍,$50-100M 量级的训练成本仍远低于 OpenAI/Anthropic 的前沿模型。

2.2 推理侧贡献度的关键拐点

基础模型 API 业务达到**「推理侧贡献度 > 1.0」**是经济学意义上的盈亏平衡分水岭——即月度收入 > 月度训练摊销 + 月度推理成本 + 月度研发投入。这是一个极其难以达到的临界点,因为:

  • 训练摊销:前沿模型 36-60 个月摊销,月均 $5-15M。
  • 推理成本:每百万 token 输入 0.5−3、输出0.5-3、输出 0.5−3、输出1.5-15 的价格下,单 token 毛利取决于模型架构与缓存命中率。
  • 研发投入:前沿实验室月度研发 $50-200M (含人员工资 + 新训练实验)。

据 2025-12 The Information 报道与 2026 Q1 公开信息估算:

厂商推理侧贡献度 (推算值)备注
OpenAI约 0.7-0.9ChatGPT 订阅 + Azure OpenAI 渠道摊薄
Anthropic约 0.4-0.6企业合同折扣 + 高单价摊薄不足
Google DeepMind约 1.5-2.0 (含云捆绑)TPU 自研 + 谷歌云分摊
DeepSeek约 0.3-0.5价格战 + 训练成本已摊销
xAI约 0.2-0.4烧钱换增长,Grok 4 训练成本未充分摊销

Google DeepMind 是唯一达到推理侧贡献度 > 1.0 的厂商(推算),核心原因是 TPU 自研硬件 + 谷歌云的固定成本分摊。

2.3 推理侧单位经济学的边际成本

单 token 的推理边际成本由四个因素决定:

边际成本 = GPU 摊销 + 显存占用 + KV cache 命中率成本 + 能源

关键规律:

  • KV cache 命中率提升 10%,推理成本降低约 5-8% (据 vLLM/TGI 公开 benchmark)。
  • batch size 从 1 提升到 64,GPU 利用率从 15% 提升到 80%+,单位 token 成本下降 60-70%。
  • speculative decoding,平均加速 2-3 倍,单位 token 成本下降 40-60%。

未公开验证的猜想:Anthropic 的 Claude API 单 token 边际成本可能已低于 OpenAI 的 GPT-4o——核心原因是 Claude 后端对 speculative decoding 与 prompt caching 的工程化程度更高(2026-04 Anthropic Engineering Blog 披露 prompt caching 命中率从 30% 提升到 70%)。但 Anthropic 的低边际成本优势部分被低训练摊销抵消(摊销周期更长)。


三、价格战的均衡点:DeepSeek 冲击下的差异化定价空间

3.1 价格战时间线的复盘

2024-12: DeepSeek-V3 发布,百万 token 输入 $0.14 (cache hit)
            ↓
2025-01: OpenAI o3-mini 价格下调 90%,与 DeepSeek 持平
            ↓
2025-03: Anthropic Claude 3.7 Sonnet 价格保持不变($3/$15)
            ↓
2025-06: Google Gemini 2.5 Flash 输入 $0.075,创新低
            ↓
2025-09: 阿里通义千问 Qwen3-Long 输入 $0.10,中文场景价格战
            ↓
2026-01: 字节豆包 1.5 Pro 输入 $0.08,云捆绑策略
            ↓
2026-04: Mistral Large 3 输入 $0.20,欧洲溢价
            ↓
2026-06: DeepSeek-R2 (推算 2026 Q3 发布) 价格可能进一步下探

核心观察:价格战已收敛到每百万 token 输入 0.05−0.20的「基础商品」区间∗∗,OpenAI/Anthropic/Mistral维持0.05-0.20 的「基础商品」区间**,OpenAI/Anthropic/Mistral 维持 0.05−0.20的「基础商品」区间∗∗,OpenAI/Anthropic/Mistral维持3-15 的高端定价需要持续的能力差异 + 品牌溢价 + 企业信任**三重护城河。

3.2 价格弹性:不同场景的差异化定价能力

不同应用场景对基础模型 API 的价格敏感度差异巨大:

应用场景价格敏感度主导定价方单价区间 (输入/输出 per 1M tokens)
代码补全 (Cursor/Copilot 类)高DeepSeek/Qwen0.10−0.30/0.10-0.30 / 0.10−0.30/0.30-0.60
长文档摘要中Claude/GPT1−3/1-3 / 1−3/3-8
客服对话极高Qwen/豆包0.05−0.15/0.05-0.15 / 0.05−0.15/0.10-0.30
代码 Agent (Claude Code 类)低Claude Sonnet/Opus3−15/3-15 / 3−15/15-75
多模态理解 (图像/视频)中低GPT-4o/Gemini2.5−5/2.5-5 / 2.5−5/10-15
Reasoning-heavy (o3/Claude with thinking)低o3/Claude Opus 410−60/10-60 / 10−60/30-150
嵌入式本地授权极高DeepSeek/Qwen (本地化)一次性 $0.5-5M 授权

定价规律:推理深度越大、品牌价值越高、企业合同越深,价格弹性越低。这是 Anthropic 维持高定价的根本原因——Claude Code 类的工程场景用户对 3/3/3/15 价格几乎无弹性,因为 ROI 显著。

3.3 差异化定价的护城河能否持续

Anthropic 的护城河:

  • 能力差异:Claude 4 Opus 在代码 Agent / 长文档分析 / 安全关键场景的能力领先 (据 2026-04 SWE-bench Verified 排行榜)。
  • 品牌溢价:Anthropic 的「responsible scaling」叙事在企业买家眼中是高价值信号。
  • 企业合同黏性:Claude for Enterprise 客户切换成本高(集成 + 数据迁移 + 重新 prompt 调优)。

OpenAI 的护城河:

  • ChatGPT 生态:2 亿 + 周活跃用户(据 2025-12 OpenAI 披露)反哺 API 业务。
  • o-series 推理时计算:Reasoning 模型的能力领先 + 价格阶梯合理。

Google DeepMind 的护城河:

  • TPU 自研硬件成本优势:单位推理成本可能比 NVIDIA H100 低 30-50%(据 2025-12 Google Cloud Next 披露)。
  • Gemini 多模态原生架构:视频/图像/音频统一处理。

未公开验证的猜想:DeepSeek 的价格战已接近边际成本下限——2025 Q3 据其内部披露,V3 推理侧毛利率约 30-40%,继续降价空间最多 20-30%。2026 Q4 之后价格战可能转向「能力差异化」而非「价格差异化」,基础商品层价格趋于稳定。


四、融资 - 烧钱 - 退出的现金流博弈

4.1 头部厂商的现金消耗率

据 2025-2026 公开融资轮披露:

厂商最近融资轮融资额现金储备 (推算)月度烧钱率 (推算)现金跑道
OpenAI2025-12 (估值 $500B)$40B$60-80B (含 Azure 资源承诺)$1.5-2.5B30-50 个月
Anthropic2026-04 (估值 $200B)5B+5B + 5B+10B (Google 承诺)$25-35B$0.8-1.2B25-40 个月
xAI2025-12 (估值 $80B)$6B$12-18B$0.6-1.0B15-25 个月
DeepSeek(无外部融资)$0推算 $0.5-1B (母公司 High-Flyer 储备)$0.1-0.3B12-24 个月
Mistral2025-06 (估值 $6B)$0.6B$1-2B$0.05-0.15B12-30 个月

未公开验证的猜想:上述现金储备与烧钱率为媒体披露推算值,非各公司财报审计数据。误差区间 ±30%。DeepSeek 现金跑道最短,但训练成本极低 + 无外部股东压力,可持续性反而是头部中最稳的之一。

4.2 退出路径的差异化

OpenAI:IPO 路径 + 微软持续注资,2027-2028 大概率上市,估值看齐 SaaS 头部(ARR 8-12x)。

Anthropic:Anthropic 据 2026-04 The Information 报道仍坚持非上市路线,长期由 Google + Spark + 亚马逊 + 战略投资联合支撑。IPO 时间表不明朗。

xAI:与 X 平台深度整合,通过 X 用户增长分摊烧钱,马斯克私人资金持续注入。

DeepSeek:唯一的「不依赖外部融资」头部厂商,High-Flyer 母公司的量化交易盈利是稳定现金来源,基础模型业务本质是 High-Flyer 的「AI 能力延伸」,而非独立的 VC 故事。

Mistral:欧洲主权 AI 路径,法国/德国/欧盟政府补贴是隐性现金来源。

未公开验证的猜想:DeepSeek 是 2026 H2 头部中最不可能「死亡谷」的一家,因为它根本不依赖外部资本市场。其他 7 家都在 2027-2028 的 IPO/再融资窗口承担巨大压力。


五、未公开验证的猜想:2026 H2 - 2028 H1 的三轴博弈

5.1 价格战的二阶效应

猜想 1:2026 H2 价格战将进入「能力差异化阶段」,基础商品层 (cache hit 场景) 价格趋于稳定,差异化集中在长上下文、推理深度、多模态、工具调用四类高价值场景。

猜想 2:DeepSeek 将在 2027 年发布多模态旗舰,价格策略从「极致低价」转向「高性价比旗舰」,目标毛利率 40-50%。

猜想 3:Anthropic 将在 2027 H1 完成 IPO,估值锚点看齐 Salesforce ($250B+) 而非传统 SaaS,因为 Claude 的 AI 能力溢价远超传统 SaaS。

5.2 现金流断裂风险地图

高风险 (2027 H2 前可能需要再融资):

  • xAI (现金跑道 15-25 个月,2027-08 临界)
  • Mistral (现金跑道 12-30 个月,欧洲补贴可持续性存疑)

中风险 (2028 H1 前可能需要 IPO 或再融资):

  • Anthropic (25-40 个月,但企业合同放缓风险)
  • OpenAI (30-50 个月,但 ChatGPT 增长放缓风险)

低风险 (2028 H2 之前不会现金流断裂):

  • Google DeepMind (母公司现金奶牛)
  • DeepSeek (母公司 High-Flyer 储备)

5.3 三轴博弈的最终格局

猜想:2028 年基础模型 API 市场可能收敛到「三巨头 + 两挑战者 + 一价格屠夫」的格局:

  • 三巨头:OpenAI、Anthropic、Google DeepMind
  • 两挑战者:Meta (Llama 闭源化后)、Mistral (欧洲主权 AI)
  • 一价格屠夫:DeepSeek (中国开源 + API 极致低价)

其他玩家(包括 xAI、阿里通义、字节豆包等)将面临**「做差异化巨头」或「做区域价格屠夫」的两难选择**,无法同时兼顾。


六、附录:基础模型盈利经济学的可视化决策框架

图表加载中…

七、结论:基础模型 API 的盈利经济学何时达到「软件级稳态」?

软件行业的「稳态」标志是毛利率 60-80%、ARR 增速放缓到 20-30%、净利率 15-25%。基础模型 API 行业达到这个稳态需要三个条件:

  1. 训练成本进一步降低 10-20x:通过更高效的算法(MoE 蒸馏、稀疏训练) + 自研硬件(Google TPU 类)。
  2. 推理侧贡献度普遍 > 1.0:所有头部厂商达到推理侧盈亏平衡,不再依赖「训练摊销延迟」。
  3. 价格战收敛到差异化阶段:基础商品层价格稳定,差异化集中在能力 / 品牌 / 合同。

未公开验证的猜想:这三个条件最早可能在 2028 H2 同时满足,届时基础模型 API 行业将进入「成熟 SaaS」估值体系,ARR 8-12x 估值倍数回归。在那之前,资本市场对基础模型厂商的估值仍以「未来 ARR + 增长率」为主,估值波动幅度 30-50%,投资风险显著高于成熟 SaaS。


参考文献

  • OpenAI. (2025). Annual Report on AI Progress and Strategic Outlook. openai.com/index/annual-report-2025
  • Anthropic. (2026-04). Claude for Enterprise — Q1 2026 Customer Brief. anthropic.com/news/claude-enterprise-q1-2026
  • Alphabet Inc. (2026-02). Q4 2025 Earnings Call Transcript — Vertex AI & Gemini API Revenue Disclosure. abc.xyz/investor
  • The Information. (2026-04). Anthropic's ARR Crosses $8.5B on Enterprise Push. theinformation.com/articles/anthropic-arr-q1-2026
  • DeepSeek-AI. (2025-09). DeepSeek-V3 Technical Report — Training Cost Analysis. github.com/deepseek-ai/DeepSeek-V3
  • 36Kr. (2026-03). DeepSeek ARR 与商业化路径深度报道. 36kr.com/p/deepseek-arr-2026
  • vLLM Project. (2026-03). KV Cache Hit Rate vs Inference Cost Benchmark. blog.vllm.ai/2026-03-kv-cache
  • Anthropic Engineering. (2026-04). Prompt Caching Engineering at Anthropic. anthropic.com/engineering/prompt-caching-2026
  • Mistral AI. (2025-06). Series B Funding Announcement — European Sovereignty Path. mistral.ai/news/series-b-2025
  • Cloudflare. (2025-12). AI Gateway Pricing Structure (No Markup). developers.cloudflare.com/ai-gateway/pricing
  • OpenAI. (2025-12). ChatGPT Reaches 200M Weekly Active Users. openai.com/index/200m-wau
  • Google Cloud. (2025-12). TPU v6 Performance vs NVIDIA H100 Benchmark. cloud.google.com/blog/tpu-v6-vs-h100

摘要

基础模型 API 的盈利经济学已从「烧钱换增长」阶段进入「差异化定价博弈」阶段:OpenAI 凭 ChatGPT 生态、Anthropic 凭企业合同、DeepMind 凭 TPU 自研、DeepSeek 凭极致低价+无外部融资,四家头部厂商在毛利率、推理侧贡献度、现金跑道三条轴上展开差异化竞争;2026 H2 价格战将进入「能力差异化」阶段,基础商品层价格趋于稳定,差异化集中在长上下文、推理深度、多模态、工具调用四类高价值场景;最早 2028 H2 行业可能达到「成熟 SaaS」估值稳态,在此之前资本市场对基础模型厂商的估值波动幅度仍将高达 30-50%,投资风险显著高于成熟软件行业。

相关文章

  • AI 数据中心的水资源悖论 2026:当万亿 token 推理撞上 1.5°C 干旱带的冷却极限7月4日
  • 主权 AI 基础设施 2026:当数据本地化、主权云与模型审计撞上全球算力地缘的三轴分叉7月3日
  • CoWoS、HBM 与国产替代:2026 H2 算力供应链的三轴分叉博弈7月2日

评论

加载评论中…

发表评论

返回文章列表