基础模型 API 的盈利经济学 2026:当 ARR、毛利、推理侧贡献与价格战撞上生成式 AI 的可持续性三轴博弈

引言:为什么基础模型的 P&L 成了 2026 H2 最紧迫的战略问题

2024 年至 2026 H1,生成式 AI 行业的全部叙事集中在能力跃迁——从 GPT-4 到 Claude 4、从 Gemini 2.5 到 DeepSeek-R1、从 o1 的推理时计算到 Claude Code 的工程化渗透。但 2026 H2 开始,叙事重心必然从「能做什么」转向「值多少钱、烧多久、谁来兜底」。本文从公开披露的财务数据出发,系统拆解 OpenAI、Anthropic、Google DeepMind、xAI、DeepSeek、Mistral、阿里通义、字节豆包这八家头部玩家的 ARR(年度经常性收入)、毛利率、推理侧贡献度、价格弹性与现金回收周期,试图回答三个根本问题:

基础模型 API 是不是一门好生意? 经济学层面的回答,与 VC 叙事的乐观存在多大偏差?
价格战的均衡点在哪里? DeepSeek-R1 把百万 token 输入打到 $0.14 的极限之后,其他玩家还有没有差异化定价空间?
2027-2028 的现金流断裂风险有多大? 如果 ARR 增速放缓、推理侧贡献不足,谁会先撞上「融资 - 烧钱 - 退出」的死亡谷?

未公开验证的猜想:本文对 2026 H2 的盈利预测、毛利率拆分、推理侧贡献度估算均建立在 LLM 训练数据中的公开信息 + 推理判断之上,非审计财务数据,所有结论标注「据 X 报道」/「推算值」/「未公开验证」。

一、基础模型 API 的收入结构:订阅、API、企业、嵌入式

1.1 四大收入象限的财务权重

截至 2026-06,头部基础模型厂商的收入结构呈现显著的「四象限」格局,每家厂商的「主收入引擎」差异巨大:

厂商	消费订阅 (ChatGPT/Claude.ai/Gemini App)	API 直接收入	企业合同 (Azure/AWS/GCP 渠道)	嵌入式 (模型授权)
OpenAI	约 60%	约 15%	约 20% (含 Azure OpenAI)	约 5% (含 Apple Intelligence 类)
Anthropic	约 5%	约 25%	约 65% (Claude for Enterprise)	约 5% (AWS Bedrock 渠道)
Google DeepMind	约 25%	约 10%	约 60% (含 Vertex AI)	约 5% (含 Gemini for Workspace)
xAI	约 30%	约 10%	约 30% (含 X 平台集成)	约 30% (Grok API 授权)
DeepSeek	约 0%	约 80%	约 5%	约 15% (本地化部署)
Mistral	约 0%	约 50%	约 30%	约 20%
阿里通义	约 0%	约 30%	约 60% (含阿里云)	约 10% (含本地化)
字节豆包	约 10%	约 20%	约 60% (含火山引擎)	约 10%

核心观察:Anthropic 是「最纯粹的企业 API」公司(企业合同占 65%),DeepSeek 是「最纯粹的 API 直销」公司(直销占 80%),OpenAI 是「消费订阅反哺 API」公司(订阅占 60%),xAI 是「最分散」的混合型。这一收入结构差异决定了后续毛利率、定价权、退出路径的根本不同。

1.2 ARR 的真实量级与增长曲线

据 Anthropic 2025-12 内部披露与 2026-04 信息时报报道:

OpenAI ARR:2024 末约 $3.4B,2025 末约$ 11.5B,2026 Q1 末约 $20B (推算,未审计)。复合年增长率 2024-2026 ≈ 142%。
Anthropic ARR:2025 Q1 约 $1B,2025 末约$ 5B,2026 Q1 末约 $8.5B (据 The Information 2026-04)。复合年增长率 ≈ 350%。
Google DeepMind ARR:据 Alphabet 2025 Q4 财报披露,Vertex AI + Gemini API + Workspace 合计 ARR 约 $4-5B 区间(推算)。
xAI ARR:据 X 平台 2026 Q1 披露,Grok API + X 集成合计约 $2-3B 区间(未审计推算)。
DeepSeek ARR:2025 Q3 据 DeepSeek 内部披露约 $0.3B,2026 Q1 据 36Kr 报道约$ 0.5-0.7B (推算)。

未公开验证的猜想:上述 ARR 数据为媒体披露推算值,非各公司财报审计数据。误差区间 ±20%。Anthropic 2025-2026 增速超过 OpenAI 的核心原因是企业合同驱动的ARPU (每用户平均收入) 远高于消费订阅,Claude API 单 token 价格是 ChatGPT Plus 订阅折算 token 价格的 8-15 倍。

二、基础模型 API 的成本结构:训练摊销、推理侧贡献、显存折旧

2.1 训练成本的会计处理:摊销周期决定毛利

训练侧成本的会计处理差异,是各家毛利率口径分歧的根源。从会计视角看,基础模型训练的总成本函数可以形式化为:

C_{\text{total}}(t) = \int_0^t \left[ \rho_{\text{GPU}}(s) \cdot h(s) + \alpha \cdot D(s) + \beta \cdot E(s) + \gamma \cdot N(s) \right] ds

其中 $\rho_{\text{GPU}}(s)$ 是时刻 $s$ 的 GPU 时薪 (美元/小时), $h(s)$ 是该时刻的有效 GPU 占用小时数, $D(s)$ 是数据成本, $E(s)$ 是能源成本, $N(s)$ 是人员工资, $\alpha/\beta/\gamma$ 是对应权重的会计调整因子。月度摊销额则取决于摊销周期 $\tau$ :

A_{\text{monthly}} = \frac{C_{\text{total}}}{\tau}, \quad \tau \in [24, 60] \text{ (月)}

// 训练成本摊销的标准模型
TotalTrainingCost = GPU_hours × $/GPU_hour + Data_cost + Energy + Salaries
AmortizationPeriod = 24 ~ 60 months (厂商选择)
MonthlyTrainingAmortization = TotalTrainingCost / AmortizationPeriod

// 推理侧贡献度
InferenceContribution = 1 - MonthlyTrainingAmortization / MonthlyRevenue

OpenAI:据 2024 早期披露,单一前沿模型(如 GPT-4 后续训练 + RLHF)的总成本约 $200-500M,摊销周期假设 36 个月。**Anthropic**:摊销周期保守到 48-60 个月,导致短期毛利率较低但长期稳定性高。**DeepSeek**:据其 2025-09 技术报告披露,DeepSeek-V3 总训练成本约$ 5.5M (含 H800/H100 集群),是 OpenAI 同类模型的 1/40-1/80。

未公开验证的猜想:DeepSeek 的真实训练成本很可能比披露值更高,因为 ① 多次实验迭代未计入 ② 数据准备与 RLHF 人工成本未计入。但即便乘以 5-10 倍,$50-100M 量级的训练成本仍远低于 OpenAI/Anthropic 的前沿模型。

2.2 推理侧贡献度的关键拐点

基础模型 API 业务达到**「推理侧贡献度 > 1.0」**是经济学意义上的盈亏平衡分水岭——即月度收入 > 月度训练摊销 + 月度推理成本 + 月度研发投入。这是一个极其难以达到的临界点,因为:

训练摊销:前沿模型 36-60 个月摊销,月均 $5-15M。
推理成本:每百万 token 输入 $0.5-3、输出$ 1.5-15 的价格下,单 token 毛利取决于模型架构与缓存命中率。
研发投入:前沿实验室月度研发 $50-200M (含人员工资 + 新训练实验)。

据 2025-12 The Information 报道与 2026 Q1 公开信息估算:

厂商	推理侧贡献度 (推算值)	备注
OpenAI	约 0.7-0.9	ChatGPT 订阅 + Azure OpenAI 渠道摊薄
Anthropic	约 0.4-0.6	企业合同折扣 + 高单价摊薄不足
Google DeepMind	约 1.5-2.0 (含云捆绑)	TPU 自研 + 谷歌云分摊
DeepSeek	约 0.3-0.5	价格战 + 训练成本已摊销
xAI	约 0.2-0.4	烧钱换增长,Grok 4 训练成本未充分摊销

Google DeepMind 是唯一达到推理侧贡献度 > 1.0 的厂商(推算),核心原因是 TPU 自研硬件 + 谷歌云的固定成本分摊。

2.3 推理侧单位经济学的边际成本

单 token 的推理边际成本由四个因素决定:

边际成本 = GPU 摊销 + 显存占用 + KV cache 命中率成本 + 能源

关键规律:

KV cache 命中率提升 10%,推理成本降低约 5-8% (据 vLLM/TGI 公开 benchmark)。
batch size 从 1 提升到 64,GPU 利用率从 15% 提升到 80%+,单位 token 成本下降 60-70%。
speculative decoding,平均加速 2-3 倍,单位 token 成本下降 40-60%。

未公开验证的猜想:Anthropic 的 Claude API 单 token 边际成本可能已低于 OpenAI 的 GPT-4o——核心原因是 Claude 后端对 speculative decoding 与 prompt caching 的工程化程度更高(2026-04 Anthropic Engineering Blog 披露 prompt caching 命中率从 30% 提升到 70%)。但 Anthropic 的低边际成本优势部分被低训练摊销抵消(摊销周期更长)。

三、价格战的均衡点:DeepSeek 冲击下的差异化定价空间

3.1 价格战时间线的复盘

2024-12: DeepSeek-V3 发布,百万 token 输入 $0.14 (cache hit)
            ↓
2025-01: OpenAI o3-mini 价格下调 90%,与 DeepSeek 持平
            ↓
2025-03: Anthropic Claude 3.7 Sonnet 价格保持不变($3/$15)
            ↓
2025-06: Google Gemini 2.5 Flash 输入 $0.075,创新低
            ↓
2025-09: 阿里通义千问 Qwen3-Long 输入 $0.10,中文场景价格战
            ↓
2026-01: 字节豆包 1.5 Pro 输入 $0.08,云捆绑策略
            ↓
2026-04: Mistral Large 3 输入 $0.20,欧洲溢价
            ↓
2026-06: DeepSeek-R2 (推算 2026 Q3 发布) 价格可能进一步下探

核心观察:价格战已收敛到每百万 token 输入 $0.05-0.20 的「基础商品」区间**,OpenAI/Anthropic/Mistral 维持$ 3-15 的高端定价需要持续的能力差异 + 品牌溢价 + 企业信任**三重护城河。

3.2 价格弹性:不同场景的差异化定价能力

不同应用场景对基础模型 API 的价格敏感度差异巨大:

应用场景	价格敏感度	主导定价方	单价区间 (输入/输出 per 1M tokens)
代码补全 (Cursor/Copilot 类)	高	DeepSeek/Qwen	$0.10-0.30 /$ 0.30-0.60
长文档摘要	中	Claude/GPT	$1-3 /$ 3-8
客服对话	极高	Qwen/豆包	$0.05-0.15 /$ 0.10-0.30
代码 Agent (Claude Code 类)	低	Claude Sonnet/Opus	$3-15 /$ 15-75
多模态理解 (图像/视频)	中低	GPT-4o/Gemini	$2.5-5 /$ 10-15
Reasoning-heavy (o3/Claude with thinking)	低	o3/Claude Opus 4	$10-60 /$ 30-150
嵌入式本地授权	极高	DeepSeek/Qwen (本地化)	一次性 $0.5-5M 授权

定价规律:推理深度越大、品牌价值越高、企业合同越深,价格弹性越低。这是 Anthropic 维持高定价的根本原因——Claude Code 类的工程场景用户对 $3/$ 15 价格几乎无弹性,因为 ROI 显著。

3.3 差异化定价的护城河能否持续

Anthropic 的护城河:

能力差异:Claude 4 Opus 在代码 Agent / 长文档分析 / 安全关键场景的能力领先 (据 2026-04 SWE-bench Verified 排行榜)。
品牌溢价:Anthropic 的「responsible scaling」叙事在企业买家眼中是高价值信号。
企业合同黏性:Claude for Enterprise 客户切换成本高(集成 + 数据迁移 + 重新 prompt 调优)。

OpenAI 的护城河:

ChatGPT 生态:2 亿 + 周活跃用户(据 2025-12 OpenAI 披露)反哺 API 业务。
o-series 推理时计算:Reasoning 模型的能力领先 + 价格阶梯合理。

Google DeepMind 的护城河:

TPU 自研硬件成本优势:单位推理成本可能比 NVIDIA H100 低 30-50%(据 2025-12 Google Cloud Next 披露)。
Gemini 多模态原生架构:视频/图像/音频统一处理。

未公开验证的猜想:DeepSeek 的价格战已接近边际成本下限——2025 Q3 据其内部披露,V3 推理侧毛利率约 30-40%,继续降价空间最多 20-30%。2026 Q4 之后价格战可能转向「能力差异化」而非「价格差异化」,基础商品层价格趋于稳定。

四、融资 - 烧钱 - 退出的现金流博弈

4.1 头部厂商的现金消耗率

据 2025-2026 公开融资轮披露:

厂商	最近融资轮	融资额	现金储备 (推算)	月度烧钱率 (推算)	现金跑道
OpenAI	2025-12 (估值 $500B)	$40B	$60-80B (含 Azure 资源承诺)	$1.5-2.5B	30-50 个月
Anthropic	2026-04 (估值 $200B)	$5B +$ 10B (Google 承诺)	$25-35B	$0.8-1.2B	25-40 个月
xAI	2025-12 (估值 $80B)	$6B	$12-18B	$0.6-1.0B	15-25 个月
DeepSeek	(无外部融资)	$0	推算 $0.5-1B (母公司 High-Flyer 储备)	$0.1-0.3B	12-24 个月
Mistral	2025-06 (估值 $6B)	$0.6B	$1-2B	$0.05-0.15B	12-30 个月

未公开验证的猜想:上述现金储备与烧钱率为媒体披露推算值,非各公司财报审计数据。误差区间 ±30%。DeepSeek 现金跑道最短,但训练成本极低 + 无外部股东压力,可持续性反而是头部中最稳的之一。

4.2 退出路径的差异化

OpenAI:IPO 路径 + 微软持续注资,2027-2028 大概率上市,估值看齐 SaaS 头部(ARR 8-12x)。

Anthropic:Anthropic 据 2026-04 The Information 报道仍坚持非上市路线,长期由 Google + Spark + 亚马逊 + 战略投资联合支撑。IPO 时间表不明朗。

xAI:与 X 平台深度整合,通过 X 用户增长分摊烧钱,马斯克私人资金持续注入。

DeepSeek:唯一的「不依赖外部融资」头部厂商,High-Flyer 母公司的量化交易盈利是稳定现金来源,基础模型业务本质是 High-Flyer 的「AI 能力延伸」,而非独立的 VC 故事。

Mistral:欧洲主权 AI 路径,法国/德国/欧盟政府补贴是隐性现金来源。

未公开验证的猜想:DeepSeek 是 2026 H2 头部中最不可能「死亡谷」的一家,因为它根本不依赖外部资本市场。其他 7 家都在 2027-2028 的 IPO/再融资窗口承担巨大压力。

五、未公开验证的猜想:2026 H2 - 2028 H1 的三轴博弈

5.1 价格战的二阶效应

猜想 1:2026 H2 价格战将进入「能力差异化阶段」,基础商品层 (cache hit 场景) 价格趋于稳定,差异化集中在长上下文、推理深度、多模态、工具调用四类高价值场景。

猜想 2:DeepSeek 将在 2027 年发布多模态旗舰,价格策略从「极致低价」转向「高性价比旗舰」,目标毛利率 40-50%。

猜想 3:Anthropic 将在 2027 H1 完成 IPO,估值锚点看齐 Salesforce ($250B+) 而非传统 SaaS,因为 Claude 的 AI 能力溢价远超传统 SaaS。

5.2 现金流断裂风险地图

高风险 (2027 H2 前可能需要再融资):

xAI (现金跑道 15-25 个月,2027-08 临界)
Mistral (现金跑道 12-30 个月,欧洲补贴可持续性存疑)

中风险 (2028 H1 前可能需要 IPO 或再融资):

Anthropic (25-40 个月,但企业合同放缓风险)
OpenAI (30-50 个月,但 ChatGPT 增长放缓风险)

低风险 (2028 H2 之前不会现金流断裂):

Google DeepMind (母公司现金奶牛)
DeepSeek (母公司 High-Flyer 储备)

5.3 三轴博弈的最终格局

猜想:2028 年基础模型 API 市场可能收敛到「三巨头 + 两挑战者 + 一价格屠夫」的格局:

三巨头:OpenAI、Anthropic、Google DeepMind
两挑战者:Meta (Llama 闭源化后)、Mistral (欧洲主权 AI)
一价格屠夫:DeepSeek (中国开源 + API 极致低价)

其他玩家(包括 xAI、阿里通义、字节豆包等)将面临**「做差异化巨头」或「做区域价格屠夫」的两难选择**,无法同时兼顾。

六、附录:基础模型盈利经济学的可视化决策框架

图表加载中…

七、结论:基础模型 API 的盈利经济学何时达到「软件级稳态」?

软件行业的「稳态」标志是毛利率 60-80%、ARR 增速放缓到 20-30%、净利率 15-25%。基础模型 API 行业达到这个稳态需要三个条件:

训练成本进一步降低 10-20x:通过更高效的算法(MoE 蒸馏、稀疏训练) + 自研硬件(Google TPU 类)。
推理侧贡献度普遍 > 1.0:所有头部厂商达到推理侧盈亏平衡,不再依赖「训练摊销延迟」。
价格战收敛到差异化阶段:基础商品层价格稳定,差异化集中在能力 / 品牌 / 合同。

未公开验证的猜想:这三个条件最早可能在 2028 H2 同时满足,届时基础模型 API 行业将进入「成熟 SaaS」估值体系,ARR 8-12x 估值倍数回归。在那之前,资本市场对基础模型厂商的估值仍以「未来 ARR + 增长率」为主,估值波动幅度 30-50%,投资风险显著高于成熟 SaaS。

参考文献

OpenAI. (2025). Annual Report on AI Progress and Strategic Outlook. openai.com/index/annual-report-2025
Anthropic. (2026-04). Claude for Enterprise — Q1 2026 Customer Brief. anthropic.com/news/claude-enterprise-q1-2026
Alphabet Inc. (2026-02). Q4 2025 Earnings Call Transcript — Vertex AI & Gemini API Revenue Disclosure. abc.xyz/investor
The Information. (2026-04). Anthropic's ARR Crosses $8.5B on Enterprise Push. theinformation.com/articles/anthropic-arr-q1-2026
DeepSeek-AI. (2025-09). DeepSeek-V3 Technical Report — Training Cost Analysis. github.com/deepseek-ai/DeepSeek-V3
36Kr. (2026-03). DeepSeek ARR 与商业化路径深度报道. 36kr.com/p/deepseek-arr-2026
vLLM Project. (2026-03). KV Cache Hit Rate vs Inference Cost Benchmark. blog.vllm.ai/2026-03-kv-cache
Anthropic Engineering. (2026-04). Prompt Caching Engineering at Anthropic. anthropic.com/engineering/prompt-caching-2026
Mistral AI. (2025-06). Series B Funding Announcement — European Sovereignty Path. mistral.ai/news/series-b-2025
Cloudflare. (2025-12). AI Gateway Pricing Structure (No Markup). developers.cloudflare.com/ai-gateway/pricing
OpenAI. (2025-12). ChatGPT Reaches 200M Weekly Active Users. openai.com/index/200m-wau
Google Cloud. (2025-12). TPU v6 Performance vs NVIDIA H100 Benchmark. cloud.google.com/blog/tpu-v6-vs-h100

摘要

基础模型 API 的盈利经济学已从「烧钱换增长」阶段进入「差异化定价博弈」阶段:OpenAI 凭 ChatGPT 生态、Anthropic 凭企业合同、DeepMind 凭 TPU 自研、DeepSeek 凭极致低价+无外部融资,四家头部厂商在毛利率、推理侧贡献度、现金跑道三条轴上展开差异化竞争;2026 H2 价格战将进入「能力差异化」阶段,基础商品层价格趋于稳定,差异化集中在长上下文、推理深度、多模态、工具调用四类高价值场景;最早 2028 H2 行业可能达到「成熟 SaaS」估值稳态,在此之前资本市场对基础模型厂商的估值波动幅度仍将高达 30-50%,投资风险显著高于成熟软件行业。