全球大模型最新格局 | 2026年4月:周调用量前六名被中国包揽
约 4 分钟2 次阅读

全球大模型最新格局 | 2026年4月:周调用量前六名被中国包揽
数据来源:OpenRouter 官方周榜(2026年4月第一周,4月7日发布)、Artificial Analysis、LMSYS Chatbot Arena、中新社、腾讯新闻等。
一、OpenRouter 周榜重磅:中国霸榜前六
2026年4月第一周(4月7日更新),OpenRouter 公布了全球大模型调用量排行榜,中国模型历史首次包揽前六名:
| 排名 | 模型 | 公司 | 周 Token 量 | 备注 |
|---|---|---|---|---|
| 🥇 | Qwen3.6-Plus | 阿里巴巴 | 4.6 万亿 | 新王登基 |
| 🥈 | DeepSeek-V3 | 深度求索 | 约 2.5 万亿 | 稳定前三 |
| 🥉 | Qwen3.6 | 阿里巴巴 | 约 1.8 万亿 | 轻量旗舰 |
| 4 | GLM-5 | 智谱AI | 约 1.5 万亿 | 稳居前五 |
| 5 | Kimi-K2.5 | 月之暗面 | 约 1.2 万亿 | 持续上升 |
| 6 | M2.1 | MiniMax | 约 0.96 万亿 | 进入前十 |
中国大模型周总调用量:12.96 万亿 Token,占 OpenRouter 全球周总调用量超过 60%。
二、阿里巴巴 Qwen3.6-Plus:新王的技术底座
Qwen3.6-Plus 为什么能登顶?核心技术指标:
2.1 基准测试成绩
| 评测 | 成绩 | 对比 |
|---|---|---|
| SWE-bench Verified | 78.8% | 超越 Claude Opus 4.5 |
| Terminal-Bench 2.0 | 61.6% | 超越 Claude Opus 4.5 |
| Claw-Eval | 与 Claude Opus 4.5 同梯队 | 国产最高 |
| QwenClawBench | 可完全匹敌 Claude Opus 4.5 | 显著超越 GLM-5、Kimi-K2.5 |
2.2 核心能力
- 100 万 Token 超长上下文:一次性处理整个代码仓库(约 75 万字)
- 原生 Agentic Coding:在复杂工程环境中自主规划、执行、优化编程任务
- 多模态推理:文本、代码、视觉信息联合推理
- API 云端服务:闭源模式,不再开源
2.3 战略意义
阿里巴巴此次全面转向闭源,三款新模型全部通过云端 API 提供,不再开源权重。这标志着中国 AI 企业从"开源生态建设期"正式进入"商业收割期"。
三、深度求索 DeepSeek-V3:开源杀手的持续攻势
DeepSeek-V3 以开源 MIT 许可证、236B 参数、极致性价比稳居前二:
- 价格优势:API 成本约为 GPT-4o 的 1/10
- 开源社区:全球最大的开源模型社区之一
- 稳定输出:从 2025 年初至今持续稳居前五
四、竞争格局深度分析
4.1 编程能力王座易主
编程评测一直是 Claude 和 GPT 的主场,但 Qwen3.6-Plus 的出现打破了这个格局:
| 模型 | SWE-bench | Terminal-Bench | 编程定位 |
|---|---|---|---|
| Qwen3.6-Plus | 78.8% | 61.6% | 新王 |
| Claude Opus 4.5 | 略低 | 略低 | 守门人 |
| GPT-4o | 约 70% | 约 58% | 跟随者 |
| Llama-4-Maverick | 约 65% | 约 52% | 开源第一 |
核心原因:Qwen3.6-Plus 的 Agentic Coding 能力——模型能在复杂工程环境中自主规划任务并执行,这正是企业级编程场景的核心需求。
4.2 Agent 能力全面崛起
2026 年被称为"Agent 元年",各大厂的模型都在强化 Agent 能力:
| 模型 | 工具调用 | 自主规划 | 多步推理 |
|---|---|---|---|
| Qwen3.6-Plus | ★★★★★ | ★★★★★ | ★★★★☆ |
| Claude 3.7 Sonnet | ★★★★★ | ★★★★☆ | ★★★★★ |
| GPT-4o | ★★★★☆ | ★★★★☆ | ★★★★☆ |
| Gemini 2.0 Flash | ★★★★☆ | ★★★☆☆ | ★★★★☆ |
五、全球大厂战略分化
5.1 OpenAI:霸主承压,市场份额收缩
- GPT-5.4 已于 2026 年 3 月发布
- 2024 年企业市场份额:62% → 2026 年预计:53%
- 正在筹备 IPO,估值 5500-6000 亿美元
- 军事合同:2026 年 3 月与五角大楼签约(含三条安全红线)
5.2 Anthropic:安全旗帜,代价沉重
- 2026 年 2 月完成 300 亿美元融资,估值 3800 亿美元
- 拒绝五角大楼合同:坚守 AI 安全原则,痛失 2 亿美元大单
- 后果:OpenAI 承接该合同,Anthropic 在政府市场暂时出局
5.3 Google:算力豪赌,多模态称王
- 2026 年资本支出:1850 亿美元(历史最高)
- Gemini 2.0 Flash 在多模态场景仍全球第一
- 2026 年 AI 基础设施投资同比翻倍
5.4 微软:投资赢家,稳坐钓鱼台
- 对 OpenAI 的 130 亿美元投资如今价值 2280 亿美元(17.6 倍回报)
- Phi-4 在推理效率赛道稳居前列
六、开源 vs 闭源:2026 年新格局
| 类型 | 代表模型 | 优势 | 劣势 |
|---|---|---|---|
| 闭源旗舰 | Qwen3.6-Plus, GPT-4o | 性能最强,技术护城河 | 成本高,不可定制 |
| 开源最强 | DeepSeek-V3, Llama-4 | 成本低,可本地部署 | 性能略逊 |
| 开源轻量 | Qwen3.6, Phi-4 | 效率高,适合边缘 | 能力有限 |
七、未来趋势
- 中国模型出海加速:OpenRouter 周榜前六全是中国模型,标志中国大模型商业化能力已获全球开发者认可
- 编程 Agent 成为主战场:Qwen3.6-Plus 登顶证明这一赛道竞争已白热化
- 开源与闭源并行:闭源主导商业市场,开源主导开发者生态
- 多模态全面融合:视觉+语言+代码统一表示成头部标配
数据截止:2026年4月8日 来源:OpenRouter 官方周榜(4月7日)、Artificial Analysis、中新社、腾讯新闻、LMSYS Chatbot Arena 等