DeepSeek-V4 今日正式发布:百万上下文、MegaMoE架构、全面开源
约 4 分钟935 字9 次阅读

DeepSeek-V4 正式发布:开源大模型迎来新里程碑
2026年4月24日,DeepSeek 全新旗舰模型 DeepSeek-V4 预览版正式上线,并同步开源。这款历经多次跳票、承载业界极高期待的模型,终于在今天与全球开发者见面。
核心亮点
📐 超长上下文
DeepSeek-V4 支持 百万字(1M token)超长上下文,可处理整本书、超大代码库或长篇对话,彻底突破此前模型的上下文瓶颈。
🤖 Agent 能力全面跃升
在 Agent 能力、世界知识和推理性能上,DeepSeek-V4 均实现了国内与开源领域的领先,具备更强的工具调用、多步规划与自主执行能力。
⚡ 两个版本,覆盖不同场景
- deepseek-v4-pro:旗舰性能版,适合复杂推理与高要求任务
- deepseek-v4-flash:轻量快速版,适合高并发、低延迟场景
🏗️ MegaMoE 架构
V4 采用先进的 MegaMoE(Mega Mixture of Experts)架构,参数规模或达 1.6 万亿,单次推理可激活数千个专家,在性能与效率之间取得突破性平衡。
🇨🇳 全面适配国产算力
V4 全力适配华为昇腾芯片,通过 CANN 框架完成核心代码重写,是中国 AI 生态去 CUDA 化进程中的重要一步。
如何体验
即日起,你可以通过以下方式使用 DeepSeek-V4:
- 🌐 官网:deepseek.com 直接对话
- 📱 官方 App:iOS / Android 均已更新
- 🔌 API:已同步上线,开发者可直接调用
- 💻 开源:模型权重同步开源,可本地部署
背景:一次漫长的等待
DeepSeek-V4 的发布之路颇为曲折。从 2025 年底传出消息,到春节前后跳票,再到 4 月下旬研究员在社交平台发出「V4 下周」的预告,整个 AI 圈等待了将近半年。
等待的背后,是团队在技术上的极致追求——超长上下文的工程实现、MegaMoE 架构的系统优化、以及对国产算力的全面适配,每一项都是硬骨头。
行业影响
V4 发布当日,A 股 AI 算力芯片概念股全线爆发,科创芯片 ETF 大涨近 3%,数字经济 ETF 涨 0.49%。市场用真金白银投票,表达对这款模型的信心。
对于开发者而言,一个支持百万上下文、Agent 能力领先、完全开源、且全面适配国产算力的模型,意味着更多可能性正在打开。
DeepSeek 官方 X(Twitter)账号:@deepseek_ai