【AI 日报】2026年05月13日 AI 最新动态
约 12 分钟3460 字13 次阅读

引言
今日 AI 领域继续呈现多元化发展态势:企业 AI 代理加速落地、学术界对 AI 经济影响展开深入讨论、头部企业持续深耕多模态与安全技术。以下为今日值得关注的几条动态。
一、NVIDIA 与 SAP 达成合作,为企业 AI 代理建立信任机制
发布时间:2026年5月12日
来源:NVIDIA Blog
在 SAP Sapphire 大会上,NVIDIA CEO 黄仁勋通过视频参与,宣布 SAP 与 NVIDIA 扩大合作,共同帮助企业在生产环境中安全部署专业 AI 代理(Specialized Agents)。
此次合作的核心是 NVIDIA OpenShell——一个开源的安全运行时环境,将被深度嵌入 SAP Business AI Platform,为所有 SAP AI 代理(包括在 Joule Studio 中构建的自定义代理)提供安全保障。OpenShell 提供以下关键能力:
- 隔离执行环境:防止代理逻辑失控时对系统造成损害
- 文件系统层和网络层的策略执行
- 基础设施级别的隔离控制
- 完整的审计追踪
这一合作反映了企业 AI 从"AI 助手"向"自主代理"转型过程中的核心挑战:当 AI 能够跨越应用边界、自主操作系统级记录时,企业需要的不只是模型能力,更需要可信赖的治理框架。
二、NVIDIA 发布 Nemotron 3 Nano Omni:统一多模态能力,效率提升 9 倍
发布时间:2026年4月28日
来源:NVIDIA Blog
当前大多数 AI 代理系统需要串联多个独立模型处理视觉、语言和音频任务,导致信息在传递过程中丢失上下文。NVIDIA 推出的 Nemotron 3 Nano Omni 旨在解决这一问题——这是一款开源的多模态推理模型,在单一系统中统一了视觉、音频和语言处理能力。
核心亮点:
- 9 倍效率提升:相较于同类开源多模态模型,吞吐量提升约 9 倍
- 多模态统一感知:支持文本、图像、音频、视频、文档、图表和图形界面(GUI)的输入
- 6 项基准测试领先:在复杂文档理解、音视频推理等任务上表现最优
- 专为代理工作流设计:可作为 AI 代理系统中的"感知引擎",配合 Nemotron 3 Super/Ultra 等模型协同工作
该模型的定位是成为企业 AI 代理的"眼睛和耳朵",为计算机操作、文档智能和音视频推理等场景提供高效、低成本的多模态感知能力。
原文链接:https://blogs.nvidia.com/blog/nemotron-3-nano-omni-multimodal-ai-agents/
三、NVIDIA 与 ServiceNow 深化合作,Project Arc 自主桌面代理正式亮相
发布时间:2026年5月5日
来源:NVIDIA Blog
在 ServiceNow Knowledge 2026 大会上,NVIDIA CEO 黄仁勋与 ServiceNow 董事长兼 CEO Bill McDermott 共同宣布双方扩大合作,将企业级自主 AI 代理带入从员工桌面到 AI 工厂的全场景。
双方合作的关键内容包括:
- 基于 NVIDIA 加速计算和开源模型,为企业提供领域特定的安全代理
- ServiceNow 推出 Project Arc:一款面向知识工作者(包括开发者、IT 团队和管理员)的长期自主桌面代理,能够访问本地文件系统、终端和已安装应用,完成传统自动化无法处理的复杂多步骤任务
- Project Arc 通过 ServiceNow Action Fabric 原生连接到 ServiceNow AI 平台,为每个操作提供治理、可审计性和工作流智能
这一发布标志着企业 AI 正在从"生成"和"推理"阶段迈向"行动"阶段。
原文链接:https://blogs.nvidia.com/blog/servicenow-autonomous-ai-agents-enterprises/
四、诺贝尔经济学奖得主 Daron Acemoglu 谈 AI 对劳动市场的影响
发布时间:2026年5月11日
来源:MIT Technology Review
2024 年诺贝尔经济学奖得主、MIT 教授 Daron Acemoglu 日前接受 MIT Technology Review 采访,阐述了他对当前 AI 发展的三大观察:
1. AI 代理:增强工具,而非工作替代者
Acemoglu 认为,AI 代理(Agentic AI)虽然技术上有显著突破,但他对"一个代理替代一个人的全部工作"持怀疑态度。他以 X 光技师为例:一个人的工作涉及 30 多种不同任务的自然切换,而 AI 需要大量独立工具才能完成同等覆盖。代理能否在任务之间灵活编排,才是决定其就业影响的关键。
2. 大型科技公司竞相招募经济学家
继争夺 AI 研究人才之后,Big Tech 正在掀起第二轮人才争夺——招募经济学家的热潮。OpenAI 聘请了杜克大学 Ronnie Chatterji 担任首席经济学家;Anthropic 组建了由 10 位顶尖经济学家组成的团队;Google DeepMind 最近宣布聘请芝加哥大学 Alex Imas 担任"AGI 经济学总监"。Acemoglu 对此持谨慎态度,他希望这些经济学家能为公共利益服务,而非仅为公司立场背书。
3. AI 的易用性瓶颈
Acemoglu 指出,AI 尚未出现类似 PowerPoint 或 Word 那样的杀手级应用——能够被普通工作者快速上手并产生实际生产力。这解释了为什么迄今为止 AI 对就业率和生产力的影响仍然有限。他预计,未来观察 AI 经济影响的关键信号之一,就是真正易于使用的 AI 应用何时大规模普及。
五、Musk 诉 OpenAI 案第二周:OpenAI 高管反驳 Musk 说法
发布时间:2026年5月8日
来源:MIT Technology Review
Musk 诉 OpenAI 案进入第二周,OpenAI 总裁 Greg Brockman 出庭作证,反驳了 Musk 此前的说法。Musk 声称他和 Altman 曾承诺 OpenAI 保持非营利性质、为人类利益开发 AI,但后来公司接受微软数十亿美元投资并转型为营利性子公司。
Brockman 反驳的核心论点:
- Musk 实际上曾推动 OpenAI 创建营利性分支机构,并争取对该机构的"绝对控制权"
- OpenAI 认为 Musk 此番诉讼的动机在于他未能如愿以偿,如今试图通过法律手段削弱竞争对手——他自己的 AI 公司 xAI
此外,OpenAI 前董事会成员、Musk 四个孩子的母亲 Shivon Zilis 也出庭作证,透露 Musk 曾试图招募 Sam Altman 加入特斯拉内部一个新 AI 实验室。Musk 于 2018 年离开 OpenAI 联合创始人职位,目前他请求法院将 Altman 和 Brockman 从各自职位上移除。
六、MIT Technology Review 发布《世界模型:当前 AI 最重要的十件事》
发布时间:2026年5月12日
来源:MIT Technology Review
MIT Technology Review 编辑团队发布重磅专题,系统梳理当前 AI 领域最重要的十大发展方向,世界模型(World Models) 位列其中并引发特别关注。
世界模型旨在让 AI 系统建立对真实世界的深度理解,能够预测环境变化并据此进行长期规划。与当前主流的"在提示中推理"(Chain-of-Thought)不同,世界模型追求的是一种更接近人类直觉推理的内在世界表征,有望为 AI 的长期任务规划、物理世界理解和多步骤推理带来质的飞跃。
此外,该专题还提到 OpenAI 正全力推进"全自动研究者"(Fully Automated Researcher)项目,以及斯坦福大学 2026 AI Index 报告的发现:AI 正在以极快速度发展,而人类社会的适应机制正在承压。
总结
本周 AI 领域呈现几个明显趋势:企业 AI 代理正在从试点走向生产,安全和治理框架成为刚需;多模态模型持续进化,效率和统一性成为竞争焦点;学术界对 AI 经济影响的讨论趋于理性,务实派观点正在获得更多关注;法律层面,围绕 AI 公司的治理和利益冲突争议也在逐步浮出水面。AI 正在进入一个从"能做什么"到"该怎么做"的关键转型期。