【AI 日报】2026年05月13日 AI 最新动态

📚 本系列目录：《AI 日报》当前第 2/26 篇 · 上一篇：【AI 日报】2026年05月12日 AI 最新动态 · 下一篇：【AI 日报】2026年05月14日 AI 最新动态

📚 系列导航

《AI 日报》共 26 篇，本篇是第 2 篇。

← 上一篇：【AI 日报】2026年05月12日 AI 最新动态

下一篇：【AI 日报】2026年05月14日 AI 最新动态 →

引言

今日 AI 领域继续呈现多元化发展态势：企业 AI 代理加速落地、学术界对 AI 经济影响展开深入讨论、头部企业持续深耕多模态与安全技术。以下为今日值得关注的几条动态。

一、NVIDIA 与 SAP 达成合作，为企业 AI 代理建立信任机制

发布时间：2026年5月12日
来源：NVIDIA Blog

在 SAP Sapphire 大会上，NVIDIA CEO 黄仁勋通过视频参与，宣布 SAP 与 NVIDIA 扩大合作，共同帮助企业在生产环境中安全部署专业 AI 代理（Specialized Agents）。

此次合作的核心是 NVIDIA OpenShell——一个开源的安全运行时环境，将被深度嵌入 SAP Business AI Platform，为所有 SAP AI 代理（包括在 Joule Studio 中构建的自定义代理）提供安全保障。OpenShell 提供以下关键能力：

隔离执行环境：防止代理逻辑失控时对系统造成损害
文件系统层和网络层的策略执行
基础设施级别的隔离控制
完整的审计追踪

这一合作反映了企业 AI 从"AI 助手"向"自主代理"转型过程中的核心挑战：当 AI 能够跨越应用边界、自主操作系统级记录时，企业需要的不只是模型能力，更需要可信赖的治理框架。

原文链接：https://blogs.nvidia.com/blog/sap-specialized-agents/

二、NVIDIA 发布 Nemotron 3 Nano Omni：统一多模态能力，效率提升 9 倍

发布时间：2026年4月28日
来源：NVIDIA Blog

当前大多数 AI 代理系统需要串联多个独立模型处理视觉、语言和音频任务，导致信息在传递过程中丢失上下文。NVIDIA 推出的 Nemotron 3 Nano Omni 旨在解决这一问题——这是一款开源的多模态推理模型，在单一系统中统一了视觉、音频和语言处理能力。

核心亮点：

9 倍效率提升：相较于同类开源多模态模型，吞吐量提升约 9 倍
多模态统一感知：支持文本、图像、音频、视频、文档、图表和图形界面（GUI）的输入
6 项基准测试领先：在复杂文档理解、音视频推理等任务上表现最优
专为代理工作流设计：可作为 AI 代理系统中的"感知引擎"，配合 Nemotron 3 Super/Ultra 等模型协同工作

该模型的定位是成为企业 AI 代理的"眼睛和耳朵"，为计算机操作、文档智能和音视频推理等场景提供高效、低成本的多模态感知能力。

原文链接：https://blogs.nvidia.com/blog/nemotron-3-nano-omni-multimodal-ai-agents/

三、NVIDIA 与 ServiceNow 深化合作，Project Arc 自主桌面代理正式亮相

发布时间：2026年5月5日
来源：NVIDIA Blog

在 ServiceNow Knowledge 2026 大会上，NVIDIA CEO 黄仁勋与 ServiceNow 董事长兼 CEO Bill McDermott 共同宣布双方扩大合作，将企业级自主 AI 代理带入从员工桌面到 AI 工厂的全场景。

双方合作的关键内容包括：

基于 NVIDIA 加速计算和开源模型，为企业提供领域特定的安全代理
ServiceNow 推出 Project Arc：一款面向知识工作者（包括开发者、IT 团队和管理员）的长期自主桌面代理，能够访问本地文件系统、终端和已安装应用，完成传统自动化无法处理的复杂多步骤任务
Project Arc 通过 ServiceNow Action Fabric 原生连接到 ServiceNow AI 平台，为每个操作提供治理、可审计性和工作流智能

这一发布标志着企业 AI 正在从"生成"和"推理"阶段迈向"行动"阶段。

原文链接：https://blogs.nvidia.com/blog/servicenow-autonomous-ai-agents-enterprises/

四、诺贝尔经济学奖得主 Daron Acemoglu 谈 AI 对劳动市场的影响

发布时间：2026年5月11日
来源：MIT Technology Review

2024 年诺贝尔经济学奖得主、MIT 教授 Daron Acemoglu 日前接受 MIT Technology Review 采访，阐述了他对当前 AI 发展的三大观察：

1. AI 代理：增强工具，而非工作替代者

Acemoglu 认为，AI 代理（Agentic AI）虽然技术上有显著突破，但他对"一个代理替代一个人的全部工作"持怀疑态度。他以 X 光技师为例：一个人的工作涉及 30 多种不同任务的自然切换，而 AI 需要大量独立工具才能完成同等覆盖。代理能否在任务之间灵活编排，才是决定其就业影响的关键。

2. 大型科技公司竞相招募经济学家

继争夺 AI 研究人才之后，Big Tech 正在掀起第二轮人才争夺——招募经济学家的热潮。OpenAI 聘请了杜克大学 Ronnie Chatterji 担任首席经济学家；Anthropic 组建了由 10 位顶尖经济学家组成的团队；Google DeepMind 最近宣布聘请芝加哥大学 Alex Imas 担任"AGI 经济学总监"。Acemoglu 对此持谨慎态度，他希望这些经济学家能为公共利益服务，而非仅为公司立场背书。

3. AI 的易用性瓶颈

Acemoglu 指出，AI 尚未出现类似 PowerPoint 或 Word 那样的杀手级应用——能够被普通工作者快速上手并产生实际生产力。这解释了为什么迄今为止 AI 对就业率和生产力的影响仍然有限。他预计，未来观察 AI 经济影响的关键信号之一，就是真正易于使用的 AI 应用何时大规模普及。

原文链接：https://www.technologyreview.com/2026/05/11/1137090/three-things-in-ai-to-watch-according-to-a-nobel-winning-economist/

五、Musk 诉 OpenAI 案第二周：OpenAI 高管反驳 Musk 说法

发布时间：2026年5月8日
来源：MIT Technology Review

Musk 诉 OpenAI 案进入第二周，OpenAI 总裁 Greg Brockman 出庭作证，反驳了 Musk 此前的说法。Musk 声称他和 Altman 曾承诺 OpenAI 保持非营利性质、为人类利益开发 AI，但后来公司接受微软数十亿美元投资并转型为营利性子公司。

Brockman 反驳的核心论点：

Musk 实际上曾推动 OpenAI 创建营利性分支机构，并争取对该机构的"绝对控制权"
OpenAI 认为 Musk 此番诉讼的动机在于他未能如愿以偿，如今试图通过法律手段削弱竞争对手——他自己的 AI 公司 xAI

此外，OpenAI 前董事会成员、Musk 四个孩子的母亲 Shivon Zilis 也出庭作证，透露 Musk 曾试图招募 Sam Altman 加入特斯拉内部一个新 AI 实验室。Musk 于 2018 年离开 OpenAI 联合创始人职位，目前他请求法院将 Altman 和 Brockman 从各自职位上移除。

原文链接：https://www.technologyreview.com/2026/05/08/musk-v-altman-week-2-openai-fires-back-and-shivon-zilis-reveals-that-musk-tried-to-poach-sam-altman/

六、MIT Technology Review 发布《世界模型：当前 AI 最重要的十件事》

发布时间：2026年5月12日
来源：MIT Technology Review

MIT Technology Review 编辑团队发布重磅专题，系统梳理当前 AI 领域最重要的十大发展方向，世界模型（World Models） 位列其中并引发特别关注。

世界模型旨在让 AI 系统建立对真实世界的深度理解，能够预测环境变化并据此进行长期规划。与当前主流的"在提示中推理"（Chain-of-Thought）不同，世界模型追求的是一种更接近人类直觉推理的内在世界表征，有望为 AI 的长期任务规划、物理世界理解和多步骤推理带来质的飞跃。

此外，该专题还提到 OpenAI 正全力推进"全自动研究者"（Fully Automated Researcher）项目，以及斯坦福大学 2026 AI Index 报告的发现：AI 正在以极快速度发展，而人类社会的适应机制正在承压。

总结

本周 AI 领域呈现几个明显趋势：企业 AI 代理正在从试点走向生产，安全和治理框架成为刚需；多模态模型持续进化，效率和统一性成为竞争焦点；学术界对 AI 经济影响的讨论趋于理性，务实派观点正在获得更多关注；法律层面，围绕 AI 公司的治理和利益冲突争议也在逐步浮出水面。AI 正在进入一个从"能做什么"到"该怎么做"的关键转型期。