📚 本系列目录：《AI 原生架构》当前第 4/10 篇 · 上一篇：AI原生架构（三）：AI原生应用的11个关键要素全景解读 · 下一篇：AI原生架构（五）：上下文工程实战——提示词、RAG与记忆系统

📚 系列导航

《AI 原生架构》共 10 篇，本篇是第 4 篇。

AI原生架构（四）：模型选择与Agent设计模式——打好AI应用的底座

在第三篇文章中，我们系统性地介绍了AI原生应用的11个关键要素。其中，模型（Model） 和 框架（Framework） 是整个架构的基石——模型提供智能的"大脑"，框架提供开发的"脚手架"。

无论是RAG、记忆、工具还是网关，所有其他要素都建立在模型的选择和框架的编排之上。如果基础没有打牢，上层再精美的设计也只能是空中楼阁。

然而，模型的选择并非一劳永逸，框架的选型也因场景而异。面对数百种大模型、数十种开发框架和层出不穷的Agent设计模式，开发者和架构师常常感到无所适从。本章将结合《AI原生应用架构白皮书》的论述，从模型分类与选择策略入手，深入解析七种主流Agent设计模式的原理与适用场景，并对开发框架的三种形态进行对比分析，帮助你在构建AI原生应用时做出明智的技术决策。

一、模型：应用的大脑

在AI原生应用中，模型（Model） 是核心的决策引擎，负责理解、推理与生成。传统应用的能力边界由代码明确界定，而AI原生应用的能力天花板，则直接取决于所调用模型的性能。

1. 模型的分类

根据用途与能力的不同，模型大致可以分为两类：

通用大模型：如GPT-4o、Claude、Qwen、DeepSeek、Gemini等系列。它们拥有极大的参数规模（通常在千亿到万亿级），具备广博的知识和强大的通用推理能力，部分模型还支持多模态输入（文本、图像、语音、视频等）。通用大模型的优势在于"通才"，能够处理各种开放性的复杂任务，但相应的推理成本高、延迟较大。

垂直领域模型：放弃追求通用性，只专注于特定领域或任务，如情感分析、意图分类、语言翻译、代码补全等。这类模型通常参数规模较小，推理速度快、成本低，在特定任务上的表现甚至可能超过通用大模型。

此外，随着技术的发展，多模态模型成为重要的新类别，能够同时处理和理解文本、图像、音频等信息，极大地拓展了AI应用的感知和生成能力。

2. 模型的能力与局限

白皮书明确指出："虽然模型的能力非常强大，但是他们的能力主要源于庞大的预训练数据，这也意味着无论模型多强大，它的知识都是固化的。" 模型不认识最新的产品，不了解企业内部的API，更不知道数据库中的实时信息。这些局限需要通过上下文工程（如RAG、记忆）和工具调用来弥补。

模型的选择不存在"银弹"。一个务实的策略是从顶配开始，逐步优化：先用能力最强的模型搭建原型，验证业务逻辑的可行性；再将流程中简单、非核心的任务替换为更经济的小模型，最终找到成本与性能的最佳平衡点。

3. 选择模型时的关键考量

任务复杂度：复杂推理、多步规划需要强大模型；简单分类、信息提取可以用小模型。
成本与延迟：顶尖模型价格高、响应慢；小模型成本低、速度快。
上下文窗口：长文档分析、多轮对话需要大上下文窗口。
多模态需求：需要处理图片、音频、视频等，要选择多模态模型。
部署方式：云端API vs 本地私有化部署，后者对模型体积和硬件要求更高。
工具调用能力：模型对Function Calling的支持程度直接影响Agent开发效率。

在实际企业级应用中，常见的做法是构建**"大模型+小模型"的混合架构**：大模型负责处理复杂、开放的任务（如理解模糊需求、规划任务步骤），小模型承担高频、确定的任务（如分类、过滤、简单回复）。这种分层设计可以有效平衡效果、成本和速度。

二、Agent设计模式：让模型学会思考和行动

有了模型这颗"大脑"，还需要一套方法论指导它如何思考、如何行动。Agent设计模式就是这套方法论的核心。白皮书将Agent设计模式总结为七种，它们并非互斥，而是可以组合使用。理解每种模式的特性和适用场景，是在框架选型和业务设计时的关键能力。

1. Chain of Thought（思维链，CoT）

提出背景：Google Research，2022年。

核心思想：让模型在给出最终答案之前，先将推理过程一步步写出来。不是直接输出答案，而是展示完整的推导步骤。

场景举例：数学应用题"小王比小李大1岁，小张的年龄是小李的两倍，如果三个人的年龄加起来是41岁，问小王多大？"CoT会先假设小李x岁，然后推导关系，最后计算。这种方式显著提升了逻辑推理和数值计算的准确率。

适用场景：逻辑推理、数学计算、复杂问题分解。

2. Self-Ask（自问自答）

提出背景：Microsoft Research，2022年。

核心思想：让模型在回答时"反问自己"，将大问题拆解成若干互相关联的小问题，逐个回答后综合得到最终答案。

场景举例："2016年奥斯卡最佳男主角的年龄是多少？"Self-Ask会先问"2016年奥斯卡最佳男主角是谁？"（莱昂纳多·迪卡普里奥），再问"他当时多大？"（41岁），合并得出答案。

适用场景：涉及多步事实查询、需要拆解的多跳问题。

3. ReAct（推理+行动）

提出背景：Princeton与Google Research，2022年。

核心思想：在推理（Reasoning）和行动（Acting，如调用搜索引擎或API）之间交替进行。ReAct是目前最广泛使用的Agent设计模式，它让模型既能够思考（推理下一步该做什么），也能够动手（调用外部工具获取信息）。

场景举例："杭州昨天的天气如何？"ReAct会先想"我不知道昨天的天气，需要查询"，然后调用天气API获取数据，再根据返回结果组织回答。

适用场景：需要与外部环境交互的任务——大多数AI应用场景都适用。目前主要框架（LangChain、Spring AI Alibaba等）都已将ReAct内置为默认模式。

4. Plan-and-Execute（计划与执行）

提出背景：2023年后的Agent框架实践。

核心思想：将任务拆分为两个阶段——先生成整体计划（Planning），再逐步执行（Execution）。与ReAct边想边做不同，Plan-and-Execute强调先规划再行动。

场景举例："写一篇新能源车市场调研报告。"Agent不会直接生成，而是先拟定计划：收集销量数据→分析政策趋势→总结消费者反馈→撰写结论。然后逐条执行。

适用场景：多步骤、需要长时间执行或涉及多个独立子任务。

5. Tree of Thoughts（树状思维，ToT）

提出背景：Princeton和DeepMind，2023年。

核心思想：不是单线推理，而是同时探索多个思路分支，像树一样展开，通过评估机制（如打分）选出最优路径，必要时回溯。

场景举例：解数独时，Agent会尝试多个候选数字（分支A、B、C），逐步排除无效分支，最终找到唯一解。

适用场景：需要探索多种可能性的规划任务、谜题、策略优化。

提出背景：2023年论文《Reflexion: Language Agents with Verbal Reinforcement Learning》。

核心思想：Agent具备自我纠错能力，犯错后会总结失败原因，带着反思经验重新尝试，直到成功。

场景举例：让Agent写一段Python代码，第一次运行报错。它会读取错误信息，反思"函数参数写错了"，自动修正代码后重试。

适用场景：代码生成、流程执行、需要反复试错的场景。

7. Role-playing Agents（角色扮演式多智能体协作）

提出背景：源自AutoGPT、ChatDev、CAMEL等社区项目。

核心思想：将任务拆解给不同角色的Agent，每个Agent有专属职责，通过对话协作完成任务。这是多智能体系统的典型模式。

场景举例：软件开发任务中，产品经理Agent写需求文档，程序员Agent写代码，测试Agent写测试用例。它们像真实团队一样分工协作。

适用场景：复杂系统工程、跨职能协作、需要多视角分析的任务。

模式组合与选型建议

以上七种设计模式构成了Agent的"思维模式库"。它们可以混搭使用，例如ReAct内部可以嵌套CoT，多智能体中的每个Agent可以采用不同的模式。在实际应用中，选择哪种模式主要取决于任务的确定性与对自主性的要求：

高确定性任务（如客服FAQ、固定流程审批）：更适合Plan-and-Execute或工作流。
高不确定性任务（如开放式问答、复杂搜索）：更适合ReAct或Self-Ask。
需要创意与探索（如方案生成）：可考虑ToT或多智能体角色扮演。
需要质量保证（如代码生成）：引入Reflexion进行自我修正。

三、开发框架：如何将模式落地

理解了设计模式后，接下来就是选择合适的开发框架。白皮书指出，Agent开发框架"天然就很难收敛"——不同设计模式、不同编程语言、不同抽象层级，造就了丰富的框架生态。整体来看，框架可归纳为低代码、高代码与零代码三种形态。

1. 低代码框架（Low-Code）

代表产品：Dify、Coze、阿里云百炼、Flowwise、n8n等。

特点：可视化拖拽编排，模板化配置，适合快速原型验证和小规模试点。非专业开发者也能参与构建。

局限：运行时性能受限于底层引擎的抽象层，无法满足大规模生产对性能、扩展性和复杂业务逻辑的要求。白皮书指出，"低代码平台是对于高代码的一层封装，其抽象层次很难满足所有场景"。

2. 高代码框架（High-Code）

代表产品：LangGraph、Spring AI Alibaba、AutoGen、AgentScope、ADK等。

特点：提供面向Agent的编程接口（API），开发者可以精细控制模型调用、工具编排、上下文管理、状态维护等逻辑。性能可控、灵活性高，是当前生产落地的主流形态。

高代码框架本身经历了从ChatClient到Workflow再到Agentic的演进：

ChatClient阶段：简单封装模型API，单次调用，缺乏复杂任务能力。
Workflow阶段：将传统工作流引入LLM节点编排，实现了自主性与确定性的初步平衡，但编排复杂，维护成本高。
Agentic阶段：提供多样的内置协作模式（Pattern），使开发者在自主性和可预测性之间取得平衡。例如Spring AI Alibaba的ReactAgent、SequentialAgent、ParallelAgent等。

企业级应用落地验证，高代码框架是当前最可靠的选择。

3. 零代码框架（Zero-Code）

代表产品：MetaGPT等。

特点：用户通过自然语言驱动应用开发，模型自主完成分解、编排和工具调用。愿景是实现AI应用的全民化。

局限：受当前模型能力限制，复杂场景下的推理深度、上下文管理和可控性不足，生产可用性低，目前主要用于探索实验。

如何选择框架

白皮书给出的建议：在验证阶段可以使用低代码工具快速试错；进入大规模生产阶段后，建议迁移到高代码框架以获得更好的性能和可控性。同时，框架选择还需要考虑团队的编程语言栈（Python vs Java）、对特定设计模式的支持程度以及社区活跃度。

四、模型与设计模式的协同

模型和设计模式不是独立决策的。不同模型在推理能力、工具调用准确性、指令遵循度上存在差异，这直接影响设计模式的实施效果。例如：

强大的模型（如GPT-4o、Claude 3.5、Qwen-Max）对ReAct模式支持更好，能准确判断何时调用工具、如何解析结果。
能力较弱的模型可能更适合Plan-and-Execute这样的确定性流程，而非高自主性的ReAct。
在需要多步推理的场景下，CoT模式的提升效果在不同模型上表现不一。

因此，建议在实践中采用**"模型适配模式"**的方法：先用顶尖模型跑通设计模式原型，再逐步尝试将部分任务降级到经济模型，同时调整Prompt和模式参数以弥补模型能力差距。

五、实践路径：从零构建智能体

结合白皮书3.2节的内容，我们以Spring AI Alibaba为例，勾勒一个最简单的智能体开发流程：

定义Agent身份：指定名称、描述、模型。
设定指令（System Prompt）：明确核心任务、行为约束、工具使用规则。
配置工具：将需要调用的外部API或函数描述注册为Tools。
设置模型参数：如温度、最大Token。
运行与迭代：通过"思考-行动-观察"循环完成用户请求，观察效果，调整Prompt或工具描述。

这个基本流程是所有Agent应用的起点。后续可以通过引入工作流（SequentialAgent、ParallelAgent）和多智能体架构，应对更复杂的场景。

六、小结与展望

模型是AI原生应用的大脑，框架是骨架，设计模式则是思维方法。 没有好的模型，一切都无从谈起；没有合适的设计模式，模型的能力难以充分发挥；没有正确的框架，模式无法高效落地。这三者的协同，构成了AI原生应用的坚实基础。

在下一篇文章中，我们将继续深入上下文工程这一核心领域，详细探讨提示词工程、RAG与记忆系统的原理与优化实践。如果说模型和框架决定了应用的"上限"，那么上下文工程决定了应用在具体场景中的"实际表现"。敬请期待。

AI原生架构（四）：模型选择与Agent设计模式——打好AI应用的底座

📚 系列导航

AI原生架构（四）：模型选择与Agent设计模式——打好AI应用的底座

一、模型：应用的大脑

1. 模型的分类

2. 模型的能力与局限

3. 选择模型时的关键考量

二、Agent设计模式：让模型学会思考和行动

1. Chain of Thought（思维链，CoT）

2. Self-Ask（自问自答）

3. ReAct（推理+行动）

4. Plan-and-Execute（计划与执行）

5. Tree of Thoughts（树状思维，ToT）

6. Reflexion / Iterative Refinement（反思与迭代优化）

7. Role-playing Agents（角色扮演式多智能体协作）

模式组合与选型建议

三、开发框架：如何将模式落地

1. 低代码框架（Low-Code）

2. 高代码框架（High-Code）

3. 零代码框架（Zero-Code）

如何选择框架

四、模型与设计模式的协同

五、实践路径：从零构建智能体

六、小结与展望

系列：AI原生架构

评论

发表评论