多智能体协作入门：概念、模式与上手路径¶

本文介绍基于 LLM 的多智能体（Multi-Agent）协作是什么、与单 Agent 的差异、常见架构与应用场景，以及如何用 Dify、MetaGPT、LangGraph 等框架快速上手。到了 2025–2026 年，多智能体开始从研究概念逐步进入更实际的工程讨论，但是否值得采用，仍然要看任务复杂度与协调成本。

适用读者：已了解 AI Agent 入门，希望理解多智能体协作概念并动手搭建一个「多角色协作」的小闭环。

什么是多智能体协作¶

多智能体协作（Multi-Agent Collaboration） 指多个由 LLM 驱动的智能体，通过角色分工、通信协调、共享知识，共同完成超越单智能体能力的复杂任务。

可以把它理解为：从单个智能体包办所有事，到多个角色分工协作。每个智能体有明确的角色（如产品经理、架构师、工程师）、专属工具和职责，通过自然语言或结构化接口相互通信，形成可扩展的协作流程。

单 Agent	多智能体
一个模型承担规划、执行、验证全部流程	多个专业智能体分工协作
工具多时易「选择困难」、上下文易爆炸	每智能体专注少量工具与任务
角色混杂易导致提示词冗长、逻辑冲突	角色清晰，模块化设计，便于调试和扩展

多智能体 vs 单 Agent：为什么需要协作¶

单智能体在处理复杂任务时常面临：

工具选择困难：工具超过一定数量时，模型难以快速选出合适组合
上下文爆炸：用户历史、中间结果、工具调用记录挤满上下文窗口
角色混淆：一个智能体兼顾多角色，提示词易冗长且逻辑冲突

多智能体通过专业化、模块化、可控性缓解这些问题：每个智能体只负责少数工具和任务，协作流程明确定义，系统行为更可预测。研究表明，在复杂推理、软件工程等任务上，多智能体协作能带来显著性能提升（具体比例因任务和框架而异）。

核心要素：角色、通信、知识共享¶

入门时可以把多智能体系统拆成三个核心要素：

1. 角色分工（Role）¶

每个智能体有清晰的角色、职责与技能。典型角色包括：

规划者：拆解任务、制定步骤、分配子任务
执行者：负责具体操作（编码、搜索、分析等）
审阅者：校验结果、提出修改建议
协调者：调度任务、汇总输出、做最终决策

常见「虚拟软件公司」模式：产品经理、架构师、工程师、测试员等，模拟真实团队的流水线协作。

2. 通信机制（Communication）¶

智能体之间通过自然语言或结构化消息交互。常见模式包括：

星型：中心协调器与各智能体一对多通信
链式：智能体按顺序传递任务与结果
网状：智能体可相互直接通信，灵活但复杂度更高
分层：高层协调器管理下层团队，适合超大规模系统

3. 知识共享（Memory & Context）¶

通过共享状态、记忆或 RAG 知识库，避免信息孤岛：

共享状态：工作流编排框架（如 LangGraph）维护图状态，在各节点间传递
记忆模块：短期对话记忆 + 长期持久化记忆
RAG 知识库：多智能体共同访问同一知识源，减少幻觉与重复

典型应用场景¶

场景	示例
软件开发	MetaGPT、ChatDev：产品经理→架构师→工程师→测试员，流水线完成从需求到代码
金融分析	多角色智能体协作完成研报、风控、交易决策
客服与销售	意图识别、知识检索、话术生成等多智能体串联
研究与写作	检索、总结、写作、审稿等分步协作
机器人/仿真	多机器人协同导航、任务分配与规划

主流框架与平台¶

框架/平台	特点	适合人群
Dify	开源 LLM 应用平台，可视化工作流 + Agent 节点，支持 RAG、MCP	快速搭建、不想写代码
MetaGPT	核心理念「Code = SOP(Team)」，模拟软件公司流水线，从需求到代码一气呵成	软件开发自动化
ChatDev	清华开源，虚拟软件公司，CEO/CTO/程序员/测试员等角色协作	软件开发、研究学习
LangGraph	图结构工作流，支持循环、分支、人工干预，适合复杂编排	需要细粒度控制的开发者
CrewAI	强调角色化 Agent 团队，高层 API，适合快速原型	业务编排、原型验证

最小实战：用 Dify 搭一个多智能体工作流¶

以 Dify 为例，做一个「查资料 + 写摘要」的简化多智能体流程：

创建 Workflow：选择「工作流」应用
添加 Agent 节点：第一个节点负责「搜索/检索」，第二个负责「总结/输出」
配置工具：为检索节点配置搜索或 RAG 工具，为总结节点配置 LLM
连接节点：检索输出 → 总结输入，形成串行流水线
测试运行：输入主题，观察多节点协作结果

更复杂场景可增加更多 Agent 节点、并行分支或循环。Dify 文档：核心概念与工作流、Agent 节点。

注意事项与常见坑¶

协调开销：多智能体间通信会增加 token 消耗与延迟，需合理控制调用次数与上下文长度
一致性：不同智能体输出可能风格不一致，可通过统一的系统提示或审阅节点做约束
错误传播：前序智能体的错误会传给后续，建议在关键节点加校验或重试逻辑
成本控制：多轮 LLM 调用成本较高，可对小任务优先用单 Agent，复杂任务再上多智能体

与本站其他文章的关系¶

AI Agent 入门：单 Agent 概念与工具调用，是理解多智能体的基础
MCP：多智能体常用 MCP 统一接入外部工具
RAG：多智能体共享知识库时可接入 RAG
Skill：各智能体可配备专属 Skill 定流程与规范

小结¶

多智能体协作 = 多个 LLM 智能体通过角色分工、通信协调、知识共享，共同完成复杂任务
核心要素：角色、通信、知识共享；常见模式包括星型、链式、网状、分层
典型场景：软件开发、金融分析、客服、研究写作、机器人协同等
入门路径：从 Dify 可视化工作流或 MetaGPT/ChatDev 的「虚拟软件公司」示例开始，再根据需要深入 LangGraph 等编程框架

延伸阅读：Large Language Model based Multi-Agents: A Survey、LangGraph 多智能体协作教程、Dify 文档。

本文作者： 王科文