Skip to content

sandin/Agentic-Design-Patterns-Summary

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

智能体设计模式索引

智能体设计模式

《智能体设计模式》是由Antonio Gulli撰写的实践指南,全书424页,系统性地介绍了构建智能AI系统的设计模式。书籍分为四个主要部分:基础智能体模式(提示链、路由、并行化等)、高级功能(内存管理、学习适应、MCP协议)、系统可靠性(异常处理、人在回路、RAG检索)以及高级主题(智能体通信、资源优化、推理技术、安全模式等)。每个章节都配有实践代码,涵盖从基础概念到复杂系统的完整开发流程,为AI工程师提供全面的智能体系统构建指导。

Agentic Design Patterns

什么使AI系统成为智能体?

本文系统阐述了AI智能体的定义、发展历程和未来趋势。AI智能体是能够感知环境并采取行动实现目标的系统,相比传统大语言模型具备规划、工具使用和环境交互能力。文章将智能体发展分为四个复杂度级别:从基础推理引擎到连接问题解决者、战略问题解决者,再到协作多智能体系统。同时提出了五大未来假设:通才智能体、深度个性化、物理世界交互、智能体驱动经济和目标驱动变形系统,展现了AI智能体从单一工具使用者向复杂协作系统演进的重要趋势。

What makes an AI system an Agent?

第1章:提示链

本文介绍了提示链模式,这是一种将复杂任务分解为多个小步骤的LLM应用方法。通过顺序处理子问题,每个步骤使用专门设计的提示,前一步输出作为下一步输入,显著提高任务可靠性和控制力。文章详细说明了单提示的局限性、结构化输出的重要性、实际应用场景,并提供了代码示例和上下文工程的概念。提示链是构建智能代理系统的基础技术,适用于信息处理、复杂查询、数据提取、内容生成等多种场景。

Chapter 1: Prompt Chaining

第2章:路由

本章介绍了路由模式在代理系统中的重要性,它通过引入条件逻辑使代理能够基于输入和状态动态选择执行路径。路由可以通过LLM、规则、嵌入或机器学习模型实现,应用于客户服务、数据处理和多代理协调等场景。文章提供了LangChain和Google ADK的代码示例,展示了路由的具体实现方式。路由是构建自适应、上下文感知代理系统的关键技术。

Chapter 2: Routing

第3章:并行化

本章介绍并行化模式,用于同时执行多个独立任务以提高代理系统效率。通过识别工作流中不相互依赖的组件,并行执行可显著减少总体延迟,特别适用于涉及外部API调用、数据处理和多源信息收集的场景。文章详细说明了LangChain和Google ADK框架中的并行实现方法,包括代码示例和实际应用案例,强调并行化在优化复杂代理工作流性能中的关键作用。

Chapter 3: Parallelization

第4章:反思

本章介绍了反思模式,这是一种让智能体通过自我评估和改进来提高输出质量的机制。反思模式通过执行、评估、改进的反馈循环实现,可采用生产者-批评者模型分离职责。该模式适用于代码生成、内容创作、问题解决等需要高质量输出的场景,但会增加计算成本和延迟。文章提供了LangChain和Google ADK的代码示例,展示了如何实现反思循环。

Chapter 4: Reflection

第5章:工具使用(函数调用)

本章详细介绍了工具使用模式,这是让智能体与外部系统交互的关键技术。通过函数调用机制,智能体能够调用外部API、数据库和服务,突破LLM训练数据的限制。文章涵盖了工具使用的完整流程、实际应用场景,并提供了LangChain、CrewAI和Google ADK三个框架的实践代码示例。工具使用模式将语言模型从文本生成器转变为能够在数字或物理世界中感知、推理和行动的智能体。

Chapter 5: Tool Use (Function Calling)

第6章:规划

本章详细介绍了AI中的规划模式,即代理系统将复杂目标分解为可执行步骤序列的能力。规划使AI从被动响应转向主动策略制定,具备适应性和灵活性。文章涵盖规划模式概述、实际应用案例,并通过Crew AI、Google DeepResearch和OpenAI Deep Research API等具体实现展示了规划在任务自动化、信息合成和研究中的关键作用。规划模式是处理多步骤复杂任务的核心方法,将高级目标转化为结构化行动计划。

Chapter 6: Planning

第7章:多智能体协作

本章详细介绍了多智能体协作模式,通过将复杂任务分解为子问题并由专业智能体协作解决,克服了单体智能体的局限性。文章阐述了多种协作形式(顺序交接、并行处理、辩论共识等)和通信结构(网络、监督者、层次结构等),并提供了Crew AI和Google ADK的实践代码示例。该模式适用于复杂研究、软件开发、金融分析等多个领域,能够实现协同效应,解决单个智能体无法处理的复杂问题。

Chapter 7: Multi-Agent Collaboration

第8章:内存管理

本章深入探讨智能代理系统中的内存管理,区分短期内存(上下文窗口内的临时信息)和长期内存(跨会话的持久知识)。介绍了Google ADK的Session、State和MemoryService组件,以及LangChain/LangGraph的内存工具。涵盖实际应用场景如对话AI、任务代理和个性化体验,强调内存管理对于代理维护上下文、学习和适应的重要性。

Chapter 8: Memory Management

第9章:学习与适应

本章探讨AI代理的学习与适应机制,涵盖强化学习、监督学习、无监督学习等多种方法。重点介绍了PPO和DPO算法原理,以及SICA自改进编码代理的案例,展示代理如何通过修改自身代码实现性能提升。同时分析了AlphaEvolve和OpenEvolve等系统在算法发现和代码优化中的应用。学习与适应使AI代理能够在动态环境中自主改进,实现个性化服务和持续性能优化。

Chapter 9: Learning and Adaptation

第10章:模型上下文协议

模型上下文协议(MCP)是一个开放标准,为LLM与外部系统交互提供标准化接口。它采用客户端-服务器架构,使LLM能够访问外部资源、工具和数据源。MCP支持动态发现能力,促进不同系统间的互操作性。与专有的工具函数调用相比,MCP提供更广泛的框架,支持复杂工作流编排、数据库集成、生成媒体服务和物联网控制等应用。通过ADK和FastMCP等工具,开发者可以轻松创建和使用MCP服务器,构建超越文本生成的智能AI代理系统。

Chapter 10: Model Context Protocol

第11章:目标设定与监控

本章介绍AI智能体中的目标设定与监控模式,强调该模式如何使智能体从被动反应转变为主动目标导向系统。通过定义明确目标并建立监控机制,智能体能够自主执行多步骤任务、跟踪进展并适应动态环境。文章提供了实际应用案例和代码示例,说明如何实现迭代式代码生成与自我评估,同时指出多智能体协作可提高评估客观性。该模式是构建可靠自主AI系统的关键基础。

Chapter 11: Goal Setting and Monitoring

第12章:异常处理与恢复

本章介绍了AI智能体的异常处理与恢复模式,该模式对于构建可靠、有弹性的智能体至关重要。文章详细阐述了错误检测、处理和恢复的三个关键阶段,包括日志记录、重试、回退、优雅降级等策略。通过客户服务聊天机器人、金融交易、智能家居等多个实际应用场景,展示了该模式在现实世界中的重要性。代码示例说明了如何使用分层方法实现强大的位置检索系统。该模式确保AI智能体在面临不可预测的故障和异常时仍能保持操作完整性,提高系统的可靠性和适应性。

Chapter 12: Exception Handling and Recovery

第13章:人在回路

本章深入探讨了人在回路(HITL)模式,这是一种将人类智能与AI系统相结合的关键策略。HITL通过在AI工作流中整合人类监督、干预和反馈,确保系统在复杂、高风险场景中的安全性、道德性和有效性。该模式涵盖人类监督、干预纠正、反馈学习、决策增强、人机协作和升级策略等关键方面。虽然HITL存在可扩展性限制和依赖专家等挑战,但在内容审核、自动驾驶、金融欺诈检测等领域的应用证明了其重要价值。通过代码示例展示了ADK框架如何实现HITL机制,强调了人类价值观在AI系统设计中的核心地位。

Chapter 13: Human-in-the-Loop

第14章:知识检索(RAG)

本文系统介绍了知识检索(RAG)技术,这是一种增强大型语言模型能力的重要模式。RAG通过让LLM在生成响应前访问外部知识库,解决了其训练数据静态性的限制。文章详细阐述了RAG的核心概念包括嵌入、语义相似性、文档分块和向量数据库,并介绍了图RAG和智能体RAG等高级变体。通过实际代码示例展示了在Google ADK和LangChain中的实现方法。RAG广泛应用于企业搜索、客户支持等领域,显著提高了AI响应的准确性和可信度。

Chapter 14: Knowledge Retrieval (RAG)

第15章:智能体间通信(A2A)

本文介绍了Google的智能体间通信(A2A)协议,这是一个开放标准,旨在解决不同AI智能体框架之间的协作问题。A2A通过智能体卡片实现自动发现,支持同步、异步、流式等多种交互模式,确保安全通信。协议核心包括任务管理、消息传递和上下文维护,能够构建模块化、可扩展的多智能体系统。与MCP协议互补,A2A专注于智能体间协调和任务委派,得到多家科技公司支持,为复杂AI应用开发提供了标准化解决方案。

Chapter 15: Inter-Agent Communication (A2A)

第16章:资源感知优化

本章介绍资源感知优化技术,使智能代理能够动态管理计算、时间和财务资源。通过多代理架构实现高效运作,包括路由器代理根据查询复杂度选择合适模型(如Gemini Flash处理简单查询,Gemini Pro处理复杂任务),批评代理提供反馈优化系统。关键技术包括动态模型切换、自适应工具选择、上下文修剪等,确保在预算和性能约束下平衡响应质量与成本效益。

Chapter 16: Resource-Aware Optimization

第17章:推理技术

本章系统介绍了智能代理的高级推理技术,包括思维链(CoT)、思维树(ToT)、自我纠正、程序辅助语言模型(PALMs)、ReAct框架等核心方法。这些技术通过多步逻辑推理、问题分解和外部工具集成,显著提升代理处理复杂任务的能力。文章还探讨了扩展推理定律、深度研究应用、多代理系统优化(MASS框架)等关键概念,为构建自主、可靠的AI代理提供了完整的技术框架和实践指导。

Chapter 17: Reasoning Techniques

第18章:护栏/安全模式

本章详细介绍了AI代理中的护栏(安全模式)机制,包括其定义、重要性及多层次实施方法。护栏通过输入验证、输出过滤、行为约束、工具限制和人类监督等方式确保代理安全、合规运行。文章提供了CrewAI和Vertex AI的实际代码示例,展示了如何构建内容策略执行器和工具调用验证机制。同时强调了工程化可靠代理需遵循模块化设计、深度可观察性、最小权限等软件工程原则,以构建生产级AI系统。

Chapter 18: Guardrails/Safety Patterns

第19章:评估与监控

本章系统阐述了智能代理的评估与监控方法论,涵盖性能跟踪、A/B测试、合规审计等实际应用。通过代码示例展示了响应准确性评估、延迟监控和令牌使用跟踪等关键技术。重点分析了代理轨迹评估的重要性,并提出了从简单代理向高级"承包商"演进的框架,强调正式合同、动态谈判、质量迭代和任务分解四大支柱。最后介绍了Google ADK的三种评估方法,为构建可靠、可问责的智能代理系统提供了完整解决方案。

Chapter 19: Evaluation and Monitoring

第20章:优先级排序

本文介绍了AI智能体在复杂环境中使用的优先级排序模式。该模式通过建立评估标准(紧急性、重要性、依赖性等)来帮助智能体有效管理多个任务和目标,确保资源集中在最关键的活动上。文章详细阐述了优先级排序的基本要素、实际应用场景,并通过LangChain代码示例展示了项目管理系统中的具体实现。优先级排序使智能体能够动态适应环境变化,提高决策效率和系统稳健性。

Chapter 20: Prioritization

第21章:探索与发现

本章探讨AI智能体的探索与发现模式,使智能体能够主动寻找新信息、发现未知可能性。该模式在科学研究、游戏策略、市场分析等领域有广泛应用。重点介绍了Google联合科学家系统,采用多智能体框架进行假设生成、评估和进化,已在生物医学研究中取得验证成果。还分析了Agent Laboratory框架,通过教授、博士后、评审等角色分工实现自主科学研究。该模式对于开放复杂环境中的创新发现至关重要。

Chapter 21: Exploration and Discovery

About

《Agentic Design Patterns》中文摘要及向量化

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published