
大纲
- 前言:介绍人工智能时代Agent技术的崛起,阐述其在连接复杂任务中的关键作用,引出本书对Agent技术的探索。
- 第1章 何谓Agent,为何Agent
- 大开脑洞的演讲:介绍生命的三个阶段,探讨人工智能在通往life 3.0中的关键作用,引出Agent的概念。
- Agent的定义与特性:给出Agent的定义,即具有自主性、适应性、交互性和功能性的人工智能系统,并通过实例解释其特性。
- Agent的大脑:分析大模型对Agent发展的推动作用,介绍大模型的通用推理能力以及相关的技术框架。
- Agent的感知力与行动力:阐述Agent的语言交互、多模态、语言输出和工具使用等能力,以及具身智能的实现。
- Agent对各行业的影响:探讨Agent在自动办公、客户服务、个性化推荐等行业的应用潜力和挑战。
- Agent带来的变革:分析Agent对商业模式的影响,包括新的预测、服务模式、协作方式等。
- 小结:总结Agent的定义、特性和重要性,强调其对未来社会的潜在影响。
- 第2章 基于大模型的Agent技术框架
- Agent的四大要素:介绍Agent架构中的规划、记忆、工具和执行四大要素及其相互关系。
- Agent的规划和决策能力:探讨任务分解、结合外部规划器和自我反思等规划技术,重点介绍ReAct框架。
- Agent的记忆机制:分析大模型形成记忆的多种机制,包括预训练、上下文互动、微调等。
- Agent的核心技能:阐述调用工具对Agent的重要性,以及面临的挑战和应对策略。
- Agent的推理引擎:详细介绍ReAct框架的原理、实现流程和应用示例。
- 其他Agent认知框架:简要介绍函数调用、计划与执行等其他Agent认知框架。
- 小结:总结Agent技术框架的关键要素和重要框架,强调其对Agent开发的指导意义。
- 第3章 OpenAI API、LangChain和LlamaIndex
- OpenAI API:介绍OpenAI公司的发展历程和OpenAI API的应用,通过示例展示其使用方法。
- LangChain:讲解LangChain的功能、优势和开发环境,介绍其六大模块和Agent开发的相关内容。
- LlamaIndex:阐述LlamaIndex的特点和在RAG技术方面的应用,通过示例展示其开发过程。
- 小结:总结这三种工具的特点和作用,强调它们在Agent开发中的协同和竞争关系。
- 第4章 Agent 1:自动化办公的实现——通过Assistants API和DALL·E 3模型创作PPT
- OpenAI公司的Assistants:介绍Assistants的功能和特点,以及在Playground中的使用方法。
- Assistants API的使用:通过示例展示如何使用Assistants API创建助手、线程,添加消息并运行助手。
- 创建PPT:详细介绍使用Assistants API和DALL·E 3模型制作PPT的全过程。
- 小结:总结利用Assistants API和DALL·E 3模型实现自动化办公的优势和流程。
- 第5章 Agent 2:多功能选择的引擎——通过Function Calling调用函数
- OpenAI中的Functions:介绍Functions的概念、作用和定义方法,以及Function Calling的流程。
- 在Playground中定义Function:通过示例展示在Playground中定义Function的过程和注意事项。
- 通过Assistants API实现Function Calling:详细介绍使用Assistants API实现Function Calling的步骤和代码示例。
- 通过ChatCompletion API来实现Tool Calls:通过示例展示使用ChatCompletion API实现Tool Calls的过程和代码示例。
- 小结:总结Function Calling的功能和应用场景,强调其对Agent智能行为的提升作用。
- 第6章 Agent 3:推理与行动的协同——通过LangChain中的ReAct框架实现自动定价
- 复习ReAct框架:回顾ReAct框架的原理和在解决问题中的优势。
- LangChain中ReAct Agent的实现:介绍LangChain中ReAct Agent的实现要素和工作流程。
- LangChain中的工具和工具包:介绍LangChain支持的工具和工具包,以及如何为Agent分配工具。
- 通过create_react_agent创建鲜花定价Agent:通过示例展示使用create_react_agent创建鲜花定价Agent的过程和结果。
- 深挖AgentExecutor的运行机制:深入分析AgentExecutor的运行机制,包括断点设置和调试过程。
- 小结:总结ReAct框架在LangChain中的应用和优势,强调其对Agent推理和决策能力的提升。
- 第7章 Agent 4:计划和执行的解耦——通过LangChain中的Plan-and-Execute实现智能调度库存
- Plan-and-Solve策略的提出:介绍Plan-and-Solve策略的背景和原理,以及与其他认知框架的对比。
- LangChain中的Plan-and-Execute Agent:讲解LangChain中Plan-and-Execute Agent的架构和工作原理。
- 通过Plan-and-Execute Agent实现物流管理:通过示例展示使用Plan-and-Execute Agent实现鲜花智能调度的过程和效果。
- 从单Agent到多Agent:探讨Plan-and-Execute框架在多Agent系统中的应用和优势。
- 小结:总结Plan-and-Execute框架的特点和优势,强调其在处理复杂任务时的有效性。
- 第8章 Agent 5:知识的提取与整合——通过LlamaIndex实现检索增强生成
- 检索增强生成:介绍RAG的概念、工作原理和优势,以及与其他大模型应用方法的对比。
- RAG和Agent:阐述RAG与Agent的关联,以及融合RAG能力的Agent的优势。
- 通过LlamaIndex的ReAct RAG Agent实现花语秘境财报检索:通过示例展示使用LlamaIndex的ReAct RAG Agent进行财报检索的过程和效果。
- 小结:总结RAG技术在Agent中的应用和优势,强调其对提升Agent处理复杂查询能力的作用。
- 第9章 Agent 6:GitHub的网红聚落——AutoGPT、BabyAGI和CAMEL
- AutoGPT:介绍AutoGPT的简介和实战,分析其优势和面临的挑战。
- BabyAGI:讲解BabyAGI的简介和工作流程,通过实战展示其功能。
- CAMEL:(文档中此部分未详细展开,可根据实际情况补充或保留此标题占位)
- 小结:总结这几种网红Agent的特点和应用场景,强调它们对AI技术发展的推动作用。
- 第10章 Agent 7:多Agent框架——AutoGen和MetaGPT(文档中此部分未详细展开,可根据实际情况补充或保留此标题占位)
- 附录A 下一代Agent的诞生地:科研论文中的新思路(文档中此部分未详细展开,可根据实际情况补充或保留此标题占位)
- 参考文献:列出本书引用的参考文献。
- 后记:总结Agent技术的创新与变革意义,展望其未来发展前景。
中心思想
本书围绕人工智能Agent技术展开,深入探讨了其概念、技术框架、开发工具以及在多个领域的应用实践。通过详细阐述Agent的定义、特性和核心能力,如大模型的通用推理能力、感知力和行动力等,展示了Agent在人工智能领域的重要地位和潜力。同时,介绍了基于大模型的Agent技术框架,包括规划、记忆、工具和执行等要素,以及ReAct等关键认知框架。通过OpenAI API、LangChain和LlamaIndex等开发工具的介绍和实战案例,展示了如何构建和应用Agent。此外,通过多个具体的Agent实例,如自动化办公、多功能选择、推理定价、智能调度库存和知识检索整合等,展示了Agent在不同场景下的应用和优势。最后,探讨了Agent技术的未来发展趋势和面临的挑战,强调了其对社会和经济的潜在影响,为读者全面了解Agent技术提供了丰富的知识和实践指导。
电子书下载地址:
通过网盘分享的文件:动手做Ai Agent.pdf等2个文件
链接: https://pan.baidu.com/s/1zbkt3ZLuKvLH0zB2__yJkQ 提取码: tvrb
