Deep Dive in AI Agent 大模型时代的AI智能体

Deep Dive in AI Agent 大模型时代的AI智能体
    马上咨询


    讲师介绍:黄佳 

    •  入行20余年。参与过政府部门、银行、电商、能源等多领域大型项目,积累了极为丰富的人工智能和大数据项目实战经验。近年主攻方向为 NLP 预训练大模型应用、FinTech 应用、持续学习。目前正与 PlatoX.AI展开富有前景的技术合作。
    • 曾出版《GPT图解 大模型是怎样构建的》《数据分析咖哥十话》《零基础学机器学习》《SAP 程序设计》等多本畅销书,即将出版的书籍还有《GPT实战Agent是怎样实现的》。同时,在极客时间开设专栏《零基础实战机器学习》《LangChain 实战课》,在深蓝学院开设视频课程《生成式预训练语言模型:理论与实战》。
    • 近期出版的新书《大模型应用开发动手做 AI Agent》上市一周,在京东,当当位居IT图书榜第一名。


    课程介绍

    • Agent是大语言模型时代AI 应用开发的主要范式。本次分享将从大语言模型驱动的 AI Agent 出发,阐明 Agent 在生成式 AI 时代的定位与价值,剖析其主流思维框架;重点对比 LangChain、LangGraph、LlamaIndex Agent、CrewAI、AutoGen,以及 DiFY、Coze 等低代码平台的架构特性与适用场景,为不同需求下的 Agent 开发提供选型参考。
    • 同时还会进行 Agentic RAG 框架的实战演示,展示如何构建高效检索与自我反思型问答系统,并深入探讨多 Agent 系统的协作价值。随着AI生态的不断进展,我们有必要聚焦 MCP 与 A2A 协议,揭示它们如何助力 Agent 完成工具调用与跨 Agent 通信,并展望 AI Agent 生态的未来发展方向。


    课程大纲

    用LangGraph实现Retrieval Agent
    Part 1: 大语言模型驱动的Agent
    • 如何定义大语言模型时代的AI Agent
    • Agent的5个发展层级
    • Agent设计过程中的核心概念:工具、规划、记忆、执行、协作。
    • CoT,ReAct, Plan&Execute, Self-Ask等 Agent思维框架
    Part 2:主流Agent开发框架的介绍的比较
    • LangChain,LangGraph,LlamaIndex Agent,CrewAI和AutoGen
    • DiFY,   Coze等低代码Agent开发平台的特点
    • 各种Agent开发框架所适用的应用场景之比较。
    Part 3(重点):Agent落地实战实操(动手制作智能体)
    • 用 Coze 平台实现:AI 新股情报分析师智能体
      • 场景简介
        • 智能体专注于全球新股领域,能够实时抓取招股书、研报和新闻,结合RAG技术生成简明扼要的投资情报摘要。
      • 教学目标
        • 了解 Coze 平台低代码创建 Agent 的流程
        • 使用 Coze 接入第三方数据源(如招股书PDF、金融研报API)
        • 基于 Coze 的“Function+Memory”系统实现文档解析与多轮对话
        • 设计消息流结构,使用户能够提问如“这家公司最大的风险是什么?”等问题,并获得结构化答案
        • 展示如何在 Coze 中嵌入多文档RAG能力
        • 实现“财务数据提取 + 风险提示+ 投资摘要”的全流程输出
    • 用 LangGraph 平台实现:货币兑换助手智能体
      • 场景简介
        • 该智能体接受用户自然语言请求,自动调用实时汇率接口、及语言翻译功能,完成复杂链式任务。
      • 教学目标
        • 掌握 LangGraph 中定义状态节点与多分支逻辑的方式
        • 利用 LangGraph 实现“获取汇率 → 判断用户币种 → 计算转换结果 → 输出结果”自动任务流
        • 集成工具(Tool)调用与上下文记忆机制,实现复杂意图拆解与动态决策
        • 展示如何用 LangGraph 编排多个子任务,构建可自我演进的多功能助手
        • 教学多Agent协作流中的“条件分支控制”、“子任务复用”设计模式
    • 用 OpenAI Assistant API 实现:办公自动化智能体
      • 场景简介
        • 企业用户的日常任务(写日报、整理邮件、生成会议纪要、安排日程)由该智能体自动完成,提升工作效率。
      • 教学目标
        • 理解 OpenAI Assistant 中“function calling +      file tool + thread memory”的应用机制
        • 通过 Assistant API 实现用户上传会议录音后,自动生成摘要和待办事项
        • 演示如何构建多轮对话的工作助手,包括用户偏好记忆、自动分类、上下文理解等
        • 展现 Assistant 平台原生RAG能力及文件/代码分析能力
        • 构建一个“多文档处理 + 自动完成任务”的办公小助理原型
    • 通过 MCP 实现:金融文档检索 RAG 智能体
      • 场景简介
        • 在金融风控或投研场景中,企业用户希望通过自然语言快速查询金融政策、财报、评级报告等结构化与非结构化数据。
      • 教学目标
        • 理解 MCP(Model Context Protocol)的协议机制与资源调用方式
        • 构建一个支持“PDF解析 + 数据库查询+ 实时接口调用”的统一Agent服务
        • 通过 MCP 实现模型可控的工具调用与信息检索流程
        • 支持“可溯源”的RAG问答系统,返回原始文件片段与摘要
        • 教学如何用 FastMCP 快速创建一个金融智能体后端服务,适配 Claude、GPT 等不同模型客户端
    • 通过 A2A 实现:多智能体协作助手系统
      • 场景简介
        • 构建一个面向企业的智能协同平台,支持多个角色型智能体(如法务Agent、财务Agent、秘书Agent)共同协作处理任务,如合同审批、项目预算评估、会议协调等。
      • 教学目标
        • 了解 Google A2A(Agent-to-Agent)协议的核心思想和消息格式(A2A Task)
        • 学会使用 CrewAI、LangGraph 等工具创建 A2A Server 与 Client
        • 实现任务拆分、并行调用、结果聚合等多智能体协作机制
        • 展示智能体之间如何进行意图协商、子任务委派与结果整合
        • 教学智能体“平台即服务”的部署方式,使每个智能体可注册、可发现、可远程复用
        • 分析任务调度中的关键问题,如依赖管理、容错处理与上下文共享
    Part 4: 多Agent系统框架 - 协作式AI
    • 多Agent系统的价值:大型复杂任务的分解与协作
    • AutoGen:Agent自主生成子Agent执行子任务
    • MetaGPT:将任务分解为函数,动态创建Agent执行
    • 构建多Agent系统执行复杂任务
    Part 5: MCP和A2A时代的Agent
    • MCP协议助力Agent完成工具调用
    • A2A 协议要点与消息传递流程
    • 代理间通信与多代理协作
    • AI Agent未来生态发展之展望