AI大模型应用、Agent开发及垂直模型微调

AI大模型应用、Agent开发及垂直模型微调
    马上咨询

    老师介绍

    杜云飞  阿里云MVP,业界资深技术专家

    • 从事开发和架构工作近10年,拥有微服务、分布式高并发、大数据平台系统架构经验(Java线),也曾主导多数据分析、机器学习类产品开发(Python线),曾担任多家公司CTO、合伙人,负责研发线所有产品技术架构、团队管理等工作,开发了多款金融、风控大数据、区块链、数字资产等产品。
    • 曾出版技术书籍《Akka实战:快速构建高可用分布式应用》,受到多位业界知名技术专家联名推荐作序,该书是国内首本原创相关书籍。翻译出版《软件开发实践:项目驱动式的Java开发指南》。
    • 《AI大模型应用开发与模型微调》出版中(清华大学出版社)。
    • 现为某三方支付公司研发负责人兼首席架构师,负责整体技术战略及架构设计,同时负责公司AI创新产品的研究与落地。

    课程简介

    每当有新技术突破的时候,最流行的句式是“所有业务都可以用XX实现一遍”。AI大模型的突破,让所有人再次跃跃欲试。作为工程师,我们有机会站在驱动业务重构的最前沿,这里面有巨大的机会。在以传统机器学习为代表的类AI阶段,大家在技术层面往往会陷入语言/库之争,Python作为AI的门面语言,受到了极大关注,但同时也让非Python的工程师陷入两难:我要放弃现有的技术栈么?大模型的突破,让这一切不是问题。首先,AI大模型在应用层,API极为简单,对于有其他语言经验的工程师来讲并非难事。其次,过去的机器学习等知识体系,在大模型时代已没有特别大的必要去深入了(当然,了解更好)。过去在了解部分底层算法的前提下做调参,而现在调好prompt就可以了(当然,要用好它也不容易)。目前各家语言平台都在快速跟进对AI的支持,比如Java方面,SpringAI提供了对AI Agent开发的支持。整体来说,AI产品开发和传统产品开发,最核心的点是:设计/开发/测试模式的变化。要理解这一点,必需先了解AI大模型本身的特点,及周边的生态。

    本次课程将从AI大模型行业现状、行业典型案例及实现、AI发展路线图、大模型核心逻辑、Prompt工程及调优、AI Agent开发、开源大模型微调及推理等多个方面,从概念+实践的角度去学习最前沿的AI Agent知识,从0打造AI时代的全栈护城河,为企业落地AI做好技术准备。

    培训对象

    1. 适合想进入AI领域,或者利用AI提升工作效能的工程师。
    2. 适合想开发AI产品,或者使用开源大模型构建垂直业务模型的工程师。
    3. 适合想更全面判断AI趋势、或者利用AI为现有业务赋能的技术管理者。

    课程大纲

    引子:AI大模型通识、生态与发展;Prompt工程与应用、AI Agent应用开发、开源大模型微调与推理等

    第一单元  AI大模型通识

    该单元主要介绍AI大模型概念、生态、以及当前发展情况。

    • AI大模型通识
      • 大模型的定义与特点
      • 大模型的分类与应用
      • 大模型的底层工作原理
      • 开源 vs 闭源大模型
      • Token模式与定价
      • 大模型的核心技术
    • AI大模型生态及发展
      • 国内外主流大模型介绍
      • AI+赋能场景案例介绍

    第二单元  Prompt应用、模式与工程

    该单元主要讲解大模型的核心逻辑、Prompt/API工程实践

    • Prompt工程与实践
      • Prompt核心要素与案例
      • Prompt在电商中的应用
      • Prompt常见思维框架
      • 如何理解思维链 vs 思维树
      • Prompt的攻击/安全问题
      • Prompt工程≈软件工程

    第三单元  AI Agent产品设计理论与模式

    全面掌握AI Agent产品设计中的最前沿知识点,这里面包含大模型生态最新的业务模式、Agent开发中常用工程范式等。

    • Agent智能体及应用案例
      • AI Agent是什么?
      • 代码即软件公司:MetaGPT
      • 全球首位AI工程师:Devin
      • 斯坦福小镇的秘密
    • AI Agent产品设计理论与模式
      • AI Agent产品模式与架构
      • 企业落地的关注点:Memory与Tools
      • 在MCP中找到生态位
      • AI Agent产品设计的一般流程
      • 大模型选型需要考量的那些点
      • 基于ReAct的Prompt工程范式
      • Agentic与Human in the loop
      • 从Copilot/Cursor中学习Agent设计

    第四单元  AI Agent应用开发实战

    该单元主要介绍目前最常见的Agent应用开发模式、框架与落地应用。
    • AI Agent工程与案例
      • Prompt工程论述
      • Agent应用模式与架构
      • 案例:斯坦福小镇
    • Agent应用开发实践
      • 快速实现一个Chat程序
      • 核心参数列表
        • model参数
        • 角色与指令
      • 实现多轮对话
      • Function Calling机制
      • 实现智能客服助手
      • 数据与函数准备
      • 工具(函数)调用
      • 缓解幻觉问题
    • 大模型开发框架LangChain
      • LangChain介绍
      • LangChain概念与组件
      • LangChain安装与配置
      • LangChain表达式语言:LCEL
      • LangServe服务部署及LangSmith观测与治理
      • 使用LangChain构建数据分析Agent
      • 使用LangGraph构建/编排复杂Agent工作流
      • MCP深度解读及编码实践
    • 从零搭建基于知识库的商品助手
      • 知识库是什么?
      • 理解RAG与Embedding
      • 向量数据库与语义检索
      • 搭建基于知识库的智能商品助手
    • AI Agent工具搭建与编排
      • 使用Dify平台搭建Agent应用
      • 使用Coze平台搭建Agent工作流

    第五单元  开源大模型及微调/推理方案

    该单元主要介绍目前市面上主流的开源大模型方案,如Llama3、ChatGLM、DeepSeek、Qwen等。

    • 开源大模型:垂直模型的基座
      • 开源大模型串讲:Llama3、ChatGLM3/4、Qwen、DeepSeek
      • 快速搭建本地开源模型环境(ollama+openwebui)
      • Hugging Face:AI界的Github
      • 开源微调:构建基于垂直行业的私有大模型(基于PEFT/LoRA、Llama-Factory)
      • 数据集类型与构建(Easy-DataSet)
      • 基于vLLM搭建模型推理服务
      • 基于开源模型构建Agent应用
      • 多模态大模型(视觉理解/目标检测)
      • 延展:GPU/显卡、LPU推理引擎等交付资源选型。