老师介绍
杜云飞 阿里云MVP,业界资深技术专家
- 从事开发和架构工作近10年,拥有微服务、分布式高并发、大数据平台系统架构经验(Java线),也曾主导多数据分析、机器学习类产品开发(Python线),曾担任多家公司CTO、合伙人,负责研发线所有产品技术架构、团队管理等工作,开发了多款金融、风控大数据、区块链、数字资产等产品。
- 曾出版技术书籍《Akka实战:快速构建高可用分布式应用》,受到多位业界知名技术专家联名推荐作序,该书是国内首本原创相关书籍。翻译出版《软件开发实践:项目驱动式的Java开发指南》。
- 《AI大模型应用开发与模型微调》出版中(清华大学出版社)。
- 现为某三方支付公司研发负责人兼首席架构师,负责整体技术战略及架构设计,同时负责公司AI创新产品的研究与落地。
课程简介
每当有新技术突破的时候,最流行的句式是“所有业务都可以用XX实现一遍”。AI大模型的突破,让所有人再次跃跃欲试。作为工程师,我们有机会站在驱动业务重构的最前沿,这里面有巨大的机会。在以传统机器学习为代表的类AI阶段,大家在技术层面往往会陷入语言/库之争,Python作为AI的门面语言,受到了极大关注,但同时也让非Python的工程师陷入两难:我要放弃现有的技术栈么?大模型的突破,让这一切不是问题。首先,AI大模型在应用层,API极为简单,对于有其他语言经验的工程师来讲并非难事。其次,过去的机器学习等知识体系,在大模型时代已没有特别大的必要去深入了(当然,了解更好)。过去在了解部分底层算法的前提下做调参,而现在调好prompt就可以了(当然,要用好它也不容易)。目前各家语言平台都在快速跟进对AI的支持,比如Java方面,SpringAI提供了对AI Agent开发的支持。整体来说,AI产品开发和传统产品开发,最核心的点是:设计/开发/测试模式的变化。要理解这一点,必需先了解AI大模型本身的特点,及周边的生态。
本次课程将从AI大模型行业现状、行业典型案例及实现、AI发展路线图、大模型核心逻辑、Prompt工程及调优、AI Agent开发、开源大模型微调及推理等多个方面,从概念+实践的角度去学习最前沿的AI Agent知识,从0打造AI时代的全栈护城河,为企业落地AI做好技术准备。
培训对象
- 适合想进入AI领域,或者利用AI提升工作效能的工程师。
- 适合想开发AI产品,或者使用开源大模型构建垂直业务模型的工程师。
- 适合想更全面判断AI趋势、或者利用AI为现有业务赋能的技术管理者。
课程大纲
引子:AI大模型通识、生态与发展;Prompt工程与应用、AI Agent应用开发、开源大模型微调与推理等 |
第一单元 AI大模型通识 该单元主要介绍AI大模型概念、生态、以及当前发展情况。 |
- AI大模型通识
- 大模型的定义与特点
- 大模型的分类与应用
- 大模型的底层工作原理
- 开源 vs 闭源大模型
- Token模式与定价
- 大模型的核心技术
- AI大模型生态及发展
|
第二单元 Prompt应用、模式与工程 该单元主要讲解大模型的核心逻辑、Prompt/API工程实践 |
- Prompt工程与实践
- Prompt核心要素与案例
- Prompt在电商中的应用
- Prompt常见思维框架
- 如何理解思维链 vs 思维树
- Prompt的攻击/安全问题
- Prompt工程≈软件工程
|
第三单元 AI Agent产品设计理论与模式 全面掌握AI Agent产品设计中的最前沿知识点,这里面包含大模型生态最新的业务模式、Agent开发中常用工程范式等。 |
- Agent智能体及应用案例
- AI Agent是什么?
- 代码即软件公司:MetaGPT
- 全球首位AI工程师:Devin
- 斯坦福小镇的秘密
- AI Agent产品设计理论与模式
- AI Agent产品模式与架构
- 企业落地的关注点:Memory与Tools
- 在MCP中找到生态位
- AI Agent产品设计的一般流程
- 大模型选型需要考量的那些点
- 基于ReAct的Prompt工程范式
- Agentic与Human in the loop
- 从Copilot/Cursor中学习Agent设计
|
第四单元 AI Agent应用开发实战 该单元主要介绍目前最常见的Agent应用开发模式、框架与落地应用。 |
- AI Agent工程与案例
- Prompt工程论述
- Agent应用模式与架构
- 案例:斯坦福小镇
- Agent应用开发实践
- 快速实现一个Chat程序
- 核心参数列表
- 实现多轮对话
- Function Calling机制
- 实现智能客服助手
- 数据与函数准备
- 工具(函数)调用
- 缓解幻觉问题
- 大模型开发框架LangChain
- LangChain介绍
- LangChain概念与组件
- LangChain安装与配置
- LangChain表达式语言:LCEL
- LangServe服务部署及LangSmith观测与治理
- 使用LangChain构建数据分析Agent
- 使用LangGraph构建/编排复杂Agent工作流
- MCP深度解读及编码实践
- 从零搭建基于知识库的商品助手
- 知识库是什么?
- 理解RAG与Embedding
- 向量数据库与语义检索
- 搭建基于知识库的智能商品助手
- AI Agent工具搭建与编排
- 使用Dify平台搭建Agent应用
- 使用Coze平台搭建Agent工作流
|
第五单元 开源大模型及微调/推理方案 该单元主要介绍目前市面上主流的开源大模型方案,如Llama3、ChatGLM、DeepSeek、Qwen等。
|
- 开源大模型:垂直模型的基座
- 开源大模型串讲:Llama3、ChatGLM3/4、Qwen、DeepSeek
- 快速搭建本地开源模型环境(ollama+openwebui)
- Hugging Face:AI界的Github
- 开源微调:构建基于垂直行业的私有大模型(基于PEFT/LoRA、Llama-Factory)
- 数据集类型与构建(Easy-DataSet)
- 基于vLLM搭建模型推理服务
- 基于开源模型构建Agent应用
- 多模态大模型(视觉理解/目标检测)
- 延展:GPU/显卡、LPU推理引擎等交付资源选型。
|