AI大模型工程化项目实战-破解企业AI落地难题的实战指南

AI大模型工程化项目实战-破解企业AI落地难题的实战指南
    马上咨询


    讲师介绍

    讲师最近几年带队完成了数十个AI项目,内容不仅包括深度学习、机器学习、数据挖掘等具体技术要点,也包括AI的整体发展、现状、应用、商业价值、未来方向等,涵盖内容非常丰富。完成多个深度学习实践项目,广泛应用于医疗、交通、银行、电信等多个领域。从2022年推出的多门课程《AI大模型赋能行业应用与解决方案》《AI 大模型辅助软件研发管理与效能提升》和《AI大模型技术及开发应用实践》更是广受欢迎,已经为几十家企业培训,作为一名AI技术专家,对人工智能的理解深入透彻。他不仅精通AI的编程技术,还熟悉各种AI工具的使用,尤其在AI行业应用更是有着独特的见解和实践经验;自从2023年以来帮助多家研发中心做AI辅助开发效能提升咨询服务。同时也是微软人工智能认证架构师,阿里云AI人工智能训练师。在人工智能领域的深耕和创新,也得到了出版社的青睐,计划出版自己的著作。也在多家技术大会做AI技术应用讲座.

    为什么需要该课程

    大模型开发已进入工程化时代,仅会调API远远不够!企业需要能构建Agent智能体、RAG系统等落地应用的工程化人才。本课程聚焦实战,带你掌握LangChain、LangGraph等主流开发框架,从零搭建高可用AI系统,解决企业级场景中的复杂问题。

    • 为什么学?
       行业进入应用交付期,企业急需能快速集成大模型能力的开发者,招聘门槛显著提升,熟悉工程化框架已成核心要求。
    • 学什么?
      覆盖Agent设计、RAG优化、流程编排等实战技能,通过真实项目演练,让你具备从开发到部署的全链路能力。
    • 适合谁?
      希望进入大模型主力战场的中高级开发者,或需突破技术瓶颈的AI从业者。拒绝纸上谈兵,只教真功夫!

    本课程为大模型应用开发人员提供了一份清晰、全面的“可用知识”,带领大家快速了解DeepSeek和API,同时对比OpenAI和国内多个其他大模型(文心,智谱,千问等)的工作原理及优势,并在此基础上使用流行的编程语言构建大模型应用。通过课程,你不仅可以学会如何构建文本生成、问答和内容摘要等初阶大模型应用,还能了解到提示工程、模型微调、插件、LangChain,RAG,Agent等高阶实践技术。课程提供了简单易学的示例,帮你理解并应用在自己的项目中。

    你可以参加吗?

    • 各类软件企业和研发中心的程序员、软件设计师、架构师, 项目经理,架构师。
    • 本课程面向零基础LLM应用开发者,不需要了解复杂数学算法,机器学习原理,不需要之前学习过大模型知识。有Java,C#,C++等编程基础,最好有Python基础知识,但即使你对 Python 不太熟悉,也完全没有关系。课程主要阅读和讲解案例代码。

    成功案例

    本课程已经举办多期线上线下公开课。已经为几十家企业定制专门培训课程包括如Autodesk中国研发中心,思科研发中心,中信研发中心,平安,民航信,NTT DATA,北京体彩,海尔,华为,中兴,台达电子,中国通号集团,中移信息,河南工学院,中国电信,中国联通,电信研究院,联想研发中心以及多家金融企业研发中心,平安产险,平安寿险,中信银行等。

    课程内容安排(内容较多,预计多天时间,可以根据需求裁剪)
    第1章  AI产品思维和企业AI应用落地指南

    第一部分: AI企业落地案例与AI产品思维

    1. 深入理解AI和应用
    2. 深入理解AI产品思维
    3. AI产品产业化和标准化
    4. AI产品落地的价值与难题
    5. 所有应用都值得被大模型重构一遍!-百度李彦宏
    6. AI 2.0彻底改变社会:所有应用都可以被重写一次--李开复
    7. 微软发布全新AI PC,有哪些启发
    8. 苹果 pad math notes的AI应用分析
    9. AI企业落地场景分析


    第二部分: 破解AI落地难题的实战指南

    1. AI大模型的工程化原理
    2. AI大模型工程化的背景 
    3. AI大模型工程化的核心 
    4. AI大模型工程化的建设思路 
    5. AI大模型工程化业务流程 
    6. AI大模型工程化系统架构
    7. 工程化的技术筹备 
    8. AI大模型工程化调研评估 
    9. 大模型应用框架 
    10. AI大模型工程化提示词工程 
    11. AI大模型工程化开发环境的准备
    12. AI大模型工程化工程化的建设要点
    13. AI大模型工程化的安全策略


    第三部分: AI大模型的工程化落地项目规划

    1. 项目需求分析
    2. 大模型落地全流程
    3. 数据准备及基础大模型构建
    4. 向量数据库构建
    5. 大模型与企业应用无缝衔接
    6. AI大模型的工程-RAG落地
    7. AI大模型的工程化-大模型集成
    8. AI大模型的工程化-智能体设计与开发
    9. AI大模型的工程化-微调大模型
    10. AI大模型的工程化-标记数据集
    11. AI大模型的工程化-加载预训练模型
    12. AI大模型的工程化-模型评估
    13. AI大模型的工程化-工程化部署
    14. AI大模型的工程化-部署测试与上线 
    15. AI大模型的工程化效果评估与数据反馈闭环


    第四部分: AI大模型的工程化落地案例

    1. 某电子制造企业基座大模型的开发与部署
    2. 某银行基于大模型的“智慧大脑”
    3. 某工厂大语言模型驱动的知识中台建设背景与规划
    4. 某工厂基于专有大模型与AIGC技术的智能质量知识创新平台
    5. 某电厂基于大语言模型的充电桩管理知识助手
    6. 某新能源电池企业基于大模型的售后供应链管理与优化系统
    7. 某国产汽车制造企业基于大模型的办公超自动化平台
    8. 某保险公司基于多模态大模型的办公助手

    第2章大模型落地实战

    第一部分: 大模型落地准备规划

    1. 企业大模型应用落地的常见形式
    2. 员工个人办公提效
    3. 大模型与企业数字化系统相集成
    4. 用AI原生方式重构企业数字化系统
    5. 大模型嵌入物联网设备
    6. 大模型催生新的超级个体形态
    7. 大模型现有的能力边界
    8. 大模型现有的能力边界与瓶颈
    9. 大模型未来提升方向
    10. 大模型落地的推荐要素
    11. 数据,算力,模型,人才
    12. 全面梳理公司已有的业务链条,寻找AI落地场景
    13. 选取产品与AI的创新结合点
    14. 用AI替代低效重复的业务环节
    15. 对标同行业或跨行业友商的AI方案
    16. 案例分析


    第二部分: 企业如何部署和应用大模型

    1. 大模型的三种建设路径
    2. 建设路径一:基于商用大模型的应用开发
    3. 建设路径二:基于开源通用大模型的微调优化
    4. 建设路径三:从零开始构建完整大模型
    5. 企业选择建设路径的影响因素
    6. 大模型的选型标准
    7. 大模型基础信息评估
    8. 大模型性能评估
    9. 大模型备案信息评估
    10. 大模型的六类应用模式


    第三部分: Prompt Engineering 高阶技巧

    1. 思维链(Chain of Thought, CoT):
    2. 引导模型逐步推理反思机制(Self-Reflection):
    3. 让模型自己评估输出质量
    4. 提示模板设计(Prompt Templates):Jinja2、LangChain Template
    5. 支持外部工具调用提示设计(Tool Calling Prompt)
    6. 动态 Prompt 生成:根据用户输入动态构造 Prompt


    第四部分: 基于多模态大模型的企业应用案例

    1. 多模态大模型基本概念 
    2. 多模态GPT多模态应用场景分析
    3. OpenAI多模态API解析
    4. 多模态大模型核心技术
    5. 多模态提示模板工程
    6. 多模态思维链
    7. 多模态基础模型 
    8. 多模态大模型的应用案例
    9. 视觉问答应用案例
    10. 图像问答应用案例
    11. 某企业多模态案例
    第3章  DeepSeek和LangChain开发应用

    第一部分: 模型应开发框架 LangChain 

    1. ⼤模型应⽤开发框架 LangChain
    2. LangChain基本原理与开发流程 
    3. LangChain的核心组件:理解任务链与内存模块 
    4. LangChain开发流程概述
    5. 为什么需要 LangChain
    6. LangChain 典型使⽤场景
    7. LangChain 基础概念与模块化设计
    8. LangChain 核⼼模块⼊⻔与实战
    9. LangChain 的3 个场景
    10. LangChain 的6 大模块
    11. LangChain 的开发流程
    12. 创建基于LangChain聊天机器人


    第二部分: LangChain核心组件-模型、模型类与缓存

    1. 构建复杂LangChain应⽤
    2. 模型的定义与应用 
    3. 语言模型的工作原理 
    4. Chat类、LLM类模型简介 
    5. 完成基本文本生成任务 
    6. 自定义LangChain Model类 
    7. 模型参数的自定义与调优 
    8. LangChain与缓存
    9. 使⽤大模型构建文档问答系统


    第三部分: LangChain核心组件-:链 和记忆

    1. LLM链 
    2. LLM链的基本工作流程和参数设置 
    3. 如何在LLM链中嵌入提示词模板和预处理逻辑 
    4. 序列链 
    5. 路由链 
    6. 文档链 
    7. 聊天消息记忆
    8. 会话缓冲区与会话缓冲窗口
    9. 会话摘要与支持向量存储
    10. LangChain与表达式语言
    11.  LCEL初探与流式支持 
    12. LCEL并行执行优化
    13. 回退机制的设计与实现
    14. LCEL与LangSmith集成 

    第4章  DeepSeek构建企业级RAG知识库

    第一部分: DeepSeek大模型企业RAG应用

    1. RAG技术概述
    2. 加载器和分割器
    3. 文本嵌入和 向量存储
    4. 检索器和多文档联合检索
    5. RAG技术的关键挑战
    6. 检索增强生成实践
    7. RAG技术文档预处理过程
    8. RAG技术文档检索过程


    第二部分: 构建基于DeepSeek RAG:实现检索增强生成

    1. 何谓检索增强生成
    2. 提示工程、RAG与微调
    3. 从技术角度看检索部分的Pipeline
    4. 从用户角度看RAG流程
    5. RAG和Agent
    6. 通过Llamalndex的ReAct RAG Agent实现检索
    7. 获取井加载电商的财报文件
    8. 将财报文件的数据转换为向量数据
    9. 构建查询引擎和工具
    10. 配置文本生成引擎大模型
    11. 创建Agent以查询信息


    第三部分: RAG实战案例-企业文档问答系统

    1. 企业文档问答需求分析与系统设计
    2. 确定问答系统的需求:识别用户的主要查询类型与目标 
    3. 系统结构与模块划分:明确检索与生成模块的协作方式 
    4. 搭建向量数据库与检索模块 
    5. 数据预处理与向量化:生成高效的嵌入向量 
    6. 构建与优化索引:提升检索模块的查询速度 
    7. 生成模块的集成与模型调优 
    8. 加载与配置生成模型:选择适合问答系统的生成模型 
    9. 模型优化与提示词调优:提高生成内容的准确性与相关性 
    10. RAG系统测试、部署与优化 
    11. 测试流程与性能监控:确保系统的稳定性与响应速度 
    12. 企业环境的部署与上线:实现系统在实际业务中的应用

    第5章基于DeepSeek开发Agent智能体

    第一部分:DeepSeek大模型驱动的Agent智能体开发概述

    1. 智能体的定义与特点
    2. 智能体与传统软件的关系
    3. 智能体与LLM的关系
    4. 从ChatGPT到智能体
    5. 智能体的五种能力
    6. 记忆,规划,工具,自主决策,推理
    7. 多智能体协作
    8. 企业级智能体应用与任务规划
    9. 智能体开发


    第二部分: 基于Deepseek和LangChain构建Agent

    1. 通过LangChain中的ReAct框架实现自动定价 
    2. LangChain ReAct框架 
    3. LangChain中ReAct Agent 的实现 
    4. LangChain中的工具和工具包 
    5. 通过create_react_agent创建Agent 
    6. 深挖AgentExecutor的运行机制
    7. Plan-and-Solve策略的提出 
    8. LangChain中的Plan-and-Execute Agent 
    9. 通过Plan-and-Execute Agent实现物流管理 
    10. 为Agent定义一系列进行自动库存调度的工具


    第三部分: 多Agent 最佳实践langGraph框架

    1. 为什么选择多智能体架构?
    2. 常见的多智能体架构
    3. LangGraph架构和应用
    4. LangGraph 核心组件:节点与可控制性
    5. 节点与可控制性-第一个LangGraph
    6. 节点与可控制性-基本控制:串行控制&分支控制&条件分支与循环
    7. 节点与可控制性-精细控制:图的运行时配置&map-reduce
    8.  LangGraph 核心组件:持久化与记忆
    9. 记忆:短期记忆的实现&长期以及实现&使用总结技术优化记忆
    10.  LangGraph 核心组件:人机交互
    11.  LangGraph 核心组件:时光旅行
    12.  LangGraph 核心组件:流式输出
    13.  LangGraph 核心组件:工具调用
    14. 基于LangGraph 构建代码助手
    15. 基于LangGraph 的提示词生成小助手


    第四部分: CrewAI: 一款主流的多Agents开发框架

    1. CrewAI架构和原理
    2. CrewAI安装与第一个示例
    3. CrewAI 核心组件讲解
    4. CrewAI 核心组件:Agents
    5. CrewAI 核心组件:Task
    6. CrewAI 核心组件:Crew & flow
    7. CrewAI 核心组件:知识库 & 记忆
    8. 基于CrewAI 的游戏开发助手最近学习
    9. 基于CrewAI 的营销策略大师


    第五部分: 智能客服系统架构设计

    1. 掌握智能客服系统的整体架构与核心组件
    2. 理解意图识别与槽位填充(Intent + Slot)的工作原理
    3. 能够设计基于规则或机器学习的意图识别
    4. 流水线实现多轮对话管理器,支持上下文理解与状态追踪(Dialogue State Tracking)
    5. 构建可插拔的工具调用引擎(Tool Calling Pipeline)
    6. 设计自定义 Agent,支持记忆管理与动态决策流程
    7. 支持多模态输入处理(语音、图像等) 
    第6章  DeepSeek大模型原理和部署,微调

    第一部分: 微调大模型

    1. 标记数据集
    2. 加载预训练模型
    3. 定义微调目标
    4. 设置微调策略
    5. 微调模型
    6. 模型评估


    第二部分: 私有化部署DeepSeek大模型

    1. DeepSeek云端部署
    2. DeepSeek和国产信创平台适配
    3. DeepSeek和国内云平台
    4. 利用Ollama私有化部署DeepSeek大模型
    5. 使用其他工具私有化部署DeepSeek大模型
    6. DeepSeek私有化部署总结


    第三部分: DeepSeek大模型微调和蒸馏

    1. DeepSeek 大模型微调
    2. 大模型指令微调技术
    3. 通用模型的缺点和指令微调的必要性
    4. 指令微调跟BERT时代Fine-tune之间区别
    5. 指令集的收集与格式化
    6. 指令数据集文件制作
    7. 大模型微调的三个阶段剖析
    8. 大模型微调的两种方法剖析