讲师介绍
张老师
有多年大数据、流式计算方面的开发经验,对Hadoop、Spark、Flink等大数据计算引擎有着非常深入的理解,积累了丰富的项目实践经验。先后利用相关技术为银行、证券、地铁等领域的头部企业构建了内部大数据平台,参与了基于Flink的实时反欺诈风控、实时地铁故障预警等流式计算平台的设计和研发。
课程目标
- 技能提升: 确保至少 90% 的参训人员在工作坊结束后,对 GenAI 应用案例、 DeepSeek 基础核心理论、强化 学习、Agentic AI 、AI 如何助力 EDA 算法开发(如基于 AI 的数学建模、线性/非线性拟合、求解常/偏微分方程等)等内容有深入了解;并熟练掌握提示词工程、DeepSeek R1 模型蒸馏以及模型部署等关键技能。
- 创新激发: 通过工作坊期间的研讨、实践和创新思维引导,激发参与者提出不少于 10 个具有潜力的创新性技 术应用设想,为公司未来的产品研发和业务流程优化提供新思路。
- 协作促进: 利用工作坊期间提供的编程资源和团队协作项目,有效增进不同部门参与者之间的交流与合作, 打破部门壁垒,提升跨部门协同创新能力。
- 知识传播: 确保工作坊结束后两个月内,参与者能够成功在公司内部进行二次知识分享,覆盖上海公司 60% 以上相关业务部门的员工,并形成系统化的内部知识共享文档库,沉淀和传播学习成果。
课程介绍
本次创新工作坊旨在赋能公司员工在生成式人工智能(GenAI)、 DeepSeek 大模型以及 AI 驱动的工程算法开 发等前沿技术领域的知识和技能。为期 2-3 天的密集式培训将通过理论讲解、案例分析、动手实验、小组讨论和专家指导等多种形式,帮助学员深入了解 GenAI 的最新应用趋势,掌握 DeepSeek 大模型的核心原理和实践技巧,
并探索 AI 在电子设计自动化(EDA)算法开发中的巨大潜力。
工作坊将系统性地介绍 Agentic AI、强化学习、图数据库与知识库等相关技术,并重点聚焦 DeepSeek R1 模 型的蒸馏与部署实战。学员将通过大量的 Hands-on Labs 环节,亲手操作和体验,掌握提示词工程的关键技巧,并学习如何高效地部署和应用大模型。
此外,本课程还将注重培养学员的创新思维和团队协作能力。通过小组合作完成实验项目和创新方案构想,学 员将有机会将所学知识应用于实际问题,并提出具有创新性的解决方案。在工作坊课程结束后,还将提供持续的答 疑支持,并鼓励学员在公司内部进行知识分享,最终构建一个充满活力的创新生态系统,助力公司在激烈的市场竞 争中保持领先地位。
课程大纲
|
第一天 上午 (9:00 - 12:00) |
- 模块一:基础铺垫 (30分钟)
- 欢迎致辞与项目背景介绍
- 重点:工作坊核心目标强调
- 讲师与学员互相介绍,建立积极互动氛围
- 分组情况说明与团队建设小活动
- 模块二: GenAI 浪潮与行业洞察 (90分钟)
- GenAI 技术概览与发展趋势分析
- GenAI 应用案例 Case studies
- 重点:工业软件领域 GenAI 创新应用深度剖析 (设计优化、智能建模、代码辅助生成、仿真加速 等,结合具体平台和工具)
- 重点:软件测试领域 GenAI 赋能实践(智能测试用例生成、缺陷智能分析与预测、测试流程自动 化等,结合实际案例)
- 重点:国内外知名大厂 GenAI 战略与实践分享 (案例选择侧重于与公司业务相关的行业)
- Agentic AI:自主智能体的崛起
- 核心概念、关键技术与应用场景展望
- Agentic AI 在行业创新中的潜在价值
- 互动讨论与案例分析: GenAI 和 Agentic AI 如何驱动企业创新变革?
- 模块三: DeepSeek 核心理论与技术解析 (90分钟)
- DeepSeek 基础核心理论
- 重点:深入解读 DeepSeek 模型系列的核心架构(Transformer 结构演进、关键创新点)
- 重点: DeepSeek 模型预训练与微调策略分析 (数据、算力、优化算法等)
- 重点:基于已发表论文,剖析 DeepSeek 在上下文学习、长文本处理等方面的优势
- DeepSeek 与主流开源及闭源大模型的对比分析(技术特点、应用场景)
- 核心技术解析与算法创新
- 重点: MOE (Mixture of Experts) 机制详解:稀疏激活、模型容量扩展、在 DeepSeek 和其他先 进模型中的应用
- 重点: MLA (Meta-Learning for Adaptation) 概念与应用:快速适应新任务和领域的方法
- 重点: GPRO (Graph-based Prompting) 原理与实践:如何利用图结构信息增强模型推理和理解 能力
|
第一天 下午 (13:30 - 17:00) |
- 模块四:AI 助力 EDA 算法创新 (60分钟)
- AI 如何助力 EDA 算法开发
- 重点:基于 AI 的数学建模方法与实践:数据驱动的建模、物理信息融合建模等在 EDA 中的应用
- 重点:线性/非线性拟合的 AI 模型与技巧:神经网络拟合、集成学习方法在 EDA 参数优化中的应用
- 重点:求解常/偏微分方程的 AI 方法:神经网络求解 PDE、代理模型构建等在 EDA 仿真加速中的
- 应用案例
- 案例分析与讨论: AI 技术在 EDA 流程中的关键环节和潜在突破点
- 模块五:强化学习与知识图谱基础 (60分钟)
- 强化学习基础概念与应用场景
- 核心概念(状态、动作、奖励、策略)与基本算法(如 Q-learning 、Policy Gradient)
- 重点:强化学习在 EDA 优化、芯片设计等领域的潜在应用案例
- 图数据库与知识库简介
- 图数据库的核心概念与优势(节点、边、关系)
- 知识图谱的构建与应用(实体识别、关系抽取、推理问答)
- 图数据库和知识图谱如何赋能大模型,提升推理和知识检索能力
- 模块六:动手实验准备与提示词工程 (90分钟)
- 提示词工程 (Prompt engineering) 和辅助工具提质增效
- 重点: Prompt 的基本结构与关键要素 (指令、上下文、示例、格式)
- 重点:针对不同任务(文本生成、代码生成、信息抽取、推理问答等)的提示词设计原则与高级技 巧
- 重点:常用提示词优化策略实战演练( Few-shot Learning 、Chain-of-Thought 、Tree of Thoughts 等)
- 重点:介绍并演示提示词工程辅助工具的使用 (如 Prompt 模板库、 Prompt 调试平台等)
- 针对不同任务设计 Prompt
- 文本摘要 (Summarization)
- 内容生成 (Content Generation)
- 问题回答 (Question Answering)
- 文本翻译 (Translation)
- 代码生成 (Code Generation)
- Prompt 优化与评估
- 使用评估指标 (BLEU, ROUGE, etc.) 评估 Prompt 效果
- A/B 测试不同 Prompt 变体
- Prompt 注入攻击防范
- 小组讨论:结合上午学习内容,初步设计针对 DeepSeek 模型和 EDA 相关任务的提示词实践方案
|
第二天 上午 (9:00 - 12:00) |
- 模块七: Hands-on Labs: DeepSeek R1 模型蒸馏实践 (180分钟)
- 掌握: DeepSeek R1 – distillation Step-by-Step 及实操实验室
- 重点:回顾 DeepSeek R1 模型结构与特点
- 重点:深入讲解模型蒸馏 (Distillation) 的原理、意义和流程 (软标签、知识转移、温度系数等) 重点:Step-by-Step 带领学员进行 DeepSeek R1 模型蒸馏实验 (提供详细的代码和操作指导)
- 重点:实验过程中常见问题分析与故障排除
|
第二天 下午 (13:30 - 17:00) |
- 模块八: Hands-on Labs:大模型部署与应用实践 (150分钟)
- 掌握:模型部署
- 重点:常见大模型部署方案对比分析(本地部署、云端部署、 API 部署、边缘部署等,优缺点、适 用场景)
- 重点:选择至少一种适合 DeepSeek R1 的部署方案进行详细讲解和实践操作(例如,使用 Hugging Face Transformers 库进行本地部署或云端推理服务部署)
- 重点:模型推理性能评估与优化技巧 (延迟、吞吐量、资源占用等)
- 重点:如何将部署好的模型应用于实际场景 (例如,构建简单的问答系统或代码生成工具)
- Hands-on Labs 以小组为单位,确保每组都能完成模型部署和简单应用
- 模块九:小组实验分享与阶段性总结 (60分钟)
- 精心设计并组织小组间的实验分享环节
- 重点:每个小组需全方位展示其实验过程、遇到的问题、解决方案、实验成果与心得体会
- 鼓励小组间互相提问、交流和学习
- 讲师依据既定的评价标准进行阶段性打分,并对各小组的表现进行针对性点评与总结
|
第三天 (可选,或根据 2-3 天时长调整) 上午 (9:00 - 12:00) |
- 模块十: LLM 性能评估与经济性考量 (60分钟)
- 了解: LLM 性能评估
- 常用评估指标深入解析(如准确率、召回率、F1 值、 BLEU 、ROUGE 、Perplexity 等)
- 重点:针对 DeepSeek 等大模型的特定评估方法和基准测试介绍
- 主观评估与用户反馈的重要性
- 讨论如何根据实际应用场景选择合适的评估指标
- 模块十一: LLM 经济性影响与未来趋势 (60分钟)
- 了解: LLM 性能评估和经济性影响
- 大模型训练成本、推理成本构成分析
- 模型压缩、量化、剪枝等降低成本的技术手段
- 选择高性价比模型和部署方案的策略
- 了解:大模型未来研究方向
- 重点:可解释性 AI (XAI) 的重要性与研究进展
- 重点:通用人工智能 (AGI) 的愿景与当前挑战
- 多模态学习、长期记忆、持续学习等前沿技术趋势探讨
- 模块十二:创新思维与项目构想 (60分钟)
- 创新方法论介绍(头脑风暴、设计思维等)
- 重点:引导学员结合所学知识,针对公司产品研发、业务流程优化等领域,提出创新性技术应用设想
- 小组讨论与初步方案构思
|
第三天 (可选,或根据 2-3 天时长调整) 下午 (13:30 - 17:00) |
- 模块十三:小组创新项目汇报与评审 (120分钟)
- 每个小组展示其创新性技术应用设想(不少于 10 个总体目标)
- 汇报内容包括:问题定义、解决方案、技术可行性分析、潜在价值与影响等
- 讲师及公司代表进行评审,提供反馈和建议
- 模块十四:技术问题互动与知识巩固 (30分钟)
- 精心筹备一系列紧扣培训内容的技术问题穿插在工作坊当中,鼓励深度探讨
- 学员自由提问,讲师进行深入解答
- 模块十五:工作坊总结与反馈 (30分钟)
- 提供英文版本工作坊反馈问卷
- 学员填写反馈问卷
- 讲师总结工作坊的核心内容、亮点与成果,并对学员提出期望
颁发培训证书,发放礼物,感谢学员的积极参与
|
备注: |
本课程大纲在之前的版本基础上进行了更详细的展开,加入了更多细节和逻辑,以便更好地理解和执行。 实际课程安排可能会根据学员的反馈和现场情况进行微调。 讲师将准备丰富的案例、互动环节和实践练习,确保培训的有效性和吸引力。 |