DeepSeek技术及应用实践

DeepSeek技术及应用实践
    马上咨询

    讲师介绍

    李明宇,中科院计算所高级工程师

    开源项目活跃开发者,20 余年编程与软件开发经验,10余年云端软件研发与产业化工作经历。历任国家重点实验室课题组负责人,上市公司事业群技术总监、首席技术专家。

    李老师项目经验丰富,为多家知名企业和单位提供过服务,包括银联、交通银行、宁波银行、上海期货交易所、国家信息中心、国防科技大学、中国电信集团、中国移动产业研究院、中石化、Intel亚太研发中心等企业和单位。

    荣获中国软件协会“优秀CTO”等多项荣誉,兼任中国新一代IT产业联盟分委会秘书长、全国高校人工智能与大数据创新联盟专家委员、北京开源创新委员会委员、中国开源软件创新大赛总决赛评委。


    课程收益

    • 帮助企业IT管理及研发、运维人员了解DeepSeek及其大模型技术的基本原理、核心优势与实际应用价值
    • 探讨如何利用DeepSeek技术优化企业信息化建设和数字化转型
    • 分析技术集成、部署策略及未来发展趋势,助力企业在激烈竞争中保持领先


    培训对象

    • 企业各级IT主管、部门负责人及CIO
    • 信息系统研发和运维工程师


    课程大纲
    一、大模型与DeepSeek简介
    • 大模型技术概览
      • 大模型的概念及其发展历程
      • 目前全球主流大模型的特点及关键技术
      • 大模型企业应用场景:知识管理、智能客服、软件研发、辅助决策等
    • DeepSeek简介
      • DeepSeek 公司背景
      • DeepSeek 的产品:从 V1 到 V3 再到 R1
      • DeepSeek-V3 和 DeepSeek-R1 的区别与各自优势、R1的重要意义
    二、DeepSeek核心技术解析
    • DeepSeek-V3 模型技术解析
      • 模型架构与参数规模
      • MoE、MLA、混合精度优化等关键技术与工程优化
      • 训练流程及成本控制
    • DeepSeek-R1 模型解析
      • 在DeepSeek-V3基础上,通过强化学习(RL)激发“链式思维”能力
      • “R1-Zero”:纯RL训练的初步探索及存在的问题
      • “R1”改进:引入冷启动数据、SFT+RL组合、语言一致性奖励等方法
      • 开源模式及后续蒸馏小模型的部署优势
    三、DeepSeek在企业的部署与应用
    • 系统架构与集成方案
      • 云端部署部署:DeepSeek官方平台、第三方 MaaS 服务
      • 本地化部署:算力评估、开源模型部署环境搭建
      • 应用开发及与现有IT系统的对接:应用架构、数据存储、API对接、安全及性能监控
    • 企业落地方案及应用案例(一)情报收集与分析
      • 商业情报、公共舆情收集与分析的痛点
      • RAG架构及基于DeepSeek V3的多模态情报库与智能问答系统构建
      • 智能体架构的Agentic RAG技术及基于DeepSeek R1的情报分析
    • 企业落地方案及应用案例(二)企业级软件研发智能助手
      • 企业级软件研发的痛点及已有AI Coding工具的不足
      • CodeGraphRAG 技术及在企业软件研发智能体中的应用
      • 基于 DeepSeek R1 的代码审查助手
      • 基于 DeepSeek V3 的 UI 测试助手
    • 企业落地其他场景探讨
      • 销售与运营数据分析、供应链预测、客户投诉处理与体验升级等
    • 风险管理与供应商选择
      • 安全风险和业务风险及应对策略
      • 利用开源社区及生态寻找第三方DeepSeek合作伙伴
    四、竞争格局、行业影响与未来趋势
    • 全球与国内竞争态势
      • 美国和其他国家在大模型和AI基础设施方面的投入现状
      • 中国其他大模型公司及应用生态的竞争格局和发展趋势
    • 市场及行业影响
      • DeepSeek对美国科技股(如Nvidia)和中美风险投资市场影响
      • 开源模式推动行业价格战和技术生态的重构
    • 未来趋势与战略思考
      • 大模型时代是否已开启下半场?
      • 出口管制、数据安全、信创方案及对未来技术发展的影响
      • 新业务、新岗位、新就业与企业转型