课程内容及目标
本课程针对已有数据挖掘与分析思维及大数据基础知识的同学,针对如何更好的利用数据挖掘分析方法和高级算法做分析和探索数据背后的规律是本次的重点内容之一,如何运用python做数据挖掘实践来进一步理解和实践数据模型设计过程,同时认识在大数据环境下数据分析和数据挖掘的特点,及针对大数据的海量数据如何科学合理的准备和清洗,把数据挖掘的理论和实际应用场景结合,包括数据挖掘分析方法、案例以及数据挖掘中的关联分析技术、分类和预测技术、聚类分析技术等进行总结。
本次课程帮助学员掌握数据挖掘与数据分析原理,进一步认识常见的挖掘高级算法,提升数据分析技能,并且结合python的数据挖掘工具进行更好的数据挖掘落地,把方法论、技术、案例、问题结合起来,把理论实践化,让学者能深入学习python在大数据分析挖掘中的应用实践。
课程特色
- 把理论与实践相结合、案例分析与方法论相结合解析;
- 学员分组专题研讨,精心点评总结提炼及指导学员
- 通过全方位知识内容解析、深入剖析专题和有效技能实践及生活化、趣味化的授课方式,抓住学员的痛点,提升学员知识掌握和实践能力。
课程大纲
基于python开发的数据分析与挖掘方法论导入
|
1. 数据分析概念深入 2. 数据建模分析流程解析 3. 数据分析的关键 4. 数据建模的步骤与模型的正确理解方式 5. 数据挖掘项目的关键 6. 数据分析工具对比
教师讲解及研讨
|
数据挖掘分析方法和算法深入
|
第一部分数据挖掘主要分析方法和算法关系 1. 分析方法与算法的关系 2. 聚类分析方法(Clustering) 3. 分类分析方法(Classification) 4. 关联分析方法(Association) 5. 预测分析方法(Prediction) 6. 回归分析方法和算法 7. 异常点检测分析方法和算法 第二部分:主要涉及的常用算法的优点及缺点: 1、决策树算法原理,应用场景,优缺点分析 2、贝叶斯算法原理,应用场景,优缺点分析 3、人工神经网络算法原理,应用场景,优缺点分析 4、k-近邻算法原理,应用场景,优缺点分析 5.基于关联规则的分类算法原理,应用场景,优缺点分析 6、聚类算法涉及的距离及几何数理知识 7、层次聚类算法原理,应用场景,优缺点分析 8、K均值聚类算法原理,应用场景,优缺点分析 9、各聚类算法对比及业务场景适用分析 10、聚类算法与分类算法的对比及业务场景适用分析 11、回归算法原理,应用场景,优缺点分析
教师讲解和研讨
|
基于python实现高级算法的实践及数据挖掘应用案例实践与评估总结
|
1.python操作算法实践学习 聚类分析、分类与预测、关联规则、离散点检测 2.网络爬虫案例实践与原理 3.客户价值分析实例(完整案例:从属于预处理到数据解析到数据建模的全过程) 4.如何做好数据挖掘模型评估 5.数据挖掘数据模型管理与实践总结 6.数据挖掘中遇到的“坑”思考及分析 7.如何成为一个好的数据分析师
教师讲解与实践
|