本课程专注于培养数据分析师的数据处理能力、数据分析能力和数据挖掘能力,课程内容从数据库管理、统计理论方法、数据分析主流软件的应用(包括SQL、Excel、SPS

*   第一章 数据分析师职业概览/

  *   数据分析师的职业概览/

    *   数据分析师的“钱”景如何

    *   什么人适合学数据分析

    *   数据分析师的临界知识

    *   数据分析师的主要职责

*   第二章 数据分析和数据挖掘的概念和理论/

  *   基础概念/

    *   数据分析及数据挖掘定义

    *   数据分析与数据挖掘的层次

    *   数据分析及数据挖掘三要素

    *   本节小结

  *   探索性数据分析/

    *   如何描述业务量数据

    *   可视化展示的原则

    *   本节小结

  *   预测和分类/

    *   预测和分类的概念模型、流程

    *   分类和预测:线性回归

    *   逻辑回归

    *   决策树算法

    *   支持向量机

    *   朴素贝叶斯

    *   本节小结

  *   分群和降维/

    *   聚类算法的基本概念

    *   层次聚类

    *   K-means聚类

    *   降维模型-PCA

    *   本节小结

*   第三章 统计学基础和SPSS软件应用/

  *   描述性统计分析/

    *   统计分析的目的

    *   统计分析的关键概念

    *   四种测量尺度

    *   集中趋势-均值

    *   集中趋势-中位数和众数

    *   离散趋势-极差和标准差

    *   案例操作-如何实现离散趋势和集中趋势

    *   本节小结

  *   假设检验/统计判断/

    *   统计学本质

    *   统计学两大定理

    *   统计推断-抽样误差与标准误

    *   统计推断-t分布

    *   统计判断-参数估计

    *   统计推断—假设检验

    *   本节小结

  *   抽样方法/

    *   统计过程

    *   抽样的概念

    *   抽样方法与非抽样方法

    *   抽样调查与普查的特点

    *   非抽样误差

    *   非抽样误差的三种类型

    *   无回答误差的处理

    *   抽样过程

    *   抽样单元与抽样框

    *   抽样形式

    *   概率抽样-简单随机抽样和系统抽样

    *   概率抽样-PPS抽样

    *   概率抽样-分层抽样

    *   非概率抽样-区域抽样、时间抽样和电话抽样

    *   本节小结

  *   一般线性模型/

    *   t检验

    *   t检验-案例实践

    *   F检验

    *   F检验-案例实践

    *   相关分析

    *   相关分析-案例实践

    *   线性回归

    *   线性回归-案例实践

    *   本节小结

*   第四章 数据预处理基础/

  *   数据分析前的准备工作/

    *   统计工作流程

    *   统计准备工作

    *   数据检查要点

    *   开放题的准备

    *   本节小结

  *   数据清洗/

    *   数据清洗的概念和流程

    *   字段选择与数据质量报告

    *   数据清洗主要工作

    *   错误值和异常值处理方法

    *   缺失值处理方法

    *   异常值和缺失值的处理操作

    *   本节小结

  *   数据规范化/

    *   数据转化

    *   数据离散化与数据扩充

    *   数据合并与拆分

    *   本节小结

*   第五章 Mysql教程/

  *   SQL简介/

    *   SQL简介

    *   建立数据库

    *   建立数据表和约束条件

    *   插入和更改

    *   本节小结

  *   基本查询语句/

    *   基本查询语句

    *   本节小结

  *   交叉查询和子查询/

    *   聚合函数和交叉查询;group by

    *   子查询(in、not in)&模糊匹配 Like

    *   本节小结

  *   练表查询/

    *   连表查询

    *   本节小结

  *   相关函数/

    *   控制流函数

    *   时间函数

    *   常用字符串相关的函数

*   第六章 Excel分析及可视化/

  *   Excel简介/

    *   Excel简介

  *   Excel函数技巧/

    *   函数的简介

    *   查找函数—vlookup和hlookup

    *   查找函数—INDEX和MATCH

    *   统计函数

    *   逻辑函数(上)-if、and和or

    *   逻辑函数(下)

    *   日期函数和文本函数

    *   本节小结

  *   Excel快速处理技巧/

    *   宏的技巧

    *   数据透视表和选择性粘贴

    *   格式调整技巧

    *   查找和定位&数据有效性技巧

    *   快捷键相关技巧

    *   本节小结

  *   Excel可视化技巧/

    *   如何制作一张图

    *   组合图的做法

    *   条形图的变体

    *   数据气泡地图的做法

    *   本节小结

*   第七章 进阶统计学/

  *   多变量分析方法选择思路/

    *   多变量分析方法的选择

    *   无监督分析和有监督分析

    *   无监督分析的原则

  *   因子分析/

    *   因子分析使用场景

    *   因子的概念及分析过程

    *   因子数的推定

    *   因子轴的旋转

    *   因子解释及因子得分计算

    *   案例实践

    *   如何用因子分析做评价

  *   聚类分析/

    *   聚类分析使用场景

    *   聚类分析算法

    *   非层次法聚类K-means

    *   K-means-案例实践

    *   二阶聚类

  *   对应分析/

    *   对应分析使用目的及结果解读

    *   对应分析案例实践

  *   多维尺度分析/

    *   概念和使用场景

    *   多维尺度分析举例

    *   案例1:根据学生评分进行分座位

    *   案例2:根据学生考试成绩进行分座位

    *   案例3:根据手机的相似度判断竞争力

    *   多维尺度的不足及替代方法

  *   时间序列分析/

    *   时间序列使用场景

    *   两种类型的时间序列

    *   时间序列模型ARIMA

    *   时间序列中的处理方法

    *   案例实践—某连锁超市销售额影响因素预测

  *   Logistic/

    *   使用场景和理论背景

    *   Logisitic案例实践-用户流失的影响因素及新用户预测

*   第八章 经典数据挖掘算法/

  *   数据挖掘基础及数据分层抽样/

    *   生活中熟悉的数据挖掘案例

    *   数据准备及数据分割方式

    *   数据分析与数据挖掘的联系与区别

    *   Modeler软件介绍

    *   如何在Modeler实现数据分层抽样

  *   朴素贝叶斯/

    *   朴素贝叶斯原理

    *   朴素贝叶斯算法过程

    *   朴素贝叶斯算法举例

    *   朴素贝叶斯算法优点及不足

    *   案例实践-使用贝叶斯网络建模

  *   决策树/

    *   决策树应用场景

    *   决策树算法(1)—ID3

    *   决策树算法(2)—C4.5

    *   决策树算法(3)—回归树CART

    *   决策树算法(4)-CHAID

    *   防止过度拟合的问题

    *   使用Modeler如何做决策树

  *   神经网络/

    *   神经网络的组成

    *   计算误差函数,修正初始权重

    *   神经网络与其他分析的关系

    *   案例实践

  *   支持向量机/

    *   支持向量机原理介绍

    *   线性可分与线性不可分

    *   案例实践

  *   集成算法和模型评估/

    *   集成算法的目的与方式

    *   Bagging与Boosting的计算原理

    *   根据混淆矩阵进行模型评估

    *   在Modeler中画出GAIN曲线图和Lift曲线图

    *   学习资料拓展

*   第九章 R语言入门及基础分析/

  *   R语言基础操作/

    *   初识R语言

    *   R语言的基本操作

    *   R语言的数据结构介绍

    *   向量和矩阵的基本操作

    *   数据框的操作

    *   循环控制流—for&whlie

    *   条件选择控制流-if

    *   自定义函数

    *   R语言关于概率分布的函数及应用介绍

    *   离散随机变量分布和连续随机变量分布

  *   R语言描述性数据分析/

    *   探索性数据分析—集中趋势和离中趋势

    *   探索性数据分析—相关系数及函数介绍

    *   探索性数据分析—假设检验

  *   R语言回归算法/

    *   回归基本算法及相关函数介绍(上)

    *   回归基本算法及相关函数介绍(下)

    *   模型选择

    *   回归诊断

  *   R语言分类算法/

    *   逻辑回归(上)

    *   逻辑回归(下)

    *   决策树算法

    *   决策树的剪枝

    *   随机森林

  *   R语言聚类和降维/

    *   使用R如何实现层次聚类

    *   使用R如何实现kmeans聚类法

    *   如何判定聚类的好坏

    *   使用R如何实现PCA降维算法

*   第十章 Python入门及基础分析/

  *   概述与基本操作/

    *   课程与开发环境简介

    *   帮助文档的获取&基础操作

    *   基础操作:整数、小数、复数&列表、字符串、字典

    *   控制流函数

    *   自定义函数

    *   Jupyter常用快捷键以及自动补全功能的实现

    *   本节小结

  *   Numpy/

    *   从头创建一个数组

    *   案例实践-如何实现99乘法表和老虎机

    *   数组的操作

    *   数组的计算

    *   数组的广播

    *   比较、掩码和布尔逻辑

  *   Pandas/

    *   序列和数据框

    *   索引和切片

    *   通过索引运算和生成新的列

    *   文件的读取和写入

    *   缺失值处理

    *   数据连接

    *   分组和聚合

    *   数据透视表

    *   字符串的处理

    *   本节小结

  *   Matplotlib与python作图/

    *   基础作图—折线图和散点图

    *   基础作图—直方图和饼图

    *   图表设置--子图和图例

    *   图表设置—标签、表格样式和cmap

    *   高级作图

    *   本节小结

  *   Sklearn与机器学习基础/

    *   线性回归

    *   逻辑回归的原理、模型实现与正则化

    *   逻辑回归的模型的评估以及最优迭代次数

    *   贝叶斯分类器的实现过程

    *   朴素贝叶斯算法案例-手写数字识别

    *   数据预处理

    *   决策树和随机森林—熵和决策树

    *   决策树和随机森林算法对比

    *   随机森林的调参

    *   支持向量机—核函数

    *   支持向量机是如何防止过拟合的

    *   如何使用Python实现PCA降维算法

    *   如何使用Python实现Kmeans聚类

    *   本节小结

*   第十一章 如何撰写数据分析报告(新增内容!)/

  *   为什么要写数据分析报告?/

    *   数据分析报告的目的

    *   数据分析报告的三要素

  *   如何撰写数据分析报告?/

    *   报告内容的风格

    *   报告的内在逻辑(核心!!!)

    *   报告的标题

  *   如何提升数据分析报告的颜值?/

    *   如何提升报告的颜值?

  *   报告实例分析/

    *   案例报告分析

  *   本章小结/

    *   本章小结

*   第十二章 课程总结图谱/

  *   课程总结图谱/

    *   课程总结