本课程专注于培养数据分析师的数据处理能力、数据分析能力和数据挖掘能力,课程内容从数据库管理、统计理论方法、数据分析主流软件的应用(包括SQL、Excel、SPS
* 第一章 数据分析师职业概览/
* 数据分析师的职业概览/
* 数据分析师的“钱”景如何
* 什么人适合学数据分析
* 数据分析师的临界知识
* 数据分析师的主要职责
* 第二章 数据分析和数据挖掘的概念和理论/
* 基础概念/
* 数据分析及数据挖掘定义
* 数据分析与数据挖掘的层次
* 数据分析及数据挖掘三要素
* 本节小结
* 探索性数据分析/
* 如何描述业务量数据
* 可视化展示的原则
* 本节小结
* 预测和分类/
* 预测和分类的概念模型、流程
* 分类和预测:线性回归
* 逻辑回归
* 决策树算法
* 支持向量机
* 朴素贝叶斯
* 本节小结
* 分群和降维/
* 聚类算法的基本概念
* 层次聚类
* K-means聚类
* 降维模型-PCA
* 本节小结
* 第三章 统计学基础和SPSS软件应用/
* 描述性统计分析/
* 统计分析的目的
* 统计分析的关键概念
* 四种测量尺度
* 集中趋势-均值
* 集中趋势-中位数和众数
* 离散趋势-极差和标准差
* 案例操作-如何实现离散趋势和集中趋势
* 本节小结
* 假设检验/统计判断/
* 统计学本质
* 统计学两大定理
* 统计推断-抽样误差与标准误
* 统计推断-t分布
* 统计判断-参数估计
* 统计推断—假设检验
* 本节小结
* 抽样方法/
* 统计过程
* 抽样的概念
* 抽样方法与非抽样方法
* 抽样调查与普查的特点
* 非抽样误差
* 非抽样误差的三种类型
* 无回答误差的处理
* 抽样过程
* 抽样单元与抽样框
* 抽样形式
* 概率抽样-简单随机抽样和系统抽样
* 概率抽样-PPS抽样
* 概率抽样-分层抽样
* 非概率抽样-区域抽样、时间抽样和电话抽样
* 本节小结
* 一般线性模型/
* t检验
* t检验-案例实践
* F检验
* F检验-案例实践
* 相关分析
* 相关分析-案例实践
* 线性回归
* 线性回归-案例实践
* 本节小结
* 第四章 数据预处理基础/
* 数据分析前的准备工作/
* 统计工作流程
* 统计准备工作
* 数据检查要点
* 开放题的准备
* 本节小结
* 数据清洗/
* 数据清洗的概念和流程
* 字段选择与数据质量报告
* 数据清洗主要工作
* 错误值和异常值处理方法
* 缺失值处理方法
* 异常值和缺失值的处理操作
* 本节小结
* 数据规范化/
* 数据转化
* 数据离散化与数据扩充
* 数据合并与拆分
* 本节小结
* 第五章 Mysql教程/
* SQL简介/
* SQL简介
* 建立数据库
* 建立数据表和约束条件
* 插入和更改
* 本节小结
* 基本查询语句/
* 基本查询语句
* 本节小结
* 交叉查询和子查询/
* 聚合函数和交叉查询;group by
* 子查询(in、not in)&模糊匹配 Like
* 本节小结
* 练表查询/
* 连表查询
* 本节小结
* 相关函数/
* 控制流函数
* 时间函数
* 常用字符串相关的函数
* 第六章 Excel分析及可视化/
* Excel简介/
* Excel简介
* Excel函数技巧/
* 函数的简介
* 查找函数—vlookup和hlookup
* 查找函数—INDEX和MATCH
* 统计函数
* 逻辑函数(上)-if、and和or
* 逻辑函数(下)
* 日期函数和文本函数
* 本节小结
* Excel快速处理技巧/
* 宏的技巧
* 数据透视表和选择性粘贴
* 格式调整技巧
* 查找和定位&数据有效性技巧
* 快捷键相关技巧
* 本节小结
* Excel可视化技巧/
* 如何制作一张图
* 组合图的做法
* 条形图的变体
* 数据气泡地图的做法
* 本节小结
* 第七章 进阶统计学/
* 多变量分析方法选择思路/
* 多变量分析方法的选择
* 无监督分析和有监督分析
* 无监督分析的原则
* 因子分析/
* 因子分析使用场景
* 因子的概念及分析过程
* 因子数的推定
* 因子轴的旋转
* 因子解释及因子得分计算
* 案例实践
* 如何用因子分析做评价
* 聚类分析/
* 聚类分析使用场景
* 聚类分析算法
* 非层次法聚类K-means
* K-means-案例实践
* 二阶聚类
* 对应分析/
* 对应分析使用目的及结果解读
* 对应分析案例实践
* 多维尺度分析/
* 概念和使用场景
* 多维尺度分析举例
* 案例1:根据学生评分进行分座位
* 案例2:根据学生考试成绩进行分座位
* 案例3:根据手机的相似度判断竞争力
* 多维尺度的不足及替代方法
* 时间序列分析/
* 时间序列使用场景
* 两种类型的时间序列
* 时间序列模型ARIMA
* 时间序列中的处理方法
* 案例实践—某连锁超市销售额影响因素预测
* Logistic/
* 使用场景和理论背景
* Logisitic案例实践-用户流失的影响因素及新用户预测
* 第八章 经典数据挖掘算法/
* 数据挖掘基础及数据分层抽样/
* 生活中熟悉的数据挖掘案例
* 数据准备及数据分割方式
* 数据分析与数据挖掘的联系与区别
* Modeler软件介绍
* 如何在Modeler实现数据分层抽样
* 朴素贝叶斯/
* 朴素贝叶斯原理
* 朴素贝叶斯算法过程
* 朴素贝叶斯算法举例
* 朴素贝叶斯算法优点及不足
* 案例实践-使用贝叶斯网络建模
* 决策树/
* 决策树应用场景
* 决策树算法(1)—ID3
* 决策树算法(2)—C4.5
* 决策树算法(3)—回归树CART
* 决策树算法(4)-CHAID
* 防止过度拟合的问题
* 使用Modeler如何做决策树
* 神经网络/
* 神经网络的组成
* 计算误差函数,修正初始权重
* 神经网络与其他分析的关系
* 案例实践
* 支持向量机/
* 支持向量机原理介绍
* 线性可分与线性不可分
* 案例实践
* 集成算法和模型评估/
* 集成算法的目的与方式
* Bagging与Boosting的计算原理
* 根据混淆矩阵进行模型评估
* 在Modeler中画出GAIN曲线图和Lift曲线图
* 学习资料拓展
* 第九章 R语言入门及基础分析/
* R语言基础操作/
* 初识R语言
* R语言的基本操作
* R语言的数据结构介绍
* 向量和矩阵的基本操作
* 数据框的操作
* 循环控制流—for&whlie
* 条件选择控制流-if
* 自定义函数
* R语言关于概率分布的函数及应用介绍
* 离散随机变量分布和连续随机变量分布
* R语言描述性数据分析/
* 探索性数据分析—集中趋势和离中趋势
* 探索性数据分析—相关系数及函数介绍
* 探索性数据分析—假设检验
* R语言回归算法/
* 回归基本算法及相关函数介绍(上)
* 回归基本算法及相关函数介绍(下)
* 模型选择
* 回归诊断
* R语言分类算法/
* 逻辑回归(上)
* 逻辑回归(下)
* 决策树算法
* 决策树的剪枝
* 随机森林
* R语言聚类和降维/
* 使用R如何实现层次聚类
* 使用R如何实现kmeans聚类法
* 如何判定聚类的好坏
* 使用R如何实现PCA降维算法
* 第十章 Python入门及基础分析/
* 概述与基本操作/
* 课程与开发环境简介
* 帮助文档的获取&基础操作
* 基础操作:整数、小数、复数&列表、字符串、字典
* 控制流函数
* 自定义函数
* Jupyter常用快捷键以及自动补全功能的实现
* 本节小结
* Numpy/
* 从头创建一个数组
* 案例实践-如何实现99乘法表和老虎机
* 数组的操作
* 数组的计算
* 数组的广播
* 比较、掩码和布尔逻辑
* Pandas/
* 序列和数据框
* 索引和切片
* 通过索引运算和生成新的列
* 文件的读取和写入
* 缺失值处理
* 数据连接
* 分组和聚合
* 数据透视表
* 字符串的处理
* 本节小结
* Matplotlib与python作图/
* 基础作图—折线图和散点图
* 基础作图—直方图和饼图
* 图表设置--子图和图例
* 图表设置—标签、表格样式和cmap
* 高级作图
* 本节小结
* Sklearn与机器学习基础/
* 线性回归
* 逻辑回归的原理、模型实现与正则化
* 逻辑回归的模型的评估以及最优迭代次数
* 贝叶斯分类器的实现过程
* 朴素贝叶斯算法案例-手写数字识别
* 数据预处理
* 决策树和随机森林—熵和决策树
* 决策树和随机森林算法对比
* 随机森林的调参
* 支持向量机—核函数
* 支持向量机是如何防止过拟合的
* 如何使用Python实现PCA降维算法
* 如何使用Python实现Kmeans聚类
* 本节小结
* 第十一章 如何撰写数据分析报告(新增内容!)/
* 为什么要写数据分析报告?/
* 数据分析报告的目的
* 数据分析报告的三要素
* 如何撰写数据分析报告?/
* 报告内容的风格
* 报告的内在逻辑(核心!!!)
* 报告的标题
* 如何提升数据分析报告的颜值?/
* 如何提升报告的颜值?
* 报告实例分析/
* 案例报告分析
* 本章小结/
* 本章小结
* 第十二章 课程总结图谱/
* 课程总结图谱/
* 课程总结





![[衡天云]爆款云服务器 低至12元/月](/hty.png)