人工智能是当前乃至未来时代热门的技术之一,已在全球范围内掀起了研究与学习热潮,目前科学计算库、机器学习模型应用以及数据挖掘为人工智能提供存储和支持。

*   阶段一 人工智能/

  *   第一章 机器学习概述V2.1/

    *   机器学习介绍/

      *   01-0前置-机器学习科学计算库内容简介

      *   01-1讲解-机器学习科学计算库内容简介

      *   02-1讲解-人工智能概述

      *   02-2点评-人工智能概述

      *   03-1讲解-人工智能的发展历程

      *   04-1讲解-人工智能主要分支

      *   04-2点评-人工智能主要分支

      *   05-1讲解-机器学习定义工作流程概述

      *   05-2点评-机器学习定义工作流程概述

      *   06-1讲解-机器学习工作流程各步骤解释

      *   06-2点评-机器学习工作流程各步骤解释

      *   06-3点评-机器学习工作流程各步骤解释

      *   07-1讲解-机器学习算法分类介绍

      *   07-2点评-机器学习算法分类介绍

      *   08-1讲解-模型评估

      *   08-2点评-模型评估

      *   08-3点评-模型评估

      *   09-1讲解-Azure机器学习平台实验演示1

      *   10-1讲解-Azure机器学习平台实验演示2

      *   11-1讲解-深度学习简介

      *   11-2点评-深度学习简介

  *   第二章 环境安装和使用V2.1/

    *   环境安装及使用/

      *   12-1讲解-基础环境安装

      *   13-1讲解-jupyter notebook的基本使用1

      *   13-2点评-jupyter notebook的基本使用1

      *   14-1讲解-jupyter notebook的基本使用2

      *   14-2点评-jupyter notebook的基本使用2

      *   15-1讲解-matplotlib的基本使用

  *   第三章 matplotlibV2.1/

    *   matplotlib使用/

      *   01-1讲解-实现基础绘图-某城市温度变换图

      *   01-2点评-实现基础绘图-某城市温度变换图

      *   02-1讲解-绘图辅助功能完善-某城市温度变换图

      *   02-2点评-绘图辅助功能完善-某城市温度变换图

      *   03-1讲解-在一个坐标系下绘制多个图像

      *   03-2点评-在一个坐标系下绘制多个图像

      *   04-1讲解-在多个坐标系下绘制多个图像

      *   04-2点评-在多个坐标系下绘制多个图像

      *   05-1讲解-常见图形绘制

      *   05-2点评-常见图形绘制

  *   第四章 numpyV2.1/

    *   numpy使用/

      *   06-1讲解-numpy介绍

      *   06-2点评-numpy介绍

      *   07-1讲解-ndarray介绍

      *   07-2点评-ndarray介绍

      *   08-1讲解-创建0,1数组,固定范围数组

      *   08-2点评-创建0,1数组,固定范围数组

      *   09-1讲解-创建随机数组

      *   09-2点评-创建随机数组

      *   10-1讲解-数组的基本操作

      *   10-2点评-数组的基本操作

      *   10-3点评-前面总结

      *   10-4点评-回顾

      *   11-1讲解-ndarray的运算

      *   12-1讲解-数组间运算

      *   11-2点评-ndarray的运算

      *   12-2点评-数组间运算

      *   13-1讲解-矩阵复习

      *   13-2点评-矩阵复习

      *   13-3点评-矩阵复习

  *   第五章 pandasV2.1/

    *   pandas数据结构/

      *   14-1讲解-pandas介绍

      *   14-2点评-pandas介绍

      *   15-1讲解-pandas数据结构-series

      *   15-2点评-pandas数据结构-series

      *   16-1讲解-pandas数据结构-DataFrame1

      *   16-2点评-pandas数据结构-DataFrame1

      *   16-3点评-回顾总结

      *   17-1讲解-pandas数据结构-DataFrame2

      *   18-1讲解-pandas数据结构-multiindex和panel

      *   18-2点评-pandas数据结构-multiindex和panel

    *   pandas基础使用/

      *   01-1讲解-pandas中的索引

      *   01-2点评-pandas中的索引

      *   02-1讲解-赋值和排序

      *   02-2点评-赋值和排序

      *   03-1讲解-pandas中的算术运算和逻辑运算

      *   03-2点评-pandas中的算术运算和逻辑运算

      *   04-1讲解-pandas中的统计函数

      *   04-2点评-pandas中的统计函数

      *   05-1讲解-pandas中的累计统计函数和自定义函数

      *   05-2点评-pandas中的累计统计函数和自定义函数

      *   06-1讲解-pandas中绘图方式介绍

      *   07-1讲解-pandas中文件的读取和写入

      *   07-2点评-pandas中文件的读取和写入

      *   07-3点评-pandas中文件的读取和写入

      *   07-4点评-内容总结

    *   pandas高级使用/

      *   08-1讲解-缺失值的处理

      *   08-2点评-缺失值的处理

      *   09-1讲解-数据离散化

      *   09-2点评-数据离散化

      *   10-1讲解-数据表的合并

      *   10-2点评-数据表的合并

      *   11-1讲解-交叉表和透视表介绍

      *   11-2点评-交叉表和透视表介绍

      *   11-3点评-内容回顾

      *   12-1讲解-分组聚合介绍

      *   12-2点评-分组聚合介绍

      *   13-1讲解-星巴克案例实现

      *   13-2点评-星巴克案例实现

    *   电影案例分析/

      *   14-0前置-电影案例分析1

      *   14-1讲解-电影案例分析1

      *   14-2点评-电影案例分析1

      *   15-1讲解-电影案例分析

      *   15-2点评-电影案例分析

      *   15-3点评-电影案例分析

  *   第六章 seabornV2.1/

    *   绘制统计图/

      *   01-1讲解-绘制单变量分布

      *   01-2点评-绘制单变量分布

      *   02-1讲解-绘制双变量分布图形

      *   02-2点评-绘制双变量分布图形

    *   分类数据绘图/

      *   03-1讲解-类别散点图的绘制

      *   03-2点评-类别散点图的绘制

      *   03-3点评-内容回顾

      *   04-1讲解-类别内的数据分布和统计估计

      *   04-2点评-类别内的数据分布和统计估计

    *   NBA案例/

      *   05-1讲解-NBA数据获取和相关性基本分析

      *   05-2点评-NBA数据获取和相关性基本分析

      *   06-1讲解-对数据进行分析-seaborn

      *   06-2点评-对数据进行分析-seaborn

      *   07-1讲解-衍生变量的可视化实践

      *   07-2点评-衍生变量的可视化实践

      *   08-1讲解-球队数据分析

      *   08-2点评-球队数据分析

    *   北京租房数据统计分析/

      *   09-0前置-北京市租房数据获取和重复值与空值处理

      *   09-1讲解-北京市租房数据获取和重复值与空值处理

      *   09-2点评-北京市租房数据获取和重复值与空值处理

      *   10-1讲解-数据类型转换(面积,户型)

      *   10-2点评-数据类型转换(面积,户型)

      *   11-1讲解-房源数量和位置分布分析

      *   11-2点评-房源数量和位置分布分析

      *   12-1讲解-户型数量基本分析

      *   12-2点评-户型数量基本分析

      *   12-3点评-户型数量基本分析

      *   13-1讲解-平均租金基本分析

      *   13-2点评-平均租金基本分析

      *   14-1讲解-面积区间分析

      *   14-2点评-面积区间分析

      *   14-3点评-内容总结

  *   第七章 K近邻算法V2.1/

    *   k近邻算法介绍/

      *   01-0前置-K-近邻算法简介

      *   01-1讲解-K-近邻算法简介

      *   01-2点评-K-近邻算法简介

      *   02-1讲解-K近邻算法api初步使用

      *   02-2点评-K近邻算法api初步使用

      *   03-1讲解-机器学习中距离度量介绍

      *   03-2点评-机器学习中距离度量介绍

      *   04-1讲解-K值的选择介绍

      *   04-2点评-K值的选择介绍

    *   kd树/

      *   05-1讲解-kd树和kd树的构造过程

      *   05-2点评-kd树和kd树的构造过程

      *   06-1讲解-kd树案例实现

      *   06-2点评-kd树案例实现

      *   06-3点评-内容回顾

      *   06-4点评-kd树案例实现

    *   数据集处理/

      *   07-1讲解-数据集获取和属性介绍

      *   07-2点评-数据集获取和属性介绍

      *   08-1讲解-数据可视化介绍

      *   08-2讲解-数据可视化介绍

      *   09-1讲解-数据集的划分

      *   09-2点评-数据集的划分

    *   特征工程/

      *   10-1讲解-特征预处理简介

      *   10-2点评-特征预处理简介

      *   11-1讲解-归一化和标准化介绍

      *   11-2点评-归一化和标准化介绍

      *   11-3点评-归一化和标准化介绍

    *   KNN总结/

      *   12-1讲解-鸢尾花种类预测

      *   12-2点评-鸢尾花种类预测

      *   12-3点评-内容总结

      *   12-4点评-内容回顾

      *   13-1讲解-KNN算法总结

      *   13-2点评-KNN算法总结

    *   交叉验证, 网格搜索/

      *   14-1讲解-交叉验证、网格搜索概念介绍

      *   14-2点评-交叉验证、网格搜索概念介绍

      *   15-1讲解-交叉验证、网格搜索案例实现

      *   15-2点评-交叉验证、网格搜索案例实现

    *   案例 Facebook位置预测/

      *   01-1讲解-案例-Facebook位置预测流程分析

      *   01-2点评-案例-Facebook位置预测流程分析

      *   02-1讲解-案例-Facebook位置预测代码实现1

      *   02-2点评-案例-Facebook位置预测代码实现1

      *   03-1讲解-案例-Facebook位置预测代码实现2

      *   03-3点评-案例-Facebook位置预测代码实现2

      *   04-1讲解-补充-数据分割和留出法

      *   04-2点评-补充-数据分割和留出法

      *   05-1讲解-补充-交叉验证法和自助法

      *   05-2点评-补充-交叉验证法和自助法

  *   第八章 线性回归V2.1/

    *   回归介绍/

      *   06-1讲解-线性回归简介

      *   06-2点评-线性回归简介

      *   07-1讲解-初始线性回归api

      *   08-1讲解-数学:求导

      *   08-2点评-数学:求导

    *   损失优化/

      *   09-1讲解-线性回归中损失函数的介绍

      *   09-2点评-线性回归中损失函数的介绍

      *   10-1讲解-使用正规方程对损失函数进行优化

      *   10-2点评-使用正规方程对损失函数进行优化

      *   11-1讲解-使用梯度下降法对损失函数进行优化

      *   11-2点评-使用梯度下降法对损失函数进行优化

    *   回归相关知识/

      *   12-1讲解-梯度下降法方法介绍

      *   12-2点评-梯度下降法方法介绍

      *   12-3点评-内容回顾

      *   13-0前置-线性回归api再介绍

      *   13-1讲解-线性回归api再介绍

      *   13-2点评-线性回归api再介绍

      *   14-1讲解-波士顿房价预测案例

      *   14-2点评-波士顿房价预测案例

      *   15-1讲解-欠拟合和过拟合的介绍

      *   15-2点评-欠拟合和过拟合的介绍

      *   16-1讲解-正则化线性模型

      *   16-2点评-正则化线性模型

      *   17-1讲解-岭回归介绍

      *   17-2点评-岭回归介绍

      *   18-1讲解-模型保存和加载

      *   18-2点评-模型保存和加载

  *   第九章 逻辑回归V2.1/

    *   逻辑回归/

      *   01-1讲解-逻辑回归介绍

      *   01-2点评-逻辑回归介绍

      *   02-1讲解-逻辑回归api介绍

      *   02-2点评-内容回顾

      *   03-1讲解-肿瘤预测案例

      *   03-2点评-肿瘤预测案例

      *   04-1讲解-分类评估方法介绍

      *   04-2点评-分类评估方法介绍

      *   05-1讲解-roc曲线绘制过程

      *   05-2点评-roc曲线绘制过程

      *   05-3点评-roc曲线绘制过程

      *   06-1讲解-补充-类别不平衡数据介绍

      *   06-2点评-补充-类别不平衡数据介绍

      *   07-1讲解-补充-过采样和欠采样介绍

      *   07-2点评-补充-过采样和欠采样介绍

  *   第十章 决策树V2.1/

    *   信息增益/

      *   08-1讲解-决策树算法简介

      *   09-1讲解-熵的介绍

      *   09-2点评-熵的介绍

      *   09-3点评-内容回顾

      *   09-3点评-熵的介绍

      *   10-0前置-信息增益的介绍

      *   10-1讲解-信息增益的介绍

      *   10-2点评-信息增益的介绍

      *   11-1讲解-信息增益率的介绍

      *   11-2点评-信息增益率的介绍

      *   12-1讲解-基尼指数的介绍

      *   12-2点评-基尼指数的介绍

      *   13-1讲解-决策树划分原理小结

      *   13-2点评-决策树划分原理小结

      *   14-1讲解-cart剪枝介绍

      *   14-2点评-cart剪枝介绍

    *   特征提取/

      *   15-1讲解-字典特征提取

      *   15-2点评-字典特征提取

      *   16-1讲解-英文文本特征提取

      *   16-2点评-英文文本特征提取

      *   17-1讲解-中文文本特征提取

      *   17-2点评-中文文本特征提取

      *   18-1讲解-tfidf内容讲解

      *   18-2点评-tfidf内容讲解

      *   18-3点评-tfidf内容讲解

    *   案例:泰坦生存预测/

      *   01-1讲解-决策树算法api介绍

      *   01-2点评-决策树算法api介绍

      *   02-1讲解-泰坦尼克号乘客生存预测

      *   02-2点评-泰坦尼克号乘客生存预测

      *   03-1讲解-树木可视化操作

      *   03-2点评-树木可视化操作

    *   回归决策树/

      *   04-1讲解-回归决策树介绍

      *   04-2点评-回归决策树介绍

      *   05-1讲解-回归决策树和线性回归对比

      *   05-2点评-回归决策树和线性回归对比

  *   第十一章 集成学习V2.1/

    *   集成介绍/

      *   06-1讲解-集成学习基本介绍

      *   07-1讲解-bagging和随机森林

      *   07-2点评-bagging和随机森林

      *   07-3点评-bagging和随机森林

      *   07-4点评-内容回顾

    *   随机森林案例/

      *   08-1讲解-otto案例介绍以及数据获取

      *   08-2点评-otto案例介绍以及数据获取

      *   09-1讲解-otto数据基本处理

      *   09-2点评-otto数据基本处理

      *   10-1讲解-otto数据模型基本训练

      *   10-2点评-otto数据模型基本训练

      *   11-1讲解-模型调优和确定最优模型

      *   11-2点评-模型调优和确定最优模型

      *   11-3点评-模型调优和确定最优模型

      *   12-1讲解-生成提交数据

      *   12-2点评-生成提交数据

    *   集成学习/

      *   13-1讲解-boosting介绍

      *   13-2点评-boosting介绍

      *   14-1讲解-GBDT的介绍

      *   14-2点评-GBDT的介绍

  *   第十二章 聚类算法V2.1/

    *   聚类算法/

      *   01-1讲解-聚类算法介绍

      *   02-1讲解-聚类算法api初步实现

      *   02-2点评-聚类算法api初步实现

      *   03-1讲解-聚类算法实现流程

      *   03-2点评-聚类算法实现流程

      *   04-1讲解-模型评估

      *   04-2点评-模型评估

      *   05-1讲解-算法优化介绍

      *   05-2点评-算法优化介绍

      *   06-1讲解-特征降维内容介绍

      *   06-2点评-特征降维内容介绍

      *   07-1讲解-pca降维介绍

      *   08-1讲解-用户对物品类别的喜好细分案例

      *   08-2点评-用户对物品类别的喜好细分案例

  *   第十三章 朴素贝叶斯V2.1/

    *   朴素贝叶斯/

      *   09-1讲解-初始朴素贝叶斯

      *   09-2点评-初始朴素贝叶斯

      *   10-1讲解-概率内容复习

      *   10-2点评-概率内容复习

      *   11-1讲解-朴素贝叶斯计算案例

      *   11-2点评-朴素贝叶斯计算案例

      *   12-1讲解-朴素贝叶斯案例实现1

      *   13-1讲解-朴素贝叶斯案例实现2

      *   13-2点评-朴素贝叶斯案例实现2

      *   13-3点评-内容回顾

      *   13-4点评-内容回顾

      *   14-1讲解-朴素贝叶斯内容总结

      *   14-2点评-朴素贝叶斯内容总结

  *   第十四章 SVM算法V2.1/

    *   SVM算法/

      *   01-1讲解-SVM基本介绍

      *   01-2点评-SVM基本介绍

      *   02-1讲解-SVM算法api初步使用

      *   03-1讲解-SVM算法推导的目标函数

      *   03-2点评-SVM算法推导的目标函数

      *   04-1讲解-SVM目标函数推导过程及举例

      *   04-2点评-SVM目标函数推导过程及举例

      *   04-3点评-内容回顾

      *   05-1讲解-SVM损失函数

      *   05-2点评-SVM损失函数

      *   06-1讲解-SVM的核方法介绍

      *   06-2点评-SVM的核方法介绍

      *   07-1讲解-SVM回归介绍

      *   07-2点评-SVM回归介绍

      *   08-1讲解-SVM算法api再介绍

      *   08-2点评-SVM算法api再介绍

      *   09-1讲解-数字识别器案例初步介绍

      *   09-2点评-数字识别器案例初步介绍

      *   10-1讲解-数字识别器-获取数据

      *   10-2点评-数字识别器-获取数据

      *   11-1讲解-数字识别器-数据基本处理和模型训练

      *   11-2点评-数字识别器-数据基本处理和模型训练

      *   12-1讲解-SVM总结

      *   12-2点评-SVM总结

      *   12-3点评-内容总结

  *   第十五章 EM算法V2.1/

    *   EM算法/

      *   01-1讲解-初识EM算法

      *   01-2点评-初识EM算法

      *   02-1讲解-EM算法介绍

      *   02-2点评-EM算法介绍

      *   02-3点评-内容回顾

      *   03-0前置-EM算法实例

      *   03-1讲解-EM算法实例

      *   03-2点评-EM算法实例

  *   第十六章 HMM算法V2.1/

    *   HMM算法/

      *   04-1讲解-马尔科夫链的介绍

      *   04-2点评-马尔科夫链的介绍

      *   05-1讲解-HMM模型的简单案例

      *   05-2点评-HMM模型的简单案例

      *   06-1讲解-HMM模型三种经典问题举例求解

      *   06-2点评-HMM模型三种经典问题举例求解

      *   07-1讲解-HMM模型基础

      *   07-2点评-HMM模型基础

      *   08-1讲解-前向后向算法评估观察序列概率

      *   08-2点评-前向后向算法评估观察序列概率

      *   08-3点评-内容回顾

      *   08-4点评-前向后向算法评估观察序列概率

      *   09-1讲解-维特比算法解码隐藏状态序列

      *   09-2点评-维特比算法解码隐藏状态序列

      *   10-1讲解-鲍姆-韦尔奇算法简介

      *   11-1讲解-HMM模型api介绍及案例代码实现

      *   11-2点评-HMM模型api介绍及案例代码实现

  *   第十七章 集成学习进阶V2.1/

    *   XGBoost算法/

      *   01-1讲解-xgboost最优模型构建方法

      *   01-2点评-xgboost最优模型构建方法

      *   02-1讲解-目标函数确定和树的复杂度介绍

      *   02-2点评-目标函数确定和树的复杂度介绍

      *   03-1讲解-XGBoost目标函数的推导

      *   03-2点评-回顾

      *   03-2点评-XGBoost目标函数的推导

      *   04-1讲解-XGBoost的回归树构建方法

      *   04-2点评-XGBoost的回归树构建方法

      *   05-1讲解-XGBoost和GBDT的区别

      *   05-2点评-XGBoost和GBDT的区别

      *   06-1讲解-xgboost算法api与参数介绍

      *   06-2点评-xgboost算法api与参数介绍

      *   07-1讲解-xgboost简单案例介绍

    *   otto案例/

      *   08-1讲解-otto案例xgboost实现-数据基本处理

      *   08-2点评-otto案例xgboost实现-数据基本处理

      *   08-3点评-otto案例xgboost实现-数据基本处理

      *   09-1讲解-otto案例xgboost实现-模型基本训练

      *   10-1讲解-otto案例xgboost实现-模型调优

      *   10-2点评-otto案例xgboost实现-模型调优

      *   10-3点评-内容回顾

      *   11-1讲解-otto案例xgboost实现-最优模型运行

    *   lightGBM算法/

      *   01-1讲解-lightGBM简单介绍

      *   01-2点评-lightGBM简单介绍

      *   02-1讲解-lightGBM算法原理介绍

      *   02-2点评-lightGBM算法原理介绍

      *   03-1讲解-lightGBM算法api参数介绍

      *   03-2点评-lightGBM算法api参数介绍

      *   04-1讲解-lightGBM算法简单案例介绍

      *   04-2点评-lightGBM算法简单案例介绍

      *   05-1讲解-pubg案例简介

      *   05-2点评-pubg案例简介

    *   绝地求生案例/

      *   06-1讲解-获取pubg数据

      *   06-2点评-获取pubg数据

      *   07-1讲解-数据缺失值处理和查看每场比赛人数

      *   07-2点评-数据缺失值处理和查看每场比赛人数

      *   07-3点评-内容回顾

      *   08-1讲解-规范化输出部分数据和部分变量合成

      *   09-1讲解-异常值处理1

      *   09-2点评-异常值处理1

      *   10-1讲解-异常值值处理2

      *   10-2点评-异常值值处理2

      *   11-1讲解-类别型数据处理

      *   11-2点评-类别型数据处理

      *   12-1讲解-数据截取、确定特征值和目标值、分割数据集

      *   13-1讲解-使用RF进行模型训练

      *   13-2点评-使用RF进行模型训练

      *   14-1讲解-lightGBM对模型调优1

      *   14-2点评-lightGBM对模型调优1

      *   15-1讲解-lightGBM对模型调优2

      *   15-2点评-lightGBM对模型调优2

*   阶段二 数据挖掘/

  *   第一章 SparkMllib数据挖掘+SparkGraphX/

    *   1-SparkMllib机器学习理论基础详解/

      *   01-机器学习和大数据的区别(一)

      *   02-机器学习和大数据的区别和联系(二)

      *   03-机器学习和大数据的区别和联系(三)

      *   04-人工智能和机器学习的区别

      *   05-数据分析和数据挖掘联系

      *   06-什么是机器学习问题

      *   07-基于规则的学习和基于模型的学习方式

      *   08-机器学习数据集概述1

      *   09-机器学习数据集概述2

      *   10-机器学习数据集概述3

      *   11-机器学习问题分类

      *   12-机器学习三要素强化

      *   13-构建机器学习模型的流程

      *   14-模型选择

      *   15-交叉验证及经验和结构风险

    *   2-SparkMllib库特征工程基础与实战(一)/

      *   01-SparkMllib的功能

      *   2-SparkMllib的版本

      *   3-SparkMllib架构

      *   4-环境搭建及RDD、DF、DS的转换实践

      *   5-如何利用SparkMllib构建机器学习推荐架构

      *   6.SparkMllib算法分类及应用场景

      *   7-SparkMllib基础数据类型-localvector

      *   8-SparkMllib基础数据类型-labelpoint

      *   9.SparkMllib基础数据类型-libsvm数据读取

      *   10.SparkMllib基础数据类型-localmatrix

      *   11.SparkMllib基础数据类型-分布式行矩阵和行索引矩阵

      *   12.SparkMllib基础数据类型-分块矩阵

      *   13.SparkMllib均值和方差

      *   14-SparkMllib相关系数

      *   15-SparkMllib假设检验的卡方验证

      *   16-SparkMllib假设检验和随机数的产生

      *   17-特征提取tf-ifd

      *   18-特征提取-word2vec实践

      *   19-特征提取CountVector

    *   3-SparkMllib库特征工程基础与实战(二)/

      *   20-特征转化的二值化操作

      *   21-特征转换-PCA操作

      *   22-特征转换-类别型数据和数值型数据转换

      *   23-特征转换-OneHot编码方式

      *   24-特征转换-VectorIndexer转换操作

      *   25-正则项

      *   26-数值型数据处理的方法

      *   27-Bucketizer分箱

      *   28-ElementWise与SQLTransform实践

      *   29-特征转换VectorAssemble

      *   30-特征转换-QuantileDiscretizer

      *   31-特征选择VectorSlicer

      *   32-RFormula和卡方验证选择特征方法

      *   33-卡方验证案例补充

      *   36-案例实践2-Iris统计初步实践

      *   37-案例实践2-Iris的rdd相关系数实践

      *   38-案例实践2-iris的Dataframe数据统计

      *   39-案例实践2-iris的SParkMllib特征工程实践

    *   4-SparkMllib决策树算法基础与实战/

      *   1-了解什么是决策树

      *   2.基于规则建树

      *   3-信息熵的理解

      *   4-ID3算法步骤详解

      *   5-ID3算法举例和C4.5算法改进

      *   6-决策树的剪枝方式

      *   7-电商购买数据集ID3算法对比实践

      *   8-Cart树的回归树原理理解

      *   9-Cart树算法案例讲解

      *   10-Cart分类树原理及Gini系数

      *   11-Cart分类树的案例

      *   12-SparkMllib实战libsvm数据建模

      *   13-SparkMl实战libsvm数据全流程讲解实战

      *   14-SparkMllib相亲数据建模分析

      *   15-SparkMllib实战iris鸢尾花实战

      *   16-SparkMl实战Iris特征工程及建模实战1

    *   5-SparkMllib高级模块与线性回归基础及实战/

      *   1-SparkMllib的pipeline简介

      *   2-Dataframe组件

      *   3-Pipeline原理

      *   4-通过set方法和ParamMap方法赋值超参数的选项

      *   5-通过pipeline完成案例的代码编写

      *   6-如何对模型选择与优化

      *   7-超参数的网格搜索

      *   8-简单交叉验证及模型选择

      *   9-简单线性回归

      *   10-最小二乘法解决简单线性回归原理

      *   11-多元线性回归简介

      *   12-最小二乘推导补充(补充)

      *   13-线性回归的变体及各适用场景

      *   14-SparkMl实战脂肪数据集的案例

      *   15-SparkMl实战运输时间的预测分析

      *   16-SparkMllib基于RDD结构实战线性回归实例

      *   16-SparkMl实战libsvm数据的形式

      *   17-Sparkml完成房价预测分析实战

    *   6-SparkMllib聚类算法基础与实战/

      *   1-什么是聚类

      *   2-关于多种距离的度量简介

      *   3-聚类算法核心思想

      *   4-KMeans的举例

      *   5-Kmens算法性能指标分析

      *   6-KMeans特点及注意事项

      *   7-SparkMLIB实战KMEans算法

      *   8-SparkMLLIB实现药品数据得简单聚类

      *   9-SparkMl实现基本数据的聚类分析实战

      *   10-SparkMl和parkSql实现经纬度数据聚类分析实战

      *   11-k-medoids了解

      *   12-其他聚类思路-层次聚类方法

      *   13-基于密度的聚类DBSCAN

      *   14-GMM模型原理

      *   15-聚类算法的总结:

      *   16-SparkMllib实现对于层次聚类的分析

      *   17-SparkMllib完成对于GMM高斯混合模型实践分析

      *   18-SparkLDA实现了主题的提取实战

      *   19-SparkML实现IRis鸢尾花的聚类算法实战

    *   7-SparkGraphX理论基础与实战/

      *   1-图基本概念以及图计算应用

      *   2-SparkGraphX简介

      *   3-SparkGraphX图算法

      *   4-SparkGraphX抽象是RDPG---弹性分布式属性图

      *   5-SparkGraphX架构层面及存储方式简介

      *   6-SparkGraphX定义顶点操作

      *   7-SparkGraphX构件图及查询的操作

      *   8-图的基本数据结构

      *   9-图的类型和图的存储方式简介

      *   10-构建图的方法原理及源码了解创建过程

      *   11-构建图的操作代码

      *   12-社交网络数据的创建部分代码实战

      *   13-图的基本信息--顶点、边、入度、出度

      *   14-图的转换操作:mapVertices、mapEdges、mapTriplet

      *   15-图的结构操作:reverse、subgraph、mask、groupGraph

      *   16-图的关联操作

      *   17-图的聚合以及图的操作API总结

    *   8-SparkGraphX与SparkMllib综合实战/

      *   1-PageRank算法的基本假设和理解

      *   2-PageRank算法思想

      *   3-PageRank算法深入

      *   4-SparkGraphX通过社交网络数据完成重要节点的选择

      *   5-通过wiki数据达到网页重要性的pagerank度量

      *   6-通过PageRank算法得到网页排名的重要性

      *   7-广度优先遍历

      *   8-SparkGrphX实现最短路径

      *   9-连通图和强联通图

      *   10-SparkGraphx实战三角关系网络发现

      *   11-SVD++原理

      *   12-SVD++实战推荐算法预测