第一章:Python基础与必备工具包实战 · 1-1-Python基础 · 1-2-Numpy矩阵计算工具包 · 1-3-Pandas数据分析工具包 · 1-3-Pandas数据分析工具包 · 1-4-可视化库-Matplotlib · 1-4-可视化库-Matplotlib · 1-5-可视化库-Seaborn · 1-5-可视化库-Seaborn · 第二章:机器学习算法及其实验分析 · 2-1-线性回归原理推导 · 2-2-线性回归代码实现 · 2-3-模型评估方法-类模型评估 · 2-4-线性回归实验分析 · 2-4-线性回归实验分析 · 2-5-逻辑回归原理推导 · 2-6-逻辑回归代码实现 · 2-6-逻辑回归代码实现 · 2-7-逻辑回归实验分析 · 2-8-聚类算法-Kmeans&Dbscan原理 · 2-9-聚类Kmeans代码实现 · 2-10-聚类算法实验分析 · 2-10-聚类算法实验分析 · 2-11-决策树原理 · 2-12-决策树代码实现 · 2-13-决策树实验分析 · 2-14集成算法原理 · 2-15-集成算法实验分析 · 2-15-集成算法实验分析 · 2-16-支持向量机原理推导 · 2-17-支持向量机实验分析 · 2-18-神经网络算法原理 · 2-18-神经网络算法原理 · 2-19-神经网络代码实现 · 2-19-神经网络代码实现 · 2-20-贝叶斯算法原理 · 2-21-贝叶斯代码实现 · 2-22-关联规则实战分析 · 2-23-关联规则代码实现 · 2-24-词向量word2vec通俗解读 · 2-25-代码实现word2vec词向量模型 · 2-26-推荐系统原理分析 · 2-27-打造音乐推荐系统 · 2-28-线性判别分析降维算法原理解读 · 2-29-主成分分析降维算法原理解读 · 2-30-隐马尔科夫模型 · 2-31-HMM应用实例 · 第三章:数据分析与挖掘实战集锦 · 3-1-Python实战关联规则 · 3-2-爱彼迎数据集分析与建模 · 唐老师数据分析第三章基于相似度的酒店推荐系统 · 3-4-商品销售额回归分析 · 3-5-绝地求生数据集探索分析与建模 · 3-5-绝地求生数据集探索分析与建模 · 3-7-自然语言处理必备工具包实战(上) · 3-7-自然语言处理必备工具包实战(下) · 3-8-NLP核心模型-word2vec · 3-9-文本特征处理方法对比 · 3-10-数据特征预处理(上) · 3-10-数据特征预处理(下) · 3-11-银行客户还款可能性预测(上) · 3-11-银行客户还款可能性预测(下) · 3-12-图像特征聚类分析实践 · 第四章:数据挖掘项目解决方案实战 · 4-1-快手短视频用户活跃度分析 · 4-2-工业化工生产预测 · 4-3-智慧城市-道路通行时间预测 · 4-4-特征工程建模可解释工具包 · 4-5-医学糖尿病数据命名实体识别 · 4-6-贷款平台风控模型-特征工程 · 4-7-新闻关键词抽取模型 · 4-8-数据特征常用构建方法 · 4-9-用电敏感客户分类 · 4-10-1-机器学习项目实战-数据处理与特征提取 · 4-10-2-机器学习项目实战-建模与分析

*   01 第一章:Python基础与必备工具包实战/

  *   01 01 Python机器学习实训营.docx

*   02 1-1-Python基础/

  *   01 Python环境配置及其工具使用

  *   02 Python基础操作实例

  *   03 Python常用操作演示

  *   04 函数与类

*   03 1-2-Numpy矩阵计算工具包/

  *   01 Numpy工具包概述

  *   02 数组结构

  *   03 属性与赋值操作

  *   04 数据索引方法

  *   05 数值计算方法

  *   06 排序操作

  *   07 数组形状

  *   08 数组生成常用函数

  *   09 随机模块

  *   10 读写模块

*   04 1-3-Pandas数据分析工具包/

  *   01 Pandas工具包使用简介

  *   02 数据信息读取与展示

  *   03 索引方法

  *   04 groupby函数使用方法

  *   05 数值运算

  *   06 merge合并操作

  *   07 pivot数据透视表

  *   08 时间操作

  *   09 apply自定义函数

  *   10 常用操作

*   05 1-3-Pandas数据分析工具包/

  *   01 字符串操作

*   06 1-4-可视化库-Matplotlib/

  *   01 Matplotlib概述

  *   02 子图与标注

  *   03 风格设置

  *   04 条形图

  *   05 条形图细节

  *   06 条形图外观

  *   07 盒图绘制

  *   08 盒图细节

  *   09 绘图细节设置

  *   10 绘图细节设置2

*   07 1-4-可视化库-Matplotlib/

  *   01 直方图与散点图

  *   02 3D图绘制

  *   03 pie图

  *   04 子图布局

  *   05 结合pandas与sklearn

*   08 1-5-可视化库-Seaborn/

  *   01 课程简介

  *   02 整体布局风格设置

  *   03 风格细节设置

  *   04 调色板

  *   05 调色板颜色设置

  *   06 单变量分析绘图

  *   07 回归分析绘图

  *   08 多变量分析绘图

  *   09 分类属性绘图

  *   10 Facetgrid使用方法

*   09 1-5-可视化库-Seaborn/

  *   01 Facetgrid绘制多变量

  *   02 热度图绘制

*   10 第二章:机器学习算法及其实验分析/

  *   01 01 Python机器学习实训营.docx

*   11 2-1-线性回归原理推导/

  *   01 课程简介

  *   02 回归问题概述

  *   03 误差项定义

  *   04 独立同分布的意义

  *   05 似然函数的作用

  *   06 参数求解

  *   07 梯度下降通俗解释

  *   08 参数更新方法

  *   09 优化参数设置

*   12 2-2-线性回归代码实现/

  *   01 线性回归整体模块概述

  *   02 初始化步骤

  *   03 实现梯度下降优化模块

  *   04 损失与预测模块

  *   05 数据与标签定义

  *   06 训练线性回归模型

  *   07 得到线性回归方程

  *   08 整体流程debug解读

  *   09 多特征回归模型

  *   10 非线性回归

*   13 2-3-模型评估方法-类模型评估/

  *   01 Sklearn工具包简介

  *   02 数据集切分

  *   03 交叉验证的作用

  *   04 交叉验证实验分析

  *   05 混淆矩阵

  *   06 评估指标对比分析

  *   07 阈值对结果的影响

  *   08 ROC曲线

*   14 2-4-线性回归实验分析/

  *   01 实验目标分析

  *   02 参数直接求解方法

  *   03 预处理对结果的影响

  *   04 梯度下降模块

  *   05 学习率对结果的影响

  *   06 随机梯度下降得到的效果

  *   07 MiniBatch方法

  *   08 不同策略效果对比

  *   09 多项式回归

  *   10 模型复杂度

*   15 2-4-线性回归实验分析/

  *   01 样本数量对结果的影响

  *   02 正则化的作用

  *   03 岭回归与lasso

  *   04 实验总结

*   16 2-5-逻辑回归原理推导/

  *   01 逻辑回归算法原理

  *   02 化简与求解

*   17 2-6-逻辑回归代码实现/

  *   01 多分类逻辑回归整体思路

  *   02 训练模块功能

  *   03 完成预测模块

  *   04 优化目标定义

  *   05 迭代优化参数

  *   06 梯度计算

  *   07 得出最终结果

  *   08 鸢尾花数据集多分类任务

  *   09 训练多分类模型

  *   10 准备测试数据

*   18 2-6-逻辑回归代码实现/

  *   01 决策边界绘制

  *   02 非线性决策边界

*   19 2-7-逻辑回归实验分析/

  *   01 逻辑回归实验概述

  *   02 概率结果随特征数值的变化

  *   03 可视化展示

  *   04 坐标棋盘制作

  *   05 分类决策边界展示分析

  *   06 多分类-softmax

*   20 2-8-聚类算法-Kmeans&Dbscan原理/

  *   01 KMEANS算法概述

  *   02 KMEANS工作流程

  *   03 KMEANS迭代可视化展示

  *   04 DBSCAN聚类算法

  *   05 DBSCAN工作流程

  *   06 DBSCAN可视化展示

*   21 2-9-聚类Kmeans代码实现/

  *   01 Kmeans算法模块概述

  *   02 计算得到簇中心点

  *   03 样本点归属划分

  *   04 算法迭代更新

  *   05 鸢尾花数据集聚类任务

  *   06 聚类效果展示

*   22 2-10-聚类算法实验分析/

  *   01 Kmenas算法常用操作

  *   02 聚类结果展示

  *   03 建模流程解读

  *   04 不稳定结果

  *   05 评估指标-Inertia

  *   06 如何找到合适的K值

  *   07 轮廓系数的作用

  *   08 Kmenas算法存在的问题

  *   09 应用实例-图像分割

  *   10 半监督学习

*   23 2-10-聚类算法实验分析/

  *   01 DBSCAN算法

*   24 2-11-决策树原理/

  *   01 决策树算法概述

  *   02 熵的作用

  *   03 信息增益原理

  *   04 决策树构造实例

  *   05 信息增益率与gini系数

  *   06 预剪枝方法

  *   07 后剪枝方法

  *   08 回归问题解决

*   25 2-12-决策树代码实现/

  *   01 整体模块概述

  *   02 递归生成树节点

  *   03 整体框架逻辑

  *   04 熵值计算

  *   05 数据集切分

  *   06 完成树模型构建

  *   07 测试算法效果

*   26 2-13-决策树实验分析/

  *   01 树模型可视化展示

  *   02 决策边界展示分析

  *   03 树模型预剪枝参数作用

  *   04 回归树模型

*   27 2-14集成算法原理/

  *   01 随机森林算法原理

  *   02 随机森林优势与特征重要性指标

  *   03 提升算法概述

  *   04 stacking堆叠模型

*   28 2-15-集成算法实验分析/

  *   01 构建实验数据集

  *   02 硬投票与软投票效果对比

  *   03 Bagging策略效果

  *   04 集成效果展示分析

  *   05 OOB袋外数据的作用

  *   06 特征重要性热度图展示

  *   07 Adaboost算法概述

  *   08 Adaboost决策边界效果

  *   09 GBDT提升算法流程

  *   10 集成参数对比分析

*   29 2-15-集成算法实验分析/

  *   01 模型提前停止策略

  *   02 停止方案实施

  *   03 堆叠模型

*   30 2-16-支持向量机原理推导/

  *   01 支持向量机要解决的问题

  *   02 距离与数据定义

  *   03 目标函数推导

  *   04 拉格朗日乘子法求解

  *   05 化简最终目标函数

  *   06 求解决策方程

  *   07 软间隔优化

  *   08 核函数的作用

  *   09 知识点总结

*   31 2-17-支持向量机实验分析/

  *   01 支持向量机所能带来的效果

  *   02 决策边界可视化展示

  *   03 软间隔的作用

  *   04 非线性SVM

  *   05 核函数的作用与效果

*   32 2-18-神经网络算法原理/

  *   01 深度学习要解决的问题

  *   02 深度学习应用领域

  *   03 计算机视觉任务

  *   04 视觉任务中遇到的问题

  *   05 得分函数

  *   06 损失函数的作用

  *   07 前向传播整体流程

  *   08 返向传播计算方法

  *   09 神经网络整体架构

  *   10 神经网络架构细节

*   33 2-18-神经网络算法原理/

  *   01 神经元个数对结果的影响

  *   02 正则化与激活函数

  *   03 正则化与激活函数

*   34 2-19-神经网络代码实现/

  *   01 神经网络整体框架概述

  *   02 参数初始化操作

  *   03 矩阵向量转换

  *   04 向量反变换

  *   05 完成前向传播模块

  *   06 损失函数定义

  *   07 准备反向传播迭代

  *   08 差异项计算

  *   09 逐层计算

  *   10 完成全部迭代更新模块

*   35 2-19-神经网络代码实现/

  *   01 手写字体识别数据集

  *   02 算法代码错误修正

  *   03 模型优化结果展示

  *   04 测试效果可视化展示

*   36 2-20-贝叶斯算法原理/

  *   01 贝叶斯要解决的问题

  *   02 贝叶斯公式推导

  *   03 拼写纠错实例

  *   04 垃圾邮件过滤实例

*   37 2-21-贝叶斯代码实现/

  *   01 朴素贝叶斯算法整体框架

  *   02 邮件数据读取

  *   03 预料表与特征向量构建

  *   04 分类别统计词频

  *   05 贝叶斯公式对数变换

  *   06 完成预测模块

*   38 2-22-关联规则实战分析/

  *   01 关联规则概述

  *   02 支持度与置信度

  *   03 提升度的作用

  *   04 Python实战关联规则

  *   05 数据集制作

  *   06 电影数据集题材关联分析

*   39 2-23-关联规则代码实现/

  *   01 Apripri算法整体流程

  *   02 数据集demo

  *   03 扫描模块

  *   04 拼接模块

  *   05 挖掘频繁项集

  *   06 规则生成模块

  *   07 完成全部算法流程

  *   08 规则结果展示

*   40 2-24-词向量word2vec通俗解读/

  *   01 词向量模型通俗解释

  *   02 模型整体框架

  *   03 训练数据构建

  *   04 CBOW与Skip-gram模型

  *   05 负采样方案

*   41 2-25-代码实现word2vec词向量模型/

  *   01 数据与任务流程

  *   02 数据清洗

  *   03 batch数据制作

  *   04 网络训练

  *   05 可视化展示

*   42 2-26-推荐系统原理分析/

  *   01 推荐系统应用

  *   02 推荐系统要完成的任务

  *   03 相似度计算

  *   04 基于用户的协同过滤

  *   05 基于物品的协同过滤

  *   06 隐语义模型

  *   07 隐语义模型求解

  *   08 模型评估标准

*   43 2-27-打造音乐推荐系统/

  *   01 音乐推荐任务概述

  *   02 数据集整合

  *   03 基于物品的协同过滤

  *   04 物品相似度计算与推荐

  *   05 SVD矩阵分解

  *   06 基于矩阵分解的音乐推荐

*   44 2-28-线性判别分析降维算法原理解读/

  *   01 线性判别分析要解决的问题

  *   02 线性判别分析要优化的目标

  *   03 线性判别分析求解

  *   04 实现线性判别分析进行降维任务

  *   05 求解得出降维结果

*   45 2-29-主成分分析降维算法原理解读/

  *   01 PCA基本概念

  *   02 方差与协方差

  *   03 PCA结果推导

  *   04 PCA降维实例

*   46 2-30-隐马尔科夫模型/

  *   01 马尔科夫模型

  *   02 隐马尔科夫模型基本出发点

  *   03 组成与要解决的问题

  *   04 暴力求解方法

  *   05 复杂度计算

  *   06 前向算法

  *   07 前向算法求解实例

  *   08 Baum-Welch算法

  *   09 参数求解

  *   10 维特比算法

*   47 2-31-HMM应用实例/

  *   01 hmmlearn工具包

  *   02 工具包使用方法

  *   03 中文分词任务

  *   04 实现中文分词

*   48 第三章:数据分析与挖掘实战集锦/

  *   01 课程简介

*   49 3-1-Python实战关联规则/

  *   01 关联规则概述

  *   02 支持度与置信度

  *   03 提升度的作用

  *   04 Python实战关联规则

  *   05 数据集制作

  *   06 电影数据集题材关联分析

*   50 3-2-爱彼迎数据集分析与建模/

  *   01 数据与任务分析

  *   02 提取月份信息进行统计分析

  *   03 房价随星期变化的可视化展示

  *   04 房屋信息指标分析

  *   05 提取房屋常见设施

  *   06 房屋规格热度图分析

  *   07 预处理与建模准备

  *   08 随机森林与LightGBM

  *   09 训练与评估

*   51 唐老师数据分析第三章基于相似度的酒店推荐系统/

  *   01 数据与任务介绍

  *   02 文本词频统计

  *   03 ngram结果可视化展示

  *   04 文本清洗

  *   05 相似度计算

  *   06 得出推荐结果

*   52 3-4-商品销售额回归分析/

  *   01 数据任务分析

  *   02 特征工程制作

  *   03 统计指标生成

  *   04 特征信息提取

  *   05 标签变换

  *   06 输入数据制作

  *   07 Xgboost训练模型

  *   08 生成输出结果

*   53 3-5-绝地求生数据集探索分析与建模/

  *   01 数据与任务简介

  *   02 数据问题探索与解决方案

  *   03 剔除开挂数据

  *   04 类别变量处理

  *   05 绘图统计分析

  *   06 热度图展示

  *   07 随机森林建模

  *   08 特征重要性

*   54 3-5-绝地求生数据集探索分析与建模/

  *   01 模型解释方法与实践

  *   02 部分依赖图解释

  *   03 双变量分析

  *   04 ShapValues指标分析

  *   05 疾病引起原因分析实战

*   55 3-7-自然语言处理必备工具包实战(上)/

  *   01 Python字符串处理

  *   02 正则表达式基本语法

  *   03 正则常用符号

  *   04 常用函数介绍

  *   05 NLTK工具包简介

  *   06 停用词过滤

  *   07 词性标注

*   56 3-7-自然语言处理必备工具包实战(下)/

  *   01 数据清洗实例

  *   02 Spacy工具包

  *   03 名字实体匹配

  *   04 恐怖袭击分析

  *   05 统计分析结果

  *   06 结巴分词器

  *   07 词云展示

*   57 3-8-NLP核心模型-word2vec/

  *   01 词向量模型通俗解释

  *   02 模型整体框架

  *   03 训练数据构建

  *   04 CBOW与Skip-gram模型

  *   05 负采样方案

*   58 3-9-文本特征处理方法对比/

  *   01 任务概述

  *   02 词袋模型

  *   03 词袋模型分析

  *   04 TFIDF模型

  *   05 word2vec词向量模型

  *   06 深度学习模型

*   59 3-10-数据特征预处理(上)/

  *   01 数据与任务介绍

  *   02 数据分析与可视化展示

  *   03 连续值离散化与可视化细节

  *   04 加载数据坐标到实际地图中进行分析

  *   05 特征相关性分析

  *   06 缺失值填充

*   60 3-10-数据特征预处理(下)/

  *   01 sklearn工具包预处理模块

  *   02 离散属性特征处理

  *   03 构建合适的特征

  *   04 序列化执行预处理操作

  *   05 完成所有预处理操作

  *   06 构建回归模型

*   61 3-11-银行客户还款可能性预测(上)/

  *   01 数据任务介绍及缺失值处理

  *   02 EDA数据探索分析

  *   03 特征展示分析

  *   04 KDEPLOT展示

  *   05 部分特征分析与可视化

  *   06 数据检查与特征工程

  *   07 多项式特征

  *   08 自定义特征

  *   09 逻辑回归模型

  *   10 结果评估

*   62 3-11-银行客户还款可能性预测(下)/

  *   01 必杀神奇:lightgbm

*   63 3-12-图像特征聚类分析实践/

  *   01 数据与任务流程分析

  *   02 图片数据导入

  *   03 图像特征编码

  *   04 数组保存与读取

  *   05 得出聚类结果

  *   06 聚类效果可视化展示

*   64 第四章:数据挖掘项目解决方案实战/

  *   01 01 数据挖掘竞赛解决方案概述.docx

*   65 4-1-快手短视频用户活跃度分析/

  *   01 课程简介

  *   02 任务目标与数据分析

  *   03 整体模型架构

  *   04 构建用户特征序列

  *   05 序列特征提取方法

  *   06 生成特征汇总表

  *   07 标签制作

  *   08 网络训练模块

  *   09 得出最终模型结果

*   66 4-2-工业化工生产预测/

  *   01 数据任务概述

  *   02 数据异常检查

  *   03 时间特征提取

  *   04 各道工序特征构建

  *   05 准备训练数据

  *   06 训练xgboost模型

*   67 4-3-智慧城市-道路通行时间预测/

  *   01 数据与任务目标分析

  *   02 数据清洗与标签转换

  *   03 道路通行时间序列数据生成

  *   04 序列缺失补全方法

  *   05 基于回归与插值完成序列特征

  *   06 基于回归与插值进行序列补全

  *   07 特征汇总

  *   08 建立回归模型进行预测

*   68 4-4-特征工程建模可解释工具包/

  *   01 模型解释方法与实践

  *   02 部分依赖图解释

  *   03 双变量分析

  *   04 ShapValues指标分析

  *   05 疾病引起原因分析实战

  *   06 竞赛与目标分析

  *   07 特征对比分析方法

  *   08 结果对比分析

*   69 4-5-医学糖尿病数据命名实体识别/

  *   01 数据与任务介绍

  *   02 整体模型架构

  *   03 数据-标签-语料库处理

  *   04 输入样本填充补齐

  *   05 训练网络模型

  *   06 医疗数据集(糖尿病)实体识别

*   70 4-6-贷款平台风控模型-特征工程/

  *   01 竞赛任务目标

  *   02 图模型信息提取

  *   03 节点权重特征提取(PageRank)

  *   04 deepwalk构建图顶点特征

  *   05 各项统计特征

  *   06 app安装特征

  *   07 图中联系人特征

*   71 4-7-新闻关键词抽取模型/

  *   01 任务目标与数据集介绍

  *   02 数据清洗与预处理

  *   03 基本特征抽取

  *   04 文章与词向量分析

  *   05 权重划分

  *   06 候选词统计特征

  *   07 textrank特征提取

  *   08 候选词相似度特征

  *   09 特征工程汇总

*   72 4-8-数据特征常用构建方法/

  *   01 基本数值特征

  *   02 常用特征构造手段

  *   03 时间特征处理

  *   04 文本特征处理

  *   05 构造文本向量

  *   06 词向量特征

  *   07 计算机眼中的图像

*   73 4-9-用电敏感客户分类/

  *   01 任务与解决框架概述

  *   02 特征工程分析与特征提取

  *   03 离散数据处理

  *   04 统计与文本特征

  *   05 文本特征构建

  *   06 构建低敏用户模型

  *   07 高敏模型概述

*   74 4-10-1-机器学习项目实战-数据处理与特征提取/

  *   01 任务概述

  *   02 处理流程与数据简介

  *   03 数据处理

  *   04 单变量绘图分析

  *   05 离群点剔除

  *   06 变量与结果的关系

  *   07 多变量展示

  *   08 特征工程

*   75 4-10-2-机器学习项目实战-建模与分析/

  *   01 dataleakage问题

  *   02 基础模型对比

  *   03 选择参数

  *   04 测试模型

  *   05 模型解释

  *   06 模型分析