在这个大数据下的人工智能时代,各行各业的商业决策和运营管理都离不开数据分析。本课程采用理论与案例相结合的形式,系统地介绍了用Python实现数据分析及可视化所需

*   第一章 Python数据分析与应用:从数据获取到可视化/

  *   数据分析概述/

    *   1.数据分析背景

    *   2.什么是数据分析

    *   3.数据分析的应用场景

    *   4.数据分析的流程

    *   5.Python做数据分析的优势

    *   6.Ancoda的介绍

    *   7.Anaconda的安装及使用

    *   8.Jupyter-Notebook的启动

    *   9.Jupyter的界面介绍及其使用

    *   10.常见数据分析工具

  *   科学计算库NumPy/

    *   1.认识Numpy数组对象

    *   2.创建Numpy数组

    *   3.ndarray对象的数据类型

    *   4.数组的运算

    *   5.数组的索引和切片的基本使用

    *   6.花式(数组)索引的基本使用

    *   7.布尔索引的基本使用

    *   8.数组的转置和轴对称

    *   9.Numpy通用函数

    *   10.将条件逻辑转为数组运算

    *   11.统计相关的函数使用

    *   12.数组排序

    *   13.检索数组元素

    *   14.线性代数模块

    *   15.随机数模块

  *   数据分析工具Pandas/

    *   1.Series

    *   2.DataFrame

    *   3.索引对象

    *   4.重置索引

    *   5.索引操作

    *   6.算术运算与数据对齐

    *   7.数据排序

    *   8.统计计算与描述

    *   9.认识层次化索引

    *   10.层次化索引的操作

    *   11.读写文本文件

    *   12.读写Excel文件

    *   13.读写HTML表格数据

    *   14.读写数据库

    *   15.案例-北京高考分数线统计分析

  *   数据预处理/

    *   1.空值和缺失值的处理

    *   2.重复值的处理

    *   3.异常值处理

    *   4.更改数据类型

    *   5.轴向堆叠数据

    *   6.主键合并数据

    *   7.根据行索引合并数据

    *   8. 重塑层次化索引

    *   9. 合并重塑数据

    *   10.轴向旋转mp4

    *   11.重命名轴索引

    *   12.离散化连续数据

    *   13.哑变量处理类别型数据

    *   14.案例—预处理部分地区信息

  *   数据聚合与分组运算/

    *   1.分组与聚合的原理

    *   2.通过groupby()方法将数据拆分成组

    *   3.使用内置统计方法聚合数据

    *   4.面向列的聚合方法

    *   5.数据转换

    *   6.数据应用

    *   7.案例—运动员信息的分组与聚合

  *   数据可视化/

    *   1.什么是数据可视化

    *   2.常见的图形

    *   3.数据可视化的工具

    *   4.通过figure()函数创建画布

    *   5.通过subplot()函数创建单个子图

    *   6.通过subplots()函数创建多个子图

    *   7.通过add_subplot()方法添加和选中子图

    *   8.添加各类标签

    *   9.绘制常见图表

    *   10.本地保存图形

    *   11.可视化数据的分布

    *   12.用分类数据绘图

    *   13.认识Bokeh库

    *   14.通过Plotting绘制图形

    *   15.案例—画图分析某年旅游景点数据

  *   时间序列分析/

    *   1.创建时间序列

    *   2.通过时间戳索引选取子集

    *   3.创建固定频率的时间序列

    *   4.时间序列的频率、偏移量

    *   5.时间序列的移动

    *   6.创建时期对象

    *   7.时期的频率转换

    *   8.重采样方法(resample)

    *   9.降采样

    *   10 升采样

    *   11.数据统计—滑动窗口

    *   12.时序模型—ARIMA

  *   文本数据分析/

    *   1.NLTK与jieba概述

    *   2.安装NLTK和下载语料库

    *   3.jieba库的安装

    *   4.预处理的流程

    *   5.分词

    *   6.词性标注

    *   7.词形归一化

    *   8.删除停用词

    *   9.文本情感分析

    *   10.文本相似度

    *   11 文本分类

    *   12.案例—商品评价分析

  *   数据分析实战——北京租房数据统计分析/

    *   1 数据读取

    *   2.重复值和空值处理

    *   3.数据转换类型

    *   4.房源数量、位置分布分析

    *   5.户型数量分析

    *   6.平均租金分析

    *   7.面积区间分析