你将学习到,项目架构搭建,数据生产,数据分析,以及数据展示等项目核心业务功能的实现。

*   01 Spark案例day01/

  *   01 1.项目介绍.mp4 36:44

  *   02 2.系统架构图.mp4 24:45

  *   03 3.日志实体类设计.mp4 17:12

  *   04 4.日志上报程序.mp4 10:16

  *   05 5.配置nginx web服务器.mp4 21:04

  *   06 6.配置nginx反向代理服务器.mp4 08:15

  *   07 7.nginx的相关配置解释.mp4 23:06

  *   08 8.字典的设计与实现.mp4 21:00

  *   09 9.LogUtil设计实现-生成相关属性处理.mp4 41:57

  *   10 10.LogUtil生成Log列表和日志聚合体.mp4 17:53

  *   11 11.属性复制-实现日志信息一致性.mp4 16:15

  *   12 12.redis集合保证后续一致性考虑.mp4 15:32

  *   13 13.日志时间处理.mp4 11:55

*   02 Spark案例day02/

  *   01 1.redis引入确保硬件信息一致.mp4 47:30

  *   02 2.收集数据到nginx web服务器.mp4 16:01

  *   03 3.客户端时间发送.mp4 04:39

  *   04 4.flume收集acces日志到kafka.mp4 17:20

  *   05 5.flume收集kafka数据到hdfs.mp4 25:23

  *   06 6.常见创建库和表-加载数据到hive原生表.mp4 21:03

  *   07 7.动态生成创建logs的ddl语句.mp4 32:23

  *   08 8.hive叉分函数-objectInspector.mp4 49:23

  *   09 9.hive自定义叉分函数-注册与测试.mp4 36:17

  *   10 10.hive抽象与封装叉分函数.mp4 28:01

  *   11 11.hive叉分函数子类-泛化抽象测试.mp4 10:03

*   03 Spark案例day03/

  *   01 1.时间工具类.mp4 51:33

  *   02 2.在udtf中实现时间对齐处理.mp4 06:16

  *   03 3.Geolite使用.mp4 23:13

  *   04 4.GeoUtil cache处理.mp4 21:45

  *   05 5.叉分转储-测试.mp4 45:56

  *   06 6.使用pyspark执行清洗.mp4 39:55

  *   07 7.生成数据清洗sql脚本.mp4 24:59

  *   08 8.使用python脚本执行清洗.mp4 56:43

  *   09 9.使用python-spark操纵自定义函数.mp4 13:12

*   04 Spark案例day04/

  *   01 1.分析指标.mp4 59:04

  *   02 2.自定义日期函数-按照时间偏移量计算.mp4 35:23

  *   03 3.formatByDay-udf函数.mp4 25:15

  *   04 4.FormatByDay-实现.mp4 09:54

  *   05 5.FormatByDay-注册函数.mp4 28:32

  *   06 6.Spark sql编程实现日期函数查询.mp4 30:16

  *   07 7.日志滚动脚本.mp4 32:24

  *   08 8.crond服务调度脚本滚动-开机自启设置.mp4 14:19

  *   09 9.整理启动日志分区数据.mp4 01:03:18

  *   10 10.日活查询-cube-appid-去重.mp4 01:13:30

  *   11 11.日活用户-生成统计表.mp4 37:16

*   05 Spark案例day05/

  *   01 1.新增用户统计.mp4 59:54

  *   02 2.新增用户-周-月-日统计.mp4 52:40

  *   03 3.月活率-月活数统计.mp4 27:32

  *   04 4.月活率-设备数统计-月活率统计.mp4 59:41

  *   05 5.sql中注释处理1.mp4 12:25

  *   06 6.月活率-inner join问题-临时表问题2.mp4 28:00

  *   07 7.沉默用户统计.mp4 25:39

  *   08 8.周回流用户.mp4 01:13:25

  *   09 9.连续活跃用户.mp4 23:54

  *   10 10.近期流失用户.mp4 23:37

  *   11 11.留存用户.mp4 50:15

*   06 Spark案例day06/

  *   01 1.留存率验证-时间问题.mp4 23:26

  *   02 2.sparkstreaming消费kafka数据.mp4 38:40

  *   03 3.sparkstreaming集成redis.mp4 55:23

  *   04 4.spark流集成redis-sql.mp4 51:42

  *   05 5.sparkstreaming 数据如redids.mp4 55:38

  *   06 6.从redis中查询新增用户设备.mp4 39:55

  *   07 7.从redis中查询新增用户设备2.mp4 27:33

  *   08 8.flume限速拦截.mp4 49:50

  *   09 9.flume自定义源防丢失.mp4 01:22:12

*   07 Spark案例day07/

  *   01 1.sqoop数据导出到mysql中.mp4 36:58

  *   02 2.数据展示部分.mp4 17:19

  *   03 3.按照日期查询版本分布.mp4 01:08:18

  *   04 4.可视化程序-部署-设置.mp4 40:34

  *   05 5.启动azkaban调度程序-编写加载数据表job.mp4 33:16

  *   06 6.azkaban job编写配置.mp4 30:33

  *   07 7.azkaban 编写job依赖.mp4 35:30

  *   08 8.azkaban job测试-非法字符处理.mp4 01:10:50