通过图解和手敲代码、剖析原理的方式，让学员学习Spark+案例+推荐系统技术。

* 01 Spark第1天Spark基础/

* 01 01.Spark的安装.mp4 14:46

* 02 02.Spark体验wordcount实现.mp4 26:32

* 03 03.spark独立集群模式搭建.mp4 01:04:16

* 04 04.sparkjob部署.mp4 22:02

* 05 05.spark 两次shuffle.mp4 18:24

* 06 06.spark RDD-PairRDD-shuffle-宽.mp4 01:16:46

* 02 Spark第2天Spark 作业提交/

* 01 01.taggen scala版spark实现.mp4 50:44

* 02 02.taggen java版spark实现.mp4 40:57

* 03 03.spark作业提交流程.mp4 56:06

* 04 04.spark作业提交流程-2.mp4 01:06:57

* 05 05.spark作业提交流程-3.mp4 01:59:05

* 06 06.spark作业提交流程-4.mp4 01:02:52

* 03 Spark第3天Spark部署与资源分配/

* 01 01.spark提交流程回顾.mp4 02:08:17

* 02 02.spark常见变换和动作.mp4 49:53

* 03 03.spark数据倾斜问题.mp4 09:23

* 04 04.spark aggregateByKey.mp4 01:01:51

* 05 05.spark资源分配启动进程.mp4 01:55:22

* 06 06.sparkjob执行独立模式的考察.mp4 01:24:46

* 04 Spark第4天Spark Shuffle/

* 01 01.standalone job提交过程.mp4 35:28

* 02 02.yarn模式下job执行过程.mp4 41:38

* 03 03.spark.yarn.archive属性配置.mp4 18:58

* 04 04.spark hashshuffle下的文件合并.mp4 43:06

* 05 05.spark shuffle管理器.mp4 51:28

* 06 06.spark sort shuffle manager.mp4 01:00:22

* 07 07.spark bypass merge shuffle.mp4 56:55

* 08 08.spark SortShuffleWriter.mp4 01:43:32

* 05 Spark第5天Spark Shuffle/

* 01 01.shuffle回顾.mp4 01:23:18

* 02 02.SerialShuffleHandle-UnsafeS.mp4 01:19:10

* 03 03.BaseShuffleHandle-SortShuff.mp4 21:50

* 04 04.shuffle总结.mp4 59:18

* 05 05.内存管理器-内存优化.mp4 03:07:18

* 06 Spark第6天内存管理/

* 01 01.内存管理回顾.mp4 20:17

* 02 02.spark广播变量.mp4 49:23

* 03 03.spark广播变量2.mp4 01:13:31

* 04 04.spark广播变量原理.mp4 27:04

* 05 05.spark blockmanager.mp4 01:01:43

* 06 06.spark累加器.mp4 36:30

* 07 07.spark累加器-自定义累加器.mp4 53:51

* 08 08.spark RDD失败重试-累加器注意事项.mp4 59:25

* 09 09.spark RDD持久化.mp4 21:07

* 07 Spark第7天Spark SQL/

* 01 01.spark SQL体验.mp4 31:47

* 02 02.spark SQL编程.mp4 17:57

* 03 03.spark SQL编程-java实现.mp4 20:20

* 04 04.spark SQL编程-java实现聚合查询.mp4 14:55

* 05 05.spark SQL编程-自定义聚合函数.mp4 31:47

* 06 06.spark SQL编程-自定义聚合函数实现气温双向聚合.mp4 16:38

* 07 07.spark SQL数据的保存与加载.mp4 24:54

* 08 08.spark SQL集成Hive.mp4 28:46

* 09 09.spark SQL代码集成hive注意事项.mp4 07:39

* 10 10.spark SQL分布式查询引擎.mp4 39:12

* 11 11.spark SQL调优-命令行.mp4 17:32

* 12 12.spark streaming体验.mp4 27:41

* 08 Spark第8天Spark Streaming/

* 01 01.流计算注意事项.mp4 01:07:30

* 02 02.流计算windows操纵.mp4 12:31

* 03 03.流计算updateStateByKey.mp4 50:19

* 04 04.流计算updateStateByKey实现window.mp4 01:08:47

* 05 05.流处理外部存储.mp4 19:58

* 06 06.流应用部署需要.mp4 01:24:27

* 09 Spark第9天Spark Streaming/

* 01 01.spark streaming sqljava实现.mp4 21:37

* 02 02.spark streaming kafka集成.mp4 20:58

* 03 03.spark streaming位置策略处理.mp4 01:38:15

* 04 04.spark streaming使用jars参数指定类库.mp4 09:53

* 05 05.kafka与spark streaming分区对应关系.mp4 01:44:06

* 06 06.spark streaming总结.mp4 26:03

* 07 07.word中文分词.mp4 58:28

* 08 08.机器学习.mp4 01:01:27

* 10 Spark第10天Spark机器学习/

* 01 01.spark逻辑回归判断酒质量好坏.mp4 26:48

* 02 02.逻辑回归实现垃圾邮件分类.mp4 21:15

* 03 03.贝叶斯分类器集合svm文件实现分类.mp4 14:40

* 04 04.Kmean.mp4 21:01

* 05 05.ALS推荐实现电影.mp4 14:59

* 06 06.友盟项目描述和术语说明.mp4 50:02

* 07 07.友盟项目描述和术语说明2.mp4 44:12

* 08 08.友盟-手机端日志数据模拟.mp4 01:26:15

* 09 09.友盟-日志聚合体转成json数据(单行).mp4 08:20

* 10 10.友盟-公共模块抽取-web程序配置运行-phone发送.mp4 53:55

* 11 大数据项目第1天/

* 01 01.log4j配置.mp4 46:36

* 02 02.使用log4j对上传日志进行落地保存.mp4 40:15

* 03 03.使用log4j日志滚动.mp4 06:29

* 04 04.时间对齐.mp4 28:49

* 05 05.地理信息处理-geoLite.mp4 42:25

* 06 06.flume收集数据到kafka.mp4 58:36

* 07 07.flume-kafka-hdfs收集日志.mp4 21:44

* 12 大数据项目第2天/

* 01 01.log4l-项目描述-架构阐述.mp4 21:11

* 02 02.windows和linux安装nginx-openre.mp4 42:28

* 03 03.windows和linux下配置nginx反向代理服务.mp4 43:59

* 04 04.使用lua插件实现nginx post方式资源访问-j.mp4 33:04

* 05 05.配置windows下nginx反向代理到cengos.mp4 03:14

* 06 06.windows与centos下nginx集群-反向代理.mp4 15:31

* 07 07.配置nginx日志滚动.mp4 31:29

* 08 08.nginx提取client真实ip不是代理ip地址.mp4 06:22

* 13 大数据项目第3天/

* 01 01.umeng ngix集群和flume管理脚本.mp4 38:13

* 02 02.配置flume收集日志多出口-hdfs-kafka.mp4 54:38

* 03 03.hive udtf自定义表生成函数.mp4 01:04:31

* 04 04.hive udtf聚合体日志解析函数.mp4 56:33

* 05 05.hive udtf聚合体日志解析函数2.mp4 01:05:26

* 06 05.hive udtf聚合体日志解析函数3.mp4 16:32

* 07 06.hive udtf聚合体日志解析函数4.mp4 06:42

* 08 07.hive udtf聚合体日志解析函数5.mp4 07:22

* 14 大数据项目第4天/

* 01 01.日志表生成函数改造-层次化.mp4 37:53

* 02 02.提取jar中资源文件的注意事项.mp4 07:15

* 03 03.编写调度脚本-load-dump.mp4 01:21:13

* 04 04.编写调度脚本-dump.mp4 01:11:11

* 05 05.azkaban01.mp4 24:52

* 15 大数据项目第5天/

* 01 01.azkaban安装bug-调度执行.mp4 51:48

* 02 02.azkaban调度umengjob.mp4 27:45

* 03 03.数据流层次结构-时间函数处理.mp4 55:12

* 04 04.查询新增用户数.mp4 01:26:53

* 05 05.统计数据转储-作业调度.mp4 37:04

* 06 06.统计指标实现-日新-日活-沉默.mp4 58:40

* 16 大数据项目第6天/

* 01 01.导出数据mysql.mp4 46:22

* 02 02.自定义DBWritable使用mr方式导出数据到mys.mp4 52:17

* 03 03.4阶段执行job调度执行测试.mp4 31:08

* 04 04.spark-sql实现转储程序.mp4 01:29:30

* 05 05.spark-rdd实现统计数据-每个appid-每日新.mp4 50:45

* 06 06.spark-rdd实现每个appid和设备的日新增ja.mp4 30:15

* 07 07.spark-测试新调度.mp4 01:34:14

* 17 大数据项目第7天/

* 01 01.维度组合查询算法.mp4 01:03:39

* 02 02.实现各位维度数据入库的功能.mp4 02:01:26

* 03 03.封装按不同时间模式进行统计.mp4 01:06:52

* 04 04.SSM整合前端可视化查询.mp4 58:20

* 05 05.SSM整合展示数据部分.mp4 01:02:46

* 06 06.连续n周活跃java版实现.mp4 01:55:25

* 18 大数据项目第8天/

* 01 01.近期回流用户数统计.mp4 01:06:44

* 02 02.一周后留存用户.mp4 25:49

* 03 03.用户新鲜度.mp4 14:18

* 04 04.spark streaming流计算统计最大最小时间值.mp4 01:14:47

* 05 05.kafka数据实时清洗-再发布-spark strea.mp4 58:32

* 06 06.redis重新设计key-统计数据.mp4 15:34

* 07 07.flume收集断点续传.mp4 17:05

* 08 08.flume容灾拦截器.mp4 16:06

* 09 09.项目架构总结-集群规模-注意事项.mp4 01:40:00

* 19 推荐系统第1天/

* 01 01.推荐概念术语-rmse-mae-准确度-召回率-覆盖率.mp4 01:14:39

* 02 02.商品流行度-相对流行度-信息熵-衡量流行度分布均衡情况.mp4 50:59

* 03 03.信息熵-基尼系数.mp4 54:29

* 04 04.用户行为-隐性-显性.mp4 32:45

* 05 05.杰卡德相似度算法实现.mp4 01:13:27

* 06 06.基于用户的协同过滤实现.mp4 02:01:08

* 20 推荐系统第2天/

* 01 01.scala实现相似度计算.mp4 45:30

* 02 02.计算两两用户的相似度倒排列表.mp4 34:59

* 03 03.基于商品的协同过滤.mp4 01:53:12

* 04 04.基于商品的协同过滤和兴趣度算法.mp4 50:31

* 05 05.基于商品的协过滤推荐实现.mp4 58:47

* 06 06.LFM模型.mp4 51:54

* 07 07.知识点总结.mp4 01:05:21

* 08 08.简历指导.mp4 01:06:44

7期大数据之Spark+案例+推荐系统教程