通过图解和手敲代码、剖析原理的方式,让学员学习Spark+案例+推荐系统技术。
* 01 Spark第1天Spark基础/
* 01 01.Spark的安装.mp4 14:46
* 02 02.Spark体验wordcount实现.mp4 26:32
* 03 03.spark独立集群模式搭建.mp4 01:04:16
* 04 04.sparkjob部署.mp4 22:02
* 05 05.spark 两次shuffle.mp4 18:24
* 06 06.spark RDD-PairRDD-shuffle-宽.mp4 01:16:46
* 02 Spark第2天Spark 作业提交/
* 01 01.taggen scala版spark实现.mp4 50:44
* 02 02.taggen java版spark实现.mp4 40:57
* 03 03.spark作业提交流程.mp4 56:06
* 04 04.spark作业提交流程-2.mp4 01:06:57
* 05 05.spark作业提交流程-3.mp4 01:59:05
* 06 06.spark作业提交流程-4.mp4 01:02:52
* 03 Spark第3天Spark部署与资源分配/
* 01 01.spark提交流程回顾.mp4 02:08:17
* 02 02.spark常见变换和动作.mp4 49:53
* 03 03.spark数据倾斜问题.mp4 09:23
* 04 04.spark aggregateByKey.mp4 01:01:51
* 05 05.spark资源分配启动进程.mp4 01:55:22
* 06 06.sparkjob执行独立模式的考察.mp4 01:24:46
* 04 Spark第4天Spark Shuffle/
* 01 01.standalone job提交过程.mp4 35:28
* 02 02.yarn模式下job执行过程.mp4 41:38
* 03 03.spark.yarn.archive属性配置.mp4 18:58
* 04 04.spark hashshuffle下的文件合并.mp4 43:06
* 05 05.spark shuffle管理器.mp4 51:28
* 06 06.spark sort shuffle manager.mp4 01:00:22
* 07 07.spark bypass merge shuffle.mp4 56:55
* 08 08.spark SortShuffleWriter.mp4 01:43:32
* 05 Spark第5天Spark Shuffle/
* 01 01.shuffle回顾.mp4 01:23:18
* 02 02.SerialShuffleHandle-UnsafeS.mp4 01:19:10
* 03 03.BaseShuffleHandle-SortShuff.mp4 21:50
* 04 04.shuffle总结.mp4 59:18
* 05 05.内存管理器-内存优化.mp4 03:07:18
* 06 Spark第6天内存管理/
* 01 01.内存管理回顾.mp4 20:17
* 02 02.spark广播变量.mp4 49:23
* 03 03.spark广播变量2.mp4 01:13:31
* 04 04.spark广播变量原理.mp4 27:04
* 05 05.spark blockmanager.mp4 01:01:43
* 06 06.spark累加器.mp4 36:30
* 07 07.spark累加器-自定义累加器.mp4 53:51
* 08 08.spark RDD失败重试-累加器注意事项.mp4 59:25
* 09 09.spark RDD持久化.mp4 21:07
* 07 Spark第7天Spark SQL/
* 01 01.spark SQL体验.mp4 31:47
* 02 02.spark SQL编程.mp4 17:57
* 03 03.spark SQL编程-java实现.mp4 20:20
* 04 04.spark SQL编程-java实现聚合查询.mp4 14:55
* 05 05.spark SQL编程-自定义聚合函数.mp4 31:47
* 06 06.spark SQL编程-自定义聚合函数实现气温双向聚合.mp4 16:38
* 07 07.spark SQL数据的保存与加载.mp4 24:54
* 08 08.spark SQL集成Hive.mp4 28:46
* 09 09.spark SQL代码集成hive注意事项.mp4 07:39
* 10 10.spark SQL分布式查询引擎.mp4 39:12
* 11 11.spark SQL调优-命令行.mp4 17:32
* 12 12.spark streaming体验.mp4 27:41
* 08 Spark第8天Spark Streaming/
* 01 01.流计算注意事项.mp4 01:07:30
* 02 02.流计算windows操纵.mp4 12:31
* 03 03.流计算updateStateByKey.mp4 50:19
* 04 04.流计算updateStateByKey实现window.mp4 01:08:47
* 05 05.流处理外部存储.mp4 19:58
* 06 06.流应用部署需要.mp4 01:24:27
* 09 Spark第9天Spark Streaming/
* 01 01.spark streaming sqljava实现.mp4 21:37
* 02 02.spark streaming kafka集成.mp4 20:58
* 03 03.spark streaming位置策略处理.mp4 01:38:15
* 04 04.spark streaming使用jars参数指定类库.mp4 09:53
* 05 05.kafka与spark streaming分区对应关系.mp4 01:44:06
* 06 06.spark streaming总结.mp4 26:03
* 07 07.word中文分词.mp4 58:28
* 08 08.机器学习.mp4 01:01:27
* 10 Spark第10天Spark机器学习/
* 01 01.spark逻辑回归判断酒质量好坏.mp4 26:48
* 02 02.逻辑回归实现垃圾邮件分类.mp4 21:15
* 03 03.贝叶斯分类器集合svm文件实现分类.mp4 14:40
* 04 04.Kmean.mp4 21:01
* 05 05.ALS推荐实现电影.mp4 14:59
* 06 06.友盟项目描述和术语说明.mp4 50:02
* 07 07.友盟项目描述和术语说明2.mp4 44:12
* 08 08.友盟-手机端日志数据模拟.mp4 01:26:15
* 09 09.友盟-日志聚合体转成json数据(单行).mp4 08:20
* 10 10.友盟-公共模块抽取-web程序配置运行-phone发送.mp4 53:55
* 11 大数据项目第1天/
* 01 01.log4j配置.mp4 46:36
* 02 02.使用log4j对上传日志进行落地保存.mp4 40:15
* 03 03.使用log4j日志滚动.mp4 06:29
* 04 04.时间对齐.mp4 28:49
* 05 05.地理信息处理-geoLite.mp4 42:25
* 06 06.flume收集数据到kafka.mp4 58:36
* 07 07.flume-kafka-hdfs收集日志.mp4 21:44
* 12 大数据项目第2天/
* 01 01.log4l-项目描述-架构阐述.mp4 21:11
* 02 02.windows和linux安装nginx-openre.mp4 42:28
* 03 03.windows和linux下配置nginx反向代理服务.mp4 43:59
* 04 04.使用lua插件实现nginx post方式资源访问-j.mp4 33:04
* 05 05.配置windows下nginx反向代理到cengos.mp4 03:14
* 06 06.windows与centos下nginx集群-反向代理.mp4 15:31
* 07 07.配置nginx日志滚动.mp4 31:29
* 08 08.nginx提取client真实ip不是代理ip地址.mp4 06:22
* 13 大数据项目第3天/
* 01 01.umeng ngix集群和flume管理脚本.mp4 38:13
* 02 02.配置flume收集日志多出口-hdfs-kafka.mp4 54:38
* 03 03.hive udtf自定义表生成函数.mp4 01:04:31
* 04 04.hive udtf聚合体日志解析函数.mp4 56:33
* 05 05.hive udtf聚合体日志解析函数2.mp4 01:05:26
* 06 05.hive udtf聚合体日志解析函数3.mp4 16:32
* 07 06.hive udtf聚合体日志解析函数4.mp4 06:42
* 08 07.hive udtf聚合体日志解析函数5.mp4 07:22
* 14 大数据项目第4天/
* 01 01.日志表生成函数改造-层次化.mp4 37:53
* 02 02.提取jar中资源文件的注意事项.mp4 07:15
* 03 03.编写调度脚本-load-dump.mp4 01:21:13
* 04 04.编写调度脚本-dump.mp4 01:11:11
* 05 05.azkaban01.mp4 24:52
* 15 大数据项目第5天/
* 01 01.azkaban安装bug-调度执行.mp4 51:48
* 02 02.azkaban调度umengjob.mp4 27:45
* 03 03.数据流层次结构-时间函数处理.mp4 55:12
* 04 04.查询新增用户数.mp4 01:26:53
* 05 05.统计数据转储-作业调度.mp4 37:04
* 06 06.统计指标实现-日新-日活-沉默.mp4 58:40
* 16 大数据项目第6天/
* 01 01.导出数据mysql.mp4 46:22
* 02 02.自定义DBWritable使用mr方式导出数据到mys.mp4 52:17
* 03 03.4阶段执行job调度执行测试.mp4 31:08
* 04 04.spark-sql实现转储程序.mp4 01:29:30
* 05 05.spark-rdd实现统计数据-每个appid-每日新.mp4 50:45
* 06 06.spark-rdd实现每个appid和设备的日新增ja.mp4 30:15
* 07 07.spark-测试新调度.mp4 01:34:14
* 17 大数据项目第7天/
* 01 01.维度组合查询算法.mp4 01:03:39
* 02 02.实现各位维度数据入库的功能.mp4 02:01:26
* 03 03.封装按不同时间模式进行统计.mp4 01:06:52
* 04 04.SSM整合前端可视化查询.mp4 58:20
* 05 05.SSM整合展示数据部分.mp4 01:02:46
* 06 06.连续n周活跃java版实现.mp4 01:55:25
* 18 大数据项目第8天/
* 01 01.近期回流用户数统计.mp4 01:06:44
* 02 02.一周后留存用户.mp4 25:49
* 03 03.用户新鲜度.mp4 14:18
* 04 04.spark streaming流计算统计最大最小时间值.mp4 01:14:47
* 05 05.kafka数据实时清洗-再发布-spark strea.mp4 58:32
* 06 06.redis重新设计key-统计数据.mp4 15:34
* 07 07.flume收集断点续传.mp4 17:05
* 08 08.flume容灾拦截器.mp4 16:06
* 09 09.项目架构总结-集群规模-注意事项.mp4 01:40:00
* 19 推荐系统第1天/
* 01 01.推荐概念术语-rmse-mae-准确度-召回率-覆盖率.mp4 01:14:39
* 02 02.商品流行度-相对流行度-信息熵-衡量流行度分布均衡情况.mp4 50:59
* 03 03.信息熵-基尼系数.mp4 54:29
* 04 04.用户行为-隐性-显性.mp4 32:45
* 05 05.杰卡德相似度算法实现.mp4 01:13:27
* 06 06.基于用户的协同过滤实现.mp4 02:01:08
* 20 推荐系统第2天/
* 01 01.scala实现相似度计算.mp4 45:30
* 02 02.计算两两用户的相似度倒排列表.mp4 34:59
* 03 03.基于商品的协同过滤.mp4 01:53:12
* 04 04.基于商品的协同过滤和兴趣度算法.mp4 50:31
* 05 05.基于商品的协过滤推荐实现.mp4 58:47
* 06 06.LFM模型.mp4 51:54
* 07 07.知识点总结.mp4 01:05:21
* 08 08.简历指导.mp4 01:06:44





![[衡天云]爆款云服务器 低至12元/月](/hty.png)