体验Spark技术,加深对大数据的认识,为后续做项目夯实基础。

*   01 Spark基础day01/

  *   01 01.Spark介绍-安装-测试.mp4 16:30

  *   02 02.Spark shell实现word count.mp4 26:04

  *   03 03.Spark idea下编程scala版.mp4 24:19

  *   04 04.Spark idea下编程java版.mp4 15:01

*   02 Spark基础day02/

  *   01 01.气温数据多重聚合.mp4 25:46

  *   02 02.气温数据多重聚合java实现.mp4 16:04

  *   03 03.标签生成scala.mp4 48:12

  *   04 04.标签生成Java.mp4 34:18

  *   05 05.spark集群部署.mp4 22:56

  *   06 06.spark集群上执行taggen.mp4 25:26

  *   07 07.spark shell运行taggen.mp4 31:19

  *   08 08.RDD考察.mp4 37:00

  *   09 09.Spark核心组件.mp4 01:23:48

*   03 Spark RDD核心day03/

  *   01 01.RDD详解.mp4 01:04:03

  *   02 02.分布式调试工具.mp4 53:04

  *   03 03.分布式调试工具考察wc执行分布.mp4 26:17

  *   04 04.hello world执行过程分析2.mp4 38:55

  *   05 05.sparkcontext考察.mp4 11:53

  *   06 06.spark job三级调度框架.mp4 31:55

  *   07 07.spark job提交流程1.mp4 23:55

  *   08 08.创建ResultStage的步骤.mp4 01:23:49

  *   09 09.ShuffleMapStage的算法实现.mp4 37:39

  *   10 10.任务提交细节.mp4 05:19

*   04 Spark部署与资源分配day04/

  *   01 01.提交任务过程分析.mp4 40:38

  *   02 02.后台调度器创建-分区数计算.mp4 40:57

  *   03 03.hadoopRDD分区数据的计算法则.mp4 12:47

  *   04 04.spark集群资源分配.mp4 01:00:05

  *   05 05.spark on yarn部署模式配置.mp4 01:05:31

  *   06 06.yarnclient和yarncluster.mp4 42:29

  *   07 07.task数-内核数-执行器个数测试.mp4 38:01

  *   08 08.task数-内核数-执行器个数测试2.mp4 19:20

*   05 Spark部署与资源分配day05/

  *   01 01.job提交协作图分析.mp4 56:44

  *   02 02.job提交协作图分析2.mp4 02:22

  *   03 03.mapPartition.mp4 23:56

  *   04 04.join.mp4 18:55

  *   05 05.cogroup.mp4 04:44

  *   06 06.笛卡尔积.mp4 03:01

  *   07 07.RDD 重新分区,排序.mp4 21:35

  *   08 08.数据倾斜-重新设计key.mp4 10:06

  *   09 09.数据倾斜-自定义随机分区.mp4 07:14

  *   10 10.合成基本函数的使用.mp4 51:29

  *   11 11.spark聚合函数总结.mp4 20:03

  *   12 12.spark常用action.mp4 26:03

  *   13 13.shuffle预热.mp4 27:08

*   06 Spark Shuffle核心day06/

  *   01 01.shuffle管理器介绍.mp4 41:00

  *   02 02.shuffleHandler注册原理分析.mp4 54:55

  *   03 03.串行化写入过程分析.mp4 34:11

  *   04 04.unsafeWriter写入分析-1.mp4 38:38

  *   05 05.unsafeWriter写入分析-2.mp4 49:56

  *   06 06.unsafeWriter写入分析-3.mp4 01:21:07

  *   07 07.unsafeWriter总结.mp4 07:55

  *   08 08.SortShuffleWriter.mp4 52:10

  *   09 09.Shuffle总结.mp4 15:52

*   07 Spark内存管理和广播变量day07/

  *   01 01.shuffle原理回顾.mp4 31:49

  *   02 02.shuffle reader.mp4 35:50

  *   03 03.driver程序考察.mp4 17:37

  *   04 04.driver端程序考察.mp4 17:09

  *   05 05.spark广播变量.mp4 44:28

  *   06 06.spark广播变量原理实现-rdd与广播变量.mp4 16:27

  *   07 07.Spark累加器.mp4 24:00

  *   08 08.Spark自定义累加器.mp4 28:54

  *   09 09.spark内存管理.mp4 53:52

  *   10 10.spark内存管理2.mp4 06:26

  *   11 11.Spark SQL集成hive.mp4 11:46

  *   12 12.Spark SQL集成Scala编程.mp4 11:49

  *   13 13.Spark SQL RDD转成DataFrame Sc.mp4 26:54

  *   14 14.Spark SQL RDD转成DataFrame Ja.mp4 09:08

*   08 SparkML、SQL、Streaming核心day08/

  *   01 01.公式回顾.mp4 28:33

  *   02 02.随机种子-训练街切割.mp4 31:18

  *   03 03.贝叶斯模型.mp4 11:34

  *   04 04.训练模型-统计单词数.mp4 32:37

  *   05 05.训练模型-统计指标数据.mp4 23:51

  *   06 06.训练模型-预测.mp4 52:24

  *   07 07.训练模型-预测评分计算.mp4 30:20

  *   08 08.模型评估.mp4 27:19

  *   09 09.SparkSQL初级.mp4 29:34

  *   10 10.spark分布式查询引擎.mp4 18:05

  *   11 11.spark分布式查询引擎-client访问.mp4 08:20

  *   12 12.spark streaming体验.mp4 20:05

  *   13 13.spark streaming体验java程序.mp4 13:05

  *   14 14.spark streaming介绍.mp4 15:19

*   09 Spark Streaming核心day09/

  *   01 1.block间隔设置-分区数考察.mp4 43:52

  *   02 2.流计算限速(每秒最大速率设置).mp4 06:40

  *   03 3.流计算限速-启用压后处理.mp4 05:23

  *   04 4.流计算限速-windows操作.mp4 27:06

  *   05 5.流计算限速-shuffle过程分解.mp4 22:48

  *   06 6.updateStateByKey.mp4 15:26

  *   07 7.实现windows的duration功能.mp4 22:55

  *   08 8.避免小文件.mp4 22:14

  *   09 9.StreamingSQL-检查点.mp4 30:55

  *   10 10.StreamingSQL-disk持久化.mp4 42:54

  *   11 11.Streaming kafka集成.mp4 31:06

  *   12 12.Streaming kafka位置策略.mp4 47:44

  *   13 13.kafka位置策略-PreferFixed.mp4 44:59

  *   14 14.Streaming kafka2.mp4 19:44

*   10 Spark机器学习day10/

  *   01 01.kafka流-kafkaRDD.mp4 31:40

  *   02 02.kafka流-消费者策略.mp4 30:59

  *   03 03.kafka流-偏移量提交问题.mp4 49:59

  *   04 04.kafka流-精准一次消费.mp4 50:44

  *   05 05.机器学习基础.mp4 22:42

  *   06 06.机器学习-概念.mp4 14:11

  *   07 07.线性回归.mp4 27:16

  *   08 08.逻辑回归.mp4 17:09

  *   09 09.贝叶斯.mp4 07:26

  *   10 10.贝叶斯代码实现.mp4 28:17

  *   11 11.贝叶斯代码分析.mp4 27:15

  *   12 12.hashTF词频-垃圾邮件过滤.mp4 14:42

  *   13 13.hashTF词频-垃圾邮件过滤java.mp4 05:58

  *   14 14.kmean.mp4 27:20

  *   15 15.tf-idf计算.mp4 31:13

  *   16 16.pipeline.mp4 06:25

*   11 Spark实战+Redis核心day11/

  *   01 1.矩阵分解模型实现推荐.mp4 28:32

  *   02 2.pyspark使用centos.mp4 11:17

  *   03 3.提交python脚本.mp4 15:49

  *   04 4.python-hive-pyspark集成.mp4 12:23

  *   05 5.idea-pyspark集成.mp4 37:05

  *   06 6.hive-sparksession集成.mp4 17:22

  *   07 7.redis安装与测试.mp4 05:10

  *   08 8.redis linux下安装与测试.mp4 08:42

  *   09 9.redis key基本操作.mp4 07:13

  *   10 10.redis 数据库基本操作.mp4 08:03

  *   11 11.redis hash类型.mp4 15:49

  *   12 12.redis list类型.mp4 08:39

  *   13 13.redis set类型.mp4 11:38

  *   14 14.redis zset类型.mp4 16:33

  *   15 15.redis api访问数据库.mp4 07:04

  *   16 16.redis 图片读写.mp4 18:34

  *   17 17.redis 配置文件.mp4 11:24

  *   18 18.redis 发布订阅消息.mp4 06:55

  *   19 19.redis 集群搭建-api访问.mp4 49:21