将全面掌握Spark生态体系,深入理解Spark性能优化的核心要点,成为一名专业的大数据工程师

*   01 课程简介及环境安装/

  *   01 Spark3+Clickhouse课程大纲简介.mp4 11:41

  *   02 大数据生态圈现状.mp4 11:04

  *   03 彻底理解Spark RDD.mp4 13:38

  *   04 开发环境安装JDK+Scala2.12.mp4 11:31

  *   05 Spark3源码跟踪学习技巧.mp4 09:06

  *   06 Spark IDEA调试环境搭建.mp4 06:38

  *   07 Net网络配置及虚拟机静态IP配置.mp4 16:08

  *   08 VMWare Workstation克隆主机.mp4 05:31

  *   09 SSH无密钥登陆及关闭防火墙.mp4 06:28

  *   10 Hadoop集群搭建.mp4 22:03

  *   11 Spark3.x集群搭建.mp4 06:14

*   02 Hadoop/Yarn光速入门/

  *   01 Hadoop集群动态扩容.mp4 22:45

  *   02 Yarn核心组件及调度原理.mp4 11:16

  *   03 Spark Yarn两种调度模式原理及代码实战.mp4 23:51

*   03 Spark RDD光速入门/

  *   01 Spark JdbcRDD等多种方式创建RDD.mp4 26:12

  *   02 Jupter Notebook PySpark学习环境搭建.mp4 09:52

  *   03 累加器和广播变量等8个知识点.mp4 27:36

  *   04 SparkContext上的20个知识点.mp4 10:44

  *   05 combineByKey等6个知识点.mp4 21:37

  *   06 牢记容易被混淆的xxxByKey算子.mp4 10:34

  *   07 RDD集合的差并补集.mp4 17:15

  *   08 RDD上其余的20个知识点.mp4 23:53

  *   09 通过隐式转换扩充RDD转换算子.mp4 17:53

  *   10 通过隐式转换扩充RDD Action算子.mp4 17:08

  *   11 常用的Action算子汇总(1).mp4 30:03

  *   12 常见的Action算子汇总(2).mp4 12:42

  *   13 SparkConfig配置对象.mp4 12:03

  *   14 Spark任务调度源码走读.mp4 30:36

  *   15 基于Spark RDD的项目实战.mp4 13:31

*   04 DataFrame/Dataset光速入门/

  *   01 SparkSession详解.mp4 33:25

  *   02 SparkSession read and write.mp4 18:02

  *   03 SparkSQL模块简介.mp4 06:22

  *   04 Spark DataFrame核心算子知识点16.mp4 34:44

  *   05 Spark DataFrame核心知识点60.mp4 46:12

  *   06 GroupedData和Column知识点.mp4 41:42

  *   07 Catalog和Row知识点.mp4 14:20

  *   08 空数据处理和数据统计.mp4 22:03

  *   09 Spark读写数据详细知识点.mp4 32:36

  *   10 Spark数据类型及functions核武库.mp4 49:43

  *   11 基于DataFrame的数据挖掘实战.mp4 18:34

*   05 SparkSQL进阶/

  *   01 人生苦短我用SparkSQL.mp4 10:51

  *   02 SparkSQL join原理及优化思路.mp4 36:13

  *   03 SparkUDF用户自定义函数.mp4 11:14

  *   04 Spark UDAF用户自定义聚合函数.mp4 09:38

  *   05 SparkSQL整合Hive.mp4 29:36

  *   06 Spark UDTF用户自定义表生成函数.mp4 09:25

  *   07 SparkSQL性能优化数据倾斜之两阶段聚合.mp4 21:24

  *   08 SparkSQL大表关联小表数据倾斜优化以及broad.mp4 13:14

  *   09 Sql执行顺序及数仓分层理论.mp4 11:42

  *   10 SparkSQL+Hive构建离线数仓.mp4 37:09

  *   11 DWD明细数据生成.mp4 12:54

*   06 Structured Streaming光速入门/

  *   01 Structured Streaming流式处理的两种模式.mp4 09:17

  *   02 Structured Streaming核心概念.mp4 32:33

  *   03 Structured Streaming滑动窗口和水印.mp4 37:33

  *   04 Zokeeper集群搭建.mp4 16:15

  *   05 Kafka集群搭建.mp4 24:16

  *   06 pykafka推送hive订单数据到topic.mp4 27:43

  *   07 Structured Streaming消费kafka数据.mp4 10:52

*   07 SparkML快速入门/

  *   01 机器学习项目python数据处理.mp4 20:19

  *   02 SparkML向量及矩阵表示.mp4 22:16

  *   03 SparkML中四种分布式矩阵表示.mp4 16:05

  *   04 SparkML特征转换(1).mp4 44:17

  *   05 SparkML特征转换(2).mp4 16:55

  *   06 SparkML pipline管道.mp4 20:01

  *   07 SparkML交叉验证及网格搜索.mp4 12:50

  *   08 SparkML房价预测.mp4 20:37

*   08 Spark性能调优/

  *   01 Spark程序编写9大准则.mp4 27:38

  *   02 Spark程序性能优化8大技巧.mp4 37:51

*   09 Clickhouse光速入门/

  *   01 Clickhouse安装及用户和密码配置.mp4 17:54

  *   02 TinyLog、Memory、Merge引擎.mp4 15:59

  *   03 MergeTree引擎.mp4 33:11

  *   04 Clickhouse集群配置及分布式表.mp4 29:03

  *   05 Clickhouse单机多实例部署.mp4 31:54

  *   06 Clickhouse三机双实例部署.mp4 08:53

  *   07 Clickhouse三分片两副本集群配置.mp4 16:42

  *   08 ReplicatedMergeTree实战.mp4 24:51

  *   09 查询工具Tabix及DBeaver配置及使用.mp4 13:46

  *   10 SSB数据分析实战.mp4 37:15

  *   11 Catboost安装及回归分析应用.mp4 20:01

  *   12 Catboost回归模型在clickhouse sql中应用.mp4 29:08

*   10 clickhouse集群监控/

  *   01 Clickhouse集群监控之Prometheus安装.mp4 09:50

  *   02 Clickhouse集群监控之Grafana配置.mp4 10:59

  *   03 Clickhouse集群监控之node_exporter配置.mp4 11:17

  *   04 Grafana导入clickhouse集群监控模板.mp4 02:42

  *   05 Nginx反向代理Tabix+Pro+CK+Grafana.mp4 37:26