从0开始学习大数据，Spark从入门到精通

* 第一章 scala/

* Scala基础语法/

* 00-[了解]-课程介绍

* 01-[了解]-Scala概述

* 02-[掌握]-Scala运行环境准备

* 03-[掌握]-Scala开发环境准备

* 04-[掌握]-Scala初体验

* 05-[掌握]-Scala基础语法-变量

* 06-[掌握]-Scala基础语法-数据类型

* 07-[掌握]-Scala基础语法-操作符

* 08-[掌握]-Scala基础语法-块表达式

* 09-[掌握]-Scala基础语法-判断

* 10-[掌握]-Scala基础语法-循环

* Scala函数定义/

* 11-[掌握]-Scala方法定义和语法细节

* 12-[掌握]-Scala函数定义格式

* 13-[理解]-Scala函数的本质

* Scala集合/

* 14-[了解]-Scala集合分类和继承体系

* 14-[掌握]-Scala集合-Array-基本使用

* 15-[掌握]-Scala集合-List-基本使用

* 16-[掌握]-Scala集合-Set-基本使用

* 17-[掌握]-Scala集合-Tuple-基本使用

* 18-[掌握]-Scala集合-Map-基本使用

* 19-[掌握]-Scala集合-Queue和Stack-基本使用

* 20-[掌握]-Scala集合-集合遍历-基本使用

* 21-[总结]-总结和作业

* Scala函数式编程/

* 01-[重点]-函数式编程API-遍历-过滤

* 02-[重点]-函数式编程API-排序

* 03-[重点]-函数式编程API-映射

* 04-[重点]-函数式编程API-扁平化映射

* 05-[重点]-函数式编程API-分组

* 06-[重点]-函数式编程API-聚合

* 07-[重点]-函数式编程API-折叠

* Scala综合练习/

* 08-[重点]-综合练习-WordCount-1-普通API

* 09-[重点]-综合练习-WordCount-2-函数式API

* 10-[重点]-综合练习-WordCount-3-加载文件数据

* 11-[重点]-综合练习-WordCount-4-加载文件夹数据

* Scala面向对象/

* 12-[理解]-面向对象-class定义

* 13-[理解]-面向对象-class-构造器

* 14-[理解]-面向对象-object-作为程序入口

* 15-[理解]-面向对象-object-作为伴生对象

* 16-[理解]-面向对象-object-作为工具类

* 17-[理解]-面向对象-object-提供apply

* 18-[理解]-面向对象-继承-关键字

* 19-[理解]-面向对象-继承-类型判断-转换-获取

* 20-[理解]-面向对象-继承-子父构造

* 21-[理解]-面向对象-继承-抽象类

* 22-[理解]-面向对象-Trait-作为接口

* 23-[理解]-面向对象-Trait-继承class

* 24-[理解]-面向对象-Trait-对象混入trait

* 25-[理解]-面向对象-Trait-trait构造

* 26-[理解]-面向对象-样例类

* 27-[理解]-面向对象-总结

* Scala模式匹配/

* 01-[掌握]-Scala-模式匹配

* 02-[掌握]-Scala-模式匹配-其他用法-Option

* 03-[掌握]-Scala-模式匹配-其他用法-偏函数

* 04-[掌握]-Scala-模式匹配-其他用法-unapply

* 05-[掌握]-Scala-模式匹配-其他用法-异常处理

* Scala隐式转换和正则表达式/

* 06-[掌握]-Scala-隐式转换

* 07-[掌握]-Scala-正则表达式

* Scala高阶函数/

* 08-[掌握]-Scala-高阶函数-函数回顾

* 09-[掌握]-Scala-高阶函数-闭包

* 10-[掌握]-Scala-高阶函数-柯里化

* Scala泛型/

* 11-[复习]-Java中的泛型回顾

* 12-[掌握]-Scala泛型-定义泛型类和泛型方法

* 13-[掌握]-Scala泛型-协变-逆变-非变

* 14-[掌握]-Scala泛型-泛型上下界

* 15-[总结]-总结和作业

* Actor/

* 01-[理解]-Actor引入

* 02-[掌握]-Actor的创建

* 03-[掌握]-Actor发送接收消息

* 04-[掌握]-Actor循环发送接收消息

* 05-[掌握]-Actor复用线程

* 06-[掌握]-Actor发送接收各种消息

* 07-[重点]-Actor-WordCount需求分析

* 08-[重点]-Actor-WordCount-代码实现

* Akka/

* 09-[了解]-Akka并发编程-Akka介绍

* 10-[掌握]-Akka并发编程-模拟简单的RPC通信

* 11-[掌握]-Akka并发编程-模拟Spark通信-需求分析和准备工作

* 12-[理解]-Akka并发编程-模拟Spark通信-Master代码实现

* 13-[理解]-Akka并发编程-模拟Spark通信-Worker代码实现

* 14-[总结]-总结和作业

* 第二章 Spark/

* SparkBase/

* 01-课程介绍及难点知识介绍

* 02-Spark引入

* 03-Spark和Hadoop区别

* 04-Spark和local模式的应用1

* 05-Spark和local模式的应用2

* 06-Spark的local模式提交任务3

* 07-Spark的StandaloneHA模式安装配置2

* 08-Spark的Standalone模式安装配置1

* 09-Spark的StandaloneHA模式安装配置2

* 10-Spark的IDEA的scala版本wordcount

* 11-Spark的IDEA的java版本wordcount

* 12-Spark的三个重要的补充

* 13-Spark的Yarn的安装及任务提交

* 14-Spark的两种deploymode

* 15-Spark的OnYarn的Client的模式讲解

* 16-Spark的OnYarn的Cluster模式

* 17-Spark提交Jar包到集群运行并查看结果

* 18-Spark的OnYarn的参数配置

* 19-Spark总结

* SparkCore1/

* 01-回顾1

* 02-回顾2

* 03-Spark的Wordcount、

* 04-Spark的RDD的基础介绍

* 05-Spark的RDD的五大属性

* 06-Spark的RDD的五大属性图解

* 07-Spark的并行度设置

* 08-Spark的小文件读取

* 09-Spark的两种读取文件方法测试

* 10-Spark的并行度的设置总结

* 11-Spark的RDD的单Value类型数据

* 12-单Value类型的RDD的讲解

* 13-双Value类型的RDD的讲解

* 14-Key-value类型的算子讲解

* 15-Spark的GroupBy写法2(了解)

* 16-Spark的CombineByKey

* 17-Spark的foldBykey的操作

* 18-Spark的其他操作

* 19-Action操作

* 20-总结

* SparkCore2/

* 01-回顾

* 02-回顾2

* 03-回顾3

* 04-相关函数补充

* 05-案例代码实战1：Spark实战PV-UV-TOPK

* 06-案例代码实战2：HanLP使用

* 07-案例代码实战2：数据集读取

* 08-案例代码实战2：各种指标读取

* 09-案例代码实战3-IP地址查询分析

* 10-案例代码实战3-IP地址查询广播变量

* 11-案例代码实战3-IP地址查询

* 12-补充combineBykey操作

* 13-RDD的依赖关系

* 14-RDD的DAG

* 15-RDD的缓存

* 16-RDD的缓存的演示

* 17-RDD的checkpoint

* 18-RDD的checkpoint的演示和Spark容错

* 19-Spark的执行流程分析

* 20-Spark调度源码分析(了解)

* 21-总结

* SparkSQL/

* 01-回顾1

* 02-累加器和广播变量

* 03-Spark的序列化类型

* 03-Spark数据写入MySQL

* 04-groupByKey讨论是否是shuffle算子

* 05-spark内存模型

* 06-spark的shuffle

* 07-了解SparkShuffle补充

* 08-了解Shuffle源码

* 09-SparkCore总结

* 10-SparkSQL介绍

* 11-SQL的三种数据结构

* 12-SparkSession入口

* 13-Spark

* 14-Spark

* 15-Spar

* 16-Spark的dsl和sql的两种方式讲解

* 17-Spark的电影案例

* 18-SparkSql三种类型转换

* 19-总结

* SparkSQL&Streaming/

* 01-回顾

* 02-Spark读取文件模板代码

* 03-SparkSQL的案例1

* 04-SparkSQL的案例2

* 05-SparkSQL的写入MySQL和读取MySQL

* 06-SparkSQL与Hive本地集成

* 06-SparkSQL与Hive远程集成

* 07-SparkSQL的其他方式的访问(了解)

* 08-SparksQL的UDF函数详解

* 09-SparksQL的UDAF函数

* 10-UDF的开窗函数

* 11-SparkSQL的执行过程面试总结

* 12-SparkStreaming的初体验

* 13-SparkStreaming原理初步

* 14-SparkStreaming的有状态的应用

* 15-总结

* SparkStreaming/

* 01-回顾

* 02-mapWithState

* 03-sparkstreaming原理介绍

* 04-SparkStreaming的窗口操作

* 05-SparkStreaming的百度热词统计

* 06-SparkStreaming的基础文本数据源

* 07-了解SparkSQL整合SparkStraming

* 08-Kafka回顾

* 09-kafka启动和其他命令

* 10-SparkStreaming两种整合方案

* 11-SparkStreaming和kafka整合方式实现wordcount

* 12-SparkStreaming和kafka手动提交并打印偏移量

* 13-模板代码抽取

* 14-驱动器容错

* 15-Sparkstreaming容错

* 16-sparkstreaming的offset写入MySQL

* 17-sparkstreaming总结

* StructuredStreaming/

* 01-回顾

* 02-回顾2

* 03-SparkStreaming基本编程模型

* 04-StructuredString的第一个程序

* 05-StructuredStreaming输出模式限制

* 05-StructuredString的文本数据元

* 06-StructuredString写入MySQL的方法1

* 07-StructuredString写入MySQL的方法2

* 08-StructuredStreaming写入Kafka

* 09-StructuredStreaming写入Kafka注意事项

* 10-结构化流案例实战1

* 11-结构化流案例实战2

* 12-补充Json的解析

* 13-对重复数据的处理机制

* 14-了解事件时间以及水位线

* 15-总结