从0开始学习大数据,Spark从入门到精通

*   第一章 scala/

  *   Scala基础语法/

    *   00-[了解]-课程介绍

    *   01-[了解]-Scala概述

    *   02-[掌握]-Scala运行环境准备

    *   03-[掌握]-Scala开发环境准备

    *   04-[掌握]-Scala初体验

    *   05-[掌握]-Scala基础语法-变量

    *   06-[掌握]-Scala基础语法-数据类型

    *   07-[掌握]-Scala基础语法-操作符

    *   08-[掌握]-Scala基础语法-块表达式

    *   09-[掌握]-Scala基础语法-判断

    *   10-[掌握]-Scala基础语法-循环

  *   Scala函数定义/

    *   11-[掌握]-Scala方法定义和语法细节

    *   12-[掌握]-Scala函数定义格式

    *   13-[理解]-Scala函数的本质

  *   Scala集合/

    *   14-[了解]-Scala集合分类和继承体系

    *   14-[掌握]-Scala集合-Array-基本使用

    *   15-[掌握]-Scala集合-List-基本使用

    *   16-[掌握]-Scala集合-Set-基本使用

    *   17-[掌握]-Scala集合-Tuple-基本使用

    *   18-[掌握]-Scala集合-Map-基本使用

    *   19-[掌握]-Scala集合-Queue和Stack-基本使用

    *   20-[掌握]-Scala集合-集合遍历-基本使用

    *   21-[总结]-总结和作业

  *   Scala函数式编程/

    *   01-[重点]-函数式编程API-遍历-过滤

    *   02-[重点]-函数式编程API-排序

    *   03-[重点]-函数式编程API-映射

    *   04-[重点]-函数式编程API-扁平化映射

    *   05-[重点]-函数式编程API-分组

    *   06-[重点]-函数式编程API-聚合

    *   07-[重点]-函数式编程API-折叠

  *   Scala综合练习/

    *   08-[重点]-综合练习-WordCount-1-普通API

    *   09-[重点]-综合练习-WordCount-2-函数式API

    *   10-[重点]-综合练习-WordCount-3-加载文件数据

    *   11-[重点]-综合练习-WordCount-4-加载文件夹数据

  *   Scala面向对象/

    *   12-[理解]-面向对象-class定义

    *   13-[理解]-面向对象-class-构造器

    *   14-[理解]-面向对象-object-作为程序入口

    *   15-[理解]-面向对象-object-作为伴生对象

    *   16-[理解]-面向对象-object-作为工具类

    *   17-[理解]-面向对象-object-提供apply

    *   18-[理解]-面向对象-继承-关键字

    *   19-[理解]-面向对象-继承-类型判断-转换-获取

    *   20-[理解]-面向对象-继承-子父构造

    *   21-[理解]-面向对象-继承-抽象类

    *   22-[理解]-面向对象-Trait-作为接口

    *   23-[理解]-面向对象-Trait-继承class

    *   24-[理解]-面向对象-Trait-对象混入trait

    *   25-[理解]-面向对象-Trait-trait构造

    *   26-[理解]-面向对象-样例类

    *   27-[理解]-面向对象-总结

  *   Scala模式匹配/

    *   01-[掌握]-Scala-模式匹配

    *   02-[掌握]-Scala-模式匹配-其他用法-Option

    *   03-[掌握]-Scala-模式匹配-其他用法-偏函数

    *   04-[掌握]-Scala-模式匹配-其他用法-unapply

    *   05-[掌握]-Scala-模式匹配-其他用法-异常处理

  *   Scala隐式转换和正则表达式/

    *   06-[掌握]-Scala-隐式转换

    *   07-[掌握]-Scala-正则表达式

  *   Scala高阶函数/

    *   08-[掌握]-Scala-高阶函数-函数回顾

    *   09-[掌握]-Scala-高阶函数-闭包

    *   10-[掌握]-Scala-高阶函数-柯里化

  *   Scala泛型/

    *   11-[复习]-Java中的泛型回顾

    *   12-[掌握]-Scala泛型-定义泛型类和泛型方法

    *   13-[掌握]-Scala泛型-协变-逆变-非变

    *   14-[掌握]-Scala泛型-泛型上下界

    *   15-[总结]-总结和作业

  *   Actor/

    *   01-[理解]-Actor引入

    *   02-[掌握]-Actor的创建

    *   03-[掌握]-Actor发送接收消息

    *   04-[掌握]-Actor循环发送接收消息

    *   05-[掌握]-Actor复用线程

    *   06-[掌握]-Actor发送接收各种消息

    *   07-[重点]-Actor-WordCount需求分析

    *   08-[重点]-Actor-WordCount-代码实现

  *   Akka/

    *   09-[了解]-Akka并发编程-Akka介绍

    *   10-[掌握]-Akka并发编程-模拟简单的RPC通信

    *   11-[掌握]-Akka并发编程-模拟Spark通信-需求分析和准备工作

    *   12-[理解]-Akka并发编程-模拟Spark通信-Master代码实现

    *   13-[理解]-Akka并发编程-模拟Spark通信-Worker代码实现

    *   14-[总结]-总结和作业

*   第二章 Spark/

  *   SparkBase/

    *   01-课程介绍及难点知识介绍

    *   02-Spark引入

    *   03-Spark和Hadoop区别

    *   04-Spark和local模式的应用1

    *   05-Spark和local模式的应用2

    *   06-Spark的local模式提交任务3

    *   07-Spark的StandaloneHA模式安装配置2

    *   08-Spark的Standalone模式安装配置1

    *   09-Spark的StandaloneHA模式安装配置2

    *   10-Spark的IDEA的scala版本wordcount

    *   11-Spark的IDEA的java版本wordcount

    *   12-Spark的三个重要的补充

    *   13-Spark的Yarn的安装及任务提交

    *   14-Spark的两种deploymode

    *   15-Spark的OnYarn的Client的模式讲解

    *   16-Spark的OnYarn的Cluster模式

    *   17-Spark提交Jar包到集群运行并查看结果

    *   18-Spark的OnYarn的参数配置

    *   19-Spark总结

  *   SparkCore1/

    *   01-回顾1

    *   02-回顾2

    *   03-Spark的Wordcount、

    *   04-Spark的RDD的基础介绍

    *   05-Spark的RDD的五大属性

    *   06-Spark的RDD的五大属性图解

    *   07-Spark的并行度设置

    *   08-Spark的小文件读取

    *   09-Spark的两种读取文件方法测试

    *   10-Spark的并行度的设置总结

    *   11-Spark的RDD的单Value类型数据

    *   12-单Value类型的RDD的讲解

    *   13-双Value类型的RDD的讲解

    *   14-Key-value类型的算子讲解

    *   15-Spark的GroupBy写法2(了解)

    *   16-Spark的CombineByKey

    *   17-Spark的foldBykey的操作

    *   18-Spark的其他操作

    *   19-Action操作

    *   20-总结

  *   SparkCore2/

    *   01-回顾

    *   02-回顾2

    *   03-回顾3

    *   04-相关函数补充

    *   05-案例代码实战1:Spark实战PV-UV-TOPK

    *   06-案例代码实战2:HanLP使用

    *   07-案例代码实战2:数据集读取

    *   08-案例代码实战2:各种指标读取

    *   09-案例代码实战3-IP地址查询分析

    *   10-案例代码实战3-IP地址查询广播变量

    *   11-案例代码实战3-IP地址查询

    *   12-补充combineBykey操作

    *   13-RDD的依赖关系

    *   14-RDD的DAG

    *   15-RDD的缓存

    *   16-RDD的缓存的演示

    *   17-RDD的checkpoint

    *   18-RDD的checkpoint的演示和Spark容错

    *   19-Spark的执行流程分析

    *   20-Spark调度源码分析(了解)

    *   21-总结

  *   SparkSQL/

    *   01-回顾1

    *   02-累加器和广播变量

    *   03-Spark的序列化类型

    *   03-Spark数据写入MySQL

    *   04-groupByKey讨论是否是shuffle算子

    *   05-spark内存模型

    *   06-spark的shuffle

    *   07-了解SparkShuffle补充

    *   08-了解Shuffle源码

    *   09-SparkCore总结

    *   10-SparkSQL介绍

    *   11-SQL的三种数据结构

    *   12-SparkSession入口

    *   13-Spark

    *   14-Spark

    *   15-Spar

    *   16-Spark的dsl和sql的两种方式讲解

    *   17-Spark的电影案例

    *   18-SparkSql三种类型转换

    *   19-总结

  *   SparkSQL&Streaming/

    *   01-回顾

    *   02-Spark读取文件模板代码

    *   03-SparkSQL的案例1

    *   04-SparkSQL的案例2

    *   05-SparkSQL的写入MySQL和读取MySQL

    *   06-SparkSQL与Hive本地集成

    *   06-SparkSQL与Hive远程集成

    *   07-SparkSQL的其他方式的访问(了解)

    *   08-SparksQL的UDF函数详解

    *   09-SparksQL的UDAF函数

    *   10-UDF的开窗函数

    *   11-SparkSQL的执行过程面试总结

    *   12-SparkStreaming的初体验

    *   13-SparkStreaming原理初步

    *   14-SparkStreaming的有状态的应用

    *   15-总结

  *   SparkStreaming/

    *   01-回顾

    *   02-mapWithState

    *   03-sparkstreaming原理介绍

    *   04-SparkStreaming的窗口操作

    *   05-SparkStreaming的百度热词统计

    *   06-SparkStreaming的基础文本数据源

    *   07-了解SparkSQL整合SparkStraming

    *   08-Kafka回顾

    *   09-kafka启动和其他命令

    *   10-SparkStreaming两种整合方案

    *   11-SparkStreaming和kafka整合方式实现wordcount

    *   12-SparkStreaming和kafka手动提交并打印偏移量

    *   13-模板代码抽取

    *   14-驱动器容错

    *   15-Sparkstreaming容错

    *   16-sparkstreaming的offset写入MySQL

    *   17-sparkstreaming总结

  *   StructuredStreaming/

    *   01-回顾

    *   02-回顾2

    *   03-SparkStreaming基本编程模型

    *   04-StructuredString的第一个程序

    *   05-StructuredStreaming输出模式限制

    *   05-StructuredString的文本数据元

    *   06-StructuredString写入MySQL的方法1

    *   07-StructuredString写入MySQL的方法2

    *   08-StructuredStreaming写入Kafka

    *   09-StructuredStreaming写入Kafka注意事项

    *   10-结构化流案例实战1

    *   11-结构化流案例实战2

    *   12-补充Json的解析

    *   13-对重复数据的处理机制

    *   14-了解事件时间以及水位线

    *   15-总结