极客时间-吴磊-零基础入门Spark(完结)

Spark核心技术与实战解析

编辑点评

深入浅出,从Spark SQL到MLlib,全面掌握大数据处理与机器学习。

⭐ 编辑推荐

吴磊老师带你零基础入门Spark,从Spark SQL到MLlib,掌握大数据处理与机器学习核心技能。

课程亮点

Spark核心组件解析
机器学习算法实战
大数据处理最佳实践

课程目录

📁 04-SparkMLlib(2讲)
    26丨模型训练(上):决策树系列算法详解.html  [2.4 MB]
    25丨特征工程(下):有哪些常用的特征处理函数?.html  [3.1 MB]
    24丨特征工程(上):有哪些常用的特征处理函数?.pdf  [4.6 MB]
    27丨模型训练(中):回归、分类和聚类算法详解.m4a  [10.4 MB]
    27丨模型训练(中):回归、分类和聚类算法详解.pdf  [3.8 MB]
    29丨SparkMLlibPipeline:高效开发机器学习应用.html  [2.2 MB]
    29丨SparkMLlibPipeline:高效开发机器学习应用.pdf  [2.1 MB]
    24丨特征工程(上):有哪些常用的特征处理函数?.m4a  [15.8 MB]
    29丨SparkMLlibPipeline:高效开发机器学习应用.m4a  [12.8 MB]
    27丨模型训练(中):回归、分类和聚类算法详解.html  [2.4 MB]
    23丨SparkMLlib:从“房价预测”开始.m4a  [14.8 MB]
    24丨特征工程(上):有哪些常用的特征处理函数?.html  [3.7 MB]
    26丨模型训练(上):决策树系列算法详解.pdf  [4.7 MB]
    28丨模型训练(下):协同过滤与频繁项集算法详解.pdf  [4.3 MB]
    25丨特征工程(下):有哪些常用的特征处理函数?.m4a  [11.6 MB]
    26丨模型训练(上):决策树系列算法详解.m4a  [11.8 MB]
    23丨SparkMLlib:从“房价预测”开始.pdf  [4.8 MB]
    23丨SparkMLlib:从“房价预测”开始.html  [3.2 MB]
    25丨特征工程(下):有哪些常用的特征处理函数?.pdf  [5.2 MB]
    28丨模型训练(下):协同过滤与频繁项集算法详解.html  [2.7 MB]
    28丨模型训练(下):协同过滤与频繁项集算法详解.m4a  [10.3 MB]
📁 03-Spark SQL (4讲)
    17丨数据关联:不同的关联形式与实现机制该怎么选?.m4a  [14.5 MB]
    15丨数据源与数据格式:DataFrame从何而来?.pdf  [4.5 MB]
    21丨SparkUI(上):如何高效地定位性能问题?.pdf  [6.5 MB]
    17丨数据关联:不同的关联形式与实现机制该怎么选?.html  [2.5 MB]
    16丨数据转换:如何在DataFrame之上做数据处理?.html  [3.3 MB]
    16丨数据转换:如何在DataFrame之上做数据处理?.pdf  [4.5 MB]
    19丨配置项详解:哪些参数会影响应用程序执行性能?.pdf  [3.7 MB]
    20丨Hive+Spark强强联合:分布式数仓的不二之选.m4a  [17.4 MB]
    18丨数据关联优化:都有哪些Join策略,开发者该如何取舍?.pdf  [4.2 MB]
    20丨Hive+Spark强强联合:分布式数仓的不二之选.pdf  [5.0 MB]
    19丨配置项详解:哪些参数会影响应用程序执行性能?.m4a  [14.3 MB]
    14丨DataFrame与SparkSQL的由来.pdf  [5.7 MB]
    …(已达 35 条上限,后续省略)
…(已达 35 条上限,后续省略)

适合人群

  • 大数据初学者
  • Spark开发者
  • 数据分析师

学习收获

掌握Spark基础
精通Spark SQL和MLlib
提升大数据处理能力

祝您学习愉快!

学有所成,前程似锦!