飞豹客 · 教程详情

Spark大数据处理及机器学习【基于Python的Spark 2.3**版】

体系课

23 人浏览发布 2026-06-09更新 2026-07-10

对于想转行或学习大数据的Python学员，基于已有的Python知识，学习Python大数据，你们拥有巨大的优势。大部分框架使用类Java语言实现，对于Python学员，PySpark是使用Python作为开发语言的程序员的福音，借助PySpark，Python开发人员可以轻松学习大数据。

* 01 课程简介/

* 01 课程简介.mp4 12:11

* 02 Docker知识快速入门/

* 01 什么是Docker技术.mp4 08:21

* 02 为什么要使用Docker.mp4 04:53

* 03 Docker中的基本概念.mp4 05:42

* 04 Docker安装.mp4 04:14

* 05 Docker获取镜像.mp4 08:19

* 06 Docker创建镜像（1）.mp4 09:06

* 07 Docker创建镜像（2）.mp4 10:25

* 08 Docker本地导入镜像.mp4 07:26

* 09 Docker保存、载入、删除镜像.mp4 05:14

* 10 Docker容器的创建启动和停止.mp4 11:19

* 11 Docker命令进入容器后台.mp4 08:59

* 12 Docker命令导入导出和删除容器.mp4 07:46

* 13 Docker公有仓库Docker Hub.mp4 10:26

* 14 Docker私有仓库的创建.mp4 08:36

* 15 Docker中的数据卷.mp4 15:26

* 16 Docker制作数据卷容器.mp4 10:30

* 17 Docker数据卷容器实现备份恢复及迁移.mp4 11:06

* 18 Docker容器绑定外部端口和IP.mp4 11:26

* 19 Docker容器互联.mp4 08:19

* 20 Docker一个完整的例子.mp4 35:10

* 21 Dockerfile基本结构讲解.mp4 08:33

* 22 Dockerfile中常见指令讲解.mp4 21:48

* 03 Docker搭建Spark学习环境，一键部署So easy!/

* 01 Spark课程前言.mp4 16:56

* 02 Spark基础核心概念讲解.mp4 18:59

* 03 镜像制作方案和集群网络规划及子网配置和SSH无密钥登录规.mp4 17:04

* 04 Hadoop、HDFS、Yarn配置文件详解.mp4 18:04

* 05 Spark及Hive配置文件详解.mp4 13:11

* 06 Dockerfile制作Hadoop/Spark/Hive镜.mp4 26:51

* 07 启动5个容器并启动Hadoop、Spark、Hive服务.mp4 38:11

* 04 PySpark基础及运行原理快速入门，细致详尽！/

* 01 pyspark模块介绍.mp4 14:12

* 02 SparkContext编程入口及Accumulator.mp4 17:45

* 03 addFile方法和SparkFiles的get方法.mp4 22:24

* 04 binaryFiles读取二进制文件.mp4 05:02

* 05 Broadcast广播变量和setLogLevel日志级别.mp4 17:05

* 06 文件的读取和保存及runJob方法和parallelize.mp4 23:31

* 07 union方法和statusTracker方法讲解.mp4 07:16

* 08 aggregate和aggregateByKey的异同.mp4 16:48

* 09 collectAsMap和fold方法的理解及正确使用.mp4 16:42

* 10 foreach和foreachPartitions原理.mp4 06:16

* 11 histogram和lookup方法的使用详解.mp4 17:47

* 12 reduce、sampleStdev等方法的使用详解.mp4 16:54

* 13 sequenceFile序列文件的保存和读取.mp4 06:44

* 14 takeSample、treeAggregate方法使用.mp4 17:55

* 15 coalesce、repartition方法使用技巧.mp4 20:41

* 16 cogroup、combineByKey、reduceByK.mp4 17:07

* 17 foldByKey、groupBy、groupWith几个方.mp4 18:14

* 18 集合操作intersection、subtract、unio.mp4 04:39

* 19 join、fullOuterJoin等RDD关联操作.mp4 05:58

* 20 glom、mapPartitions、mapValues等方.mp4 13:20

* 21 pipe、randomSplit、sampleByKey、s.mp4 08:03

* 22 sortBy、sortByKey、values、zip、zi.mp4 09:25

* 23 StorageLevel中常见的存储级别.mp4 04:34

* 24 SparkConf对象详解.mp4 11:04

* 25 广播变量深入讲解.mp4 06:36

* 26 Accumulator累加器详解.mp4 04:05

* 27 StatusTracker Spark作业运行状态监控.mp4 04:49

* 05 pyspark之SparkSQL基础与提升/

* 01 pyspark之SparkSQL模块介绍.mp4 14:29

* 02 SparkSession编程入口.mp4 13:20

* 03 学习创建DataFrame的8种方式.mp4 21:13

* 04 range和udf用户自定义函数讲解.mp4 20:39

* 05 agg聚合方法及数据缓存方法cache的讲解.mp4 21:17

* 06 colRegex及corr计算皮尔森相关系数.mp4 19:57

* 07 crossJoin笛卡尔积和cube多维数据立方体.mp4 18:25

* 08 explain、dropna及filter和where算子详.mp4 19:33

* 09 groupBy、intersect、join方法详解.mp4 19:22

* 10 rollup、replace和randomSplit方法讲解.mp4 18:22

* 11 summary统计方法及toPandas转换为Pandas对.mp4 29:56

* 12 GroupedData 对象.mp4 30:05

* 13 DataFrame中的Column对象(上).mp4 30:24

* 14 DataFrame中的Columns对象（下）.mp4 19:06

* 15 Catalog对象详解.mp4 36:07

* 16 Row对象详解.mp4 05:35

* 17 DataFrameNaFunctions空数据处理方法集合.mp4 12:24

* 18 DataFrameStatFunctions统计模块详解.mp4 11:05

* 19 DataFrameReader读取外部数据生成DF.mp4 20:04

* 20 DataFrameWriter将DF数据写入外部存储.mp4 22:19

* 21 types 类型详解.mp4 15:03

* 22 functions 函数模块详解.mp4 16:06

* 06 PySpark 机器学习模块/

* 01 本地密集、稀疏向量和LabeledPoint向量.mp4 22:55

* 02 本地矩阵和四种分布式矩阵.mp4 32:24

* 03 Statistics基本的统计方法.mp4 20:18

* 04 假设检验、随机数据的生成和核密度估计.mp4 13:23

* 05 Piplines构建机器学习工作流.mp4 43:43

* 06 TF-IDF词频你文档数和Word2vec词向量表示.mp4 27:45

* 07 CountVectorizer和Tokenizer和正则特征.mp4 14:17

* 08 PCA主成分分析、多项式核函数扩展特征空间、数据正则化、特征.mp4 34:13

* 09 分桶器、向量组合器、SQL转换器及元素放缩器.mp4 17:22

* 10 特征个数过滤器、缺失值处理器、类别编码器、向量类别判断器.mp4 21:26

* 11 逻辑回归算法、原理、公式推导及二分类和多分类实践.mp4 28:42

* 12 完全理解L1，L2正则化及其作用.mp4 22:25

* 13 决策树算法原理、随机深林、梯度提升树代码实践.mp4 41:45

* 14 多层感知机分类算法.mp4 13:05

* 15 SVM支持向量机分类算法.mp4 21:41

* 16 OneVsRest多分类算法.mp4 05:37

* 17 Naive Bayes 朴素贝叶斯分类器.mp4 10:03

* 18 Linear Regression线性回归.mp4 24:15

* 19 GLMs广义线性模型.mp4 07:00

* 20 回归树.mp4 11:22

* 21 K-Means聚类算法.mp4 21:06

* 22 二分K均值算法.mp4 06:24

* 23 GMM高斯混合模型.mp4 07:30

* 24 基于ALS交替最小二乘法的协同过滤推荐算法电影推荐实践.mp4 37:14

* 25 FP-Growth频繁项集推荐算法.mp4 14:39

* 26 超参数网格搜索.mp4 21:22

本篇 ¥29.00 · 开通 VIP 更划算

查看价格与购买

相关推荐

小滴课堂新一代AI全栈工程师-微服务AI智能面试对话平台

¥79.00 · 2461 浏览

AI+全能测试工程师

¥95.00 · 3174 浏览

小滴课堂中间件项目大课-自动化云测平台/Spingboot3.X/微服务/Kafka3.x

¥67.00 · 501 浏览

代码源信奥C++

¥19.90 · 2509 浏览

华清远见线上课程（创客学院）嵌入式+物联网

¥20.00 · 2469 浏览

小龙虾OpenClaw+Gemini+GPT+deepseek+Claude+AI绘画PPT数据分析

¥57.00 · 1434 浏览