对于想转行或学习大数据的Python学员,基于已有的Python知识,学习Python大数据,你们拥有巨大的优势。大部分框架使用类Java语言实现,对于Python学员,PySpark是使用Python作为开发语言的程序员的福音,借助PySpark,Python开发人员可以轻松学习大数据。
* 01 课程简介/
* 01 课程简介.mp4 12:11
* 02 Docker知识快速入门/
* 01 什么是Docker技术.mp4 08:21
* 02 为什么要使用Docker.mp4 04:53
* 03 Docker中的基本概念.mp4 05:42
* 04 Docker安装.mp4 04:14
* 05 Docker获取镜像.mp4 08:19
* 06 Docker创建镜像(1).mp4 09:06
* 07 Docker创建镜像(2).mp4 10:25
* 08 Docker本地导入镜像.mp4 07:26
* 09 Docker保存、载入、删除镜像.mp4 05:14
* 10 Docker容器的创建启动和停止.mp4 11:19
* 11 Docker命令进入容器后台.mp4 08:59
* 12 Docker命令导入导出和删除容器.mp4 07:46
* 13 Docker公有仓库Docker Hub.mp4 10:26
* 14 Docker私有仓库的创建.mp4 08:36
* 15 Docker中的数据卷.mp4 15:26
* 16 Docker制作数据卷容器.mp4 10:30
* 17 Docker数据卷容器实现备份恢复及迁移.mp4 11:06
* 18 Docker容器绑定外部端口和IP.mp4 11:26
* 19 Docker容器互联.mp4 08:19
* 20 Docker一个完整的例子.mp4 35:10
* 21 Dockerfile基本结构讲解.mp4 08:33
* 22 Dockerfile中常见指令讲解.mp4 21:48
* 03 Docker搭建Spark学习环境,一键部署So easy!/
* 01 Spark课程前言.mp4 16:56
* 02 Spark基础核心概念讲解.mp4 18:59
* 03 镜像制作方案和集群网络规划及子网配置和SSH无密钥登录规.mp4 17:04
* 04 Hadoop、HDFS、Yarn配置文件详解.mp4 18:04
* 05 Spark及Hive配置文件详解.mp4 13:11
* 06 Dockerfile制作Hadoop/Spark/Hive镜.mp4 26:51
* 07 启动5个容器并启动Hadoop、Spark、Hive服务.mp4 38:11
* 04 PySpark基础及运行原理快速入门,细致详尽!/
* 01 pyspark模块介绍.mp4 14:12
* 02 SparkContext编程入口及Accumulator.mp4 17:45
* 03 addFile方法和SparkFiles的get方法.mp4 22:24
* 04 binaryFiles读取二进制文件.mp4 05:02
* 05 Broadcast广播变量和setLogLevel日志级别.mp4 17:05
* 06 文件的读取和保存及runJob方法和parallelize.mp4 23:31
* 07 union方法和statusTracker方法讲解.mp4 07:16
* 08 aggregate和aggregateByKey的异同.mp4 16:48
* 09 collectAsMap和fold方法的理解及正确使用.mp4 16:42
* 10 foreach和foreachPartitions原理.mp4 06:16
* 11 histogram和lookup方法的使用详解.mp4 17:47
* 12 reduce、sampleStdev等方法的使用详解.mp4 16:54
* 13 sequenceFile序列文件的保存和读取.mp4 06:44
* 14 takeSample、treeAggregate方法使用.mp4 17:55
* 15 coalesce、repartition方法使用技巧.mp4 20:41
* 16 cogroup、combineByKey、reduceByK.mp4 17:07
* 17 foldByKey、groupBy、groupWith几个方.mp4 18:14
* 18 集合操作intersection、subtract、unio.mp4 04:39
* 19 join、fullOuterJoin等RDD关联操作.mp4 05:58
* 20 glom、mapPartitions、mapValues等方.mp4 13:20
* 21 pipe、randomSplit、sampleByKey、s.mp4 08:03
* 22 sortBy、sortByKey、values、zip、zi.mp4 09:25
* 23 StorageLevel中常见的存储级别.mp4 04:34
* 24 SparkConf对象详解.mp4 11:04
* 25 广播变量深入讲解.mp4 06:36
* 26 Accumulator累加器详解.mp4 04:05
* 27 StatusTracker Spark作业运行状态监控.mp4 04:49
* 05 pyspark之SparkSQL基础与提升/
* 01 pyspark之SparkSQL模块介绍.mp4 14:29
* 02 SparkSession编程入口.mp4 13:20
* 03 学习创建DataFrame的8种方式.mp4 21:13
* 04 range和udf用户自定义函数讲解.mp4 20:39
* 05 agg聚合方法及数据缓存方法cache的讲解.mp4 21:17
* 06 colRegex及corr计算皮尔森相关系数.mp4 19:57
* 07 crossJoin笛卡尔积和cube多维数据立方体.mp4 18:25
* 08 explain、dropna及filter和where算子详.mp4 19:33
* 09 groupBy、intersect、join方法详解.mp4 19:22
* 10 rollup、replace和randomSplit方法讲解.mp4 18:22
* 11 summary统计方法及toPandas转换为Pandas对.mp4 29:56
* 12 GroupedData 对象.mp4 30:05
* 13 DataFrame中的Column对象(上).mp4 30:24
* 14 DataFrame中的Columns对象(下).mp4 19:06
* 15 Catalog对象详解.mp4 36:07
* 16 Row对象详解.mp4 05:35
* 17 DataFrameNaFunctions空数据处理方法集合.mp4 12:24
* 18 DataFrameStatFunctions统计模块详解.mp4 11:05
* 19 DataFrameReader读取外部数据生成DF.mp4 20:04
* 20 DataFrameWriter将DF数据写入外部存储.mp4 22:19
* 21 types 类型详解.mp4 15:03
* 22 functions 函数模块详解.mp4 16:06
* 06 PySpark 机器学习模块/
* 01 本地密集、稀疏向量和LabeledPoint向量.mp4 22:55
* 02 本地矩阵和四种分布式矩阵.mp4 32:24
* 03 Statistics基本的统计方法.mp4 20:18
* 04 假设检验、随机数据的生成和核密度估计.mp4 13:23
* 05 Piplines构建机器学习工作流.mp4 43:43
* 06 TF-IDF词频你文档数和Word2vec词向量表示.mp4 27:45
* 07 CountVectorizer和Tokenizer和正则特征.mp4 14:17
* 08 PCA主成分分析、多项式核函数扩展特征空间、数据正则化、特征.mp4 34:13
* 09 分桶器、向量组合器、SQL转换器及元素放缩器.mp4 17:22
* 10 特征个数过滤器、缺失值处理器、类别编码器、向量类别判断器.mp4 21:26
* 11 逻辑回归算法、原理、公式推导及二分类和多分类实践.mp4 28:42
* 12 完全理解L1,L2正则化及其作用.mp4 22:25
* 13 决策树算法原理、随机深林、梯度提升树代码实践.mp4 41:45
* 14 多层感知机分类算法.mp4 13:05
* 15 SVM支持向量机分类算法.mp4 21:41
* 16 OneVsRest多分类算法.mp4 05:37
* 17 Naive Bayes 朴素贝叶斯分类器.mp4 10:03
* 18 Linear Regression线性回归.mp4 24:15
* 19 GLMs广义线性模型.mp4 07:00
* 20 回归树.mp4 11:22
* 21 K-Means聚类算法.mp4 21:06
* 22 二分K均值算法.mp4 06:24
* 23 GMM高斯混合模型.mp4 07:30
* 24 基于ALS交替最小二乘法的协同过滤推荐算法电影推荐实践.mp4 37:14
* 25 FP-Growth频繁项集推荐算法.mp4 14:39
* 26 超参数网格搜索.mp4 21:22





![[衡天云]爆款云服务器 低至12元/月](/hty.png)