为帮助梦想进入数据开发行业的零基础学员,大数据学科现引入Python语言,课程全新升级为Python大数据开发。
* 阶段一 Python编程/
* 第一章 Python基础编程/
* 学习软件使用/
* 01-(了解)Winrar压缩软件介绍与使用
* 02-(重点)Typora笔记软件
* 03-(重点)Snipaste截图软件使用
* 04-(重点)Xmind思维导图软件
* 05-(可选)金山打字通
* 06-(可选)Everything搜索软件
* Python概述/
* 07-(了解)学习目标
* 08-(了解)为什么要学习Python
* 09-(了解)Python语言概述
* 10-(重点)Python解析器安装与配置
* PyCharm使用入门/
* 11-(重点)PyCharm软件安装项目创建以及代码编写
* 12-(回顾)上午知识点小结
* 13-(重点)PyCharm开发工具配置
* 14-(重点)PyCharm项目管理
* 15-(重点)Python中的注释
* 16-(重点)PyCharm中注释快捷键
* Python变量与注释/
* 17-(重点)变量的定义与访问
* 18-(重点)变量的命名规则
* 19-(建议)推荐的命名规则
* 20-(答疑)变量与字符串区别
* 21-(重点)Python中变量的数据类型
* Pycharm中Debug使用/
* 22-(重点)Python中的Bug解决
* 23-(重点)Debug调试工具使用
* 24-交作业流程
* Python格式化输出/
* 01-(回顾)昨日回顾
* 02-(重点)百分号形式的格式化输出
* 03-(重点)百分号形式格式化输出时在输出一个百分号
* 04-(重点)format()方法实现格式化输出
* 05-(重点)f简写形式的格式化输出
* 06-(重点)print()中的换行符号
* 07-(重点)input()输入方法详解
* Python运算符/
* 08-(了解)学习目标
* 09-(案例)两个变量值的交换
* 10-(引入)为什么需要类型转换
* 11-(回顾)上午知识点小结
* 12-(重点)4种数据类型转换方法
* 13-(重点)算数运算符
* 14-(案例)求梯形的面积
* 15-(重点)赋值运算符
* 16-(重点)复合赋值运算符
* 17-(重点)比较运算符
* 18-(重点)逻辑与或非
* 19-(扩展)短路运算
* 20-(理解)运算符的优先级
* Python分支语句/
* 21-(重点)if中的选择结构
* 22-(重点)if条件判断与input()输入语句相结合
* 23-(重点)if...else结构
* 24-(作业)今日作业
* 01-(回顾)昨日回顾
* 02-(扩展)Visio绘制流程图
* 03-(扩展)if...else结构流程图
* 04-(重点)if...elif...else多分支结构
* 05-(难点)if嵌套结构
* 06-(小结)if分支结构
* Python分支语句综合案例/
* 07-(重点)猜拳游戏开发(上)
* 08-(重点)随机模块与随机数概念
* 09-(重点)三目运算符
* while循环/
* 10-(重点)while循环作用与while循环三步走
* 11-(回顾)上午知识点小结
* 12-(理解)while循环执行流程
* 13-(案例)求1-100的累加和
* 14-(案例)求1-100之间所有偶数的和
* 15-(答疑)while循环中常见问题
* 16-(重点)循环中的break与continue
* 17-(理解)死循环结构
* while循环案例/
* 18-(案例)猜数字
* 19-(案例)猜数字升级版
* for循环/
* 20-(了解)for循环学习目标
* 21-(重点)for循环基本语法与应用场景
* 22-(重点)range()函数
* 23-(重点)使用for循环求1-100的和
* 24-(重点)使用for循环求1-100之间所有偶数的和
* 01-(回顾)昨日回顾
* 02-(重点)for循环中的break与continue关键字
* for循环案例/
* 03-(重点)使用for循环实现用户名与密码登录认证
* 04-(重点)使用for循环实现用户名密码认证案例
* 05-(重点)for循环中的else语句
* 06-(案例)报数字游戏开发
* 字符串定义及切片/
* 07-(了解)数据容器学习目标
* 08-(回顾)字符串的定义与访问
* 09-(重点)索引下标与字符串遍历
* 10-(回顾)上午知识点小结
* 11-(重点中重点)字符串切片
* 12-(补充)步长为某个数值的情况
* 字符串查找、替换、合并/
* 13-(重点)find()搜索方法
* 14-(案例)文件截取
* 15-(重点)字符串修改方法
* 16-(重点)字符串判断方法
* 17-(小结)字符串常见操作方法
* 列表定义及使用/
* 18-(重点)列表的定义与访问
* 19-(重点)列表的查询操作
* 20-(重点)列表的增加方法
* 21-(重点)列表的删除方法
* 22-(重点)列表的修改方法
* 23-(重点)列表的翻转与排序
* 24-(了解)列表嵌套
* 01-(回顾)昨日回顾
* 元组定义及使用/
* 02-(重点)元组的定义与访问
* 03-(重点)元组特性与相关查询方法
* 字典定义及使用/
* 04-(了解)数据容器学习目标
* 05-(重点)字典的定义与访问过程
* 06-(重点)字典的新增与修改操作
* 07-(重点)字典的删除操作
* 08-(重点)字典中的查询方法
* 09-(扩展)学生管理系统的添加与删除功能
* 10-(回顾)上午知识点小结
* 集合定义及使用/
* 11-(重点)集合的定义与访问
* 12-(重点)集合中的相关方法
* 公共方法与列表推导式/
* 13-(重点)数据容器的公共方法(上)
* 14-(重点)数据容器的公共方法(下)
* 15-(重点)数据容器的相互转换
* 16-(扩展)列表推导式
* 函数基本使用/
* 17-(了解)Python中函数的学习目标
* 18-(重点)函数的定义与调用
* 19-(重点)函数的return返回值
* 01-(回顾)昨日回顾
* 02-(重点)Python中函数的由来
* 03-(重点)聊聊return返回值
* 04-(重点)函数说明文档
* 函数嵌套/
* 05-(理解)函数嵌套语法与执行流程
* 06-(流程)一个案例深入理解函数嵌套执行流程
* 函数案例/
* 07-(案例)封装一个函数求三个数的平均值
* 08-(案例)封装一个函数实现字符串翻转与替换
* 09-(案例)生成4位长度的随机验证码(上)
* 10-(回顾)上午知识点小结
* 11-(案例)生成4位长度的随机验证码(下)
* 12-(扩展)生成指定长度的验证码
* 变量作用域/
* 13-(重点)全局变量与全局变量的访问范围
* 14-(重点)局部变量与局部变量的访问范围
* 15-(重点)global关键字
* 函数传参/
* 16-(理解)实参与形参概念
* 17-(重点)位置传参与关键词传参
* 18-(重点)函数定义时的缺省参数
* 19-(重点中重点)不定长参数
* 20-(重点中重点)不定长参数应用场景
* 21-(特殊)参数混用的情况
* 可变类型和不可变类型/
* 22-(理解)理解哪些数据类型属于不可变类型
* 01-(回顾)昨日回顾
* 02-(重点理解)不可变数据类型
* 03-(重点)可变数据类型
* 04-(案例)可变与不可变对函数传参的影响
* 05-(重点)元组拆包
* 文件基本操作/
* 06-(了解)文件操作学习目标
* 07-(重点)文件基本概念
* 08-(重点)文件操作三步走
* 09-(重点)解决中文乱码问题
* 10-(重点)文件读取的三个方法
* 11-(回顾)昨日回顾
* 12-(案例)文件备份案例(上)
* 13-(案例)文件备份案例(下)
* 文件操作案例/
* 14-(重点)os重命名与删除文件
* 15-(重点)os模块中与文件夹相关方法
* 16-(理解)普及路径概念
* 17-(扩展)删除非空目录
* 异常处理/
* 18-(重点)异常与异常捕获
* 19-(重点)捕获异常并获取异常信息
* 20-(重点)try...except...else结构
* 21-(重点)try...except...else...finally语句
* 模块与包/
* 22-(重点)模块的两种导入方式
* 23-(重点)求一个程序的执行时间
* 01-(回顾)昨日回顾
* 02-(扩展)创建自定义模块并导入系统
* 03-(理解)自定义模块测试方法
* 04-(理解)探讨一下__name__到底返回结果是什么?
* 学生管理系统/
* 05-(重点)理解学生管理系统需求
* 06-(案例)实现系统功能菜单
* 07-(案例)根据用户编号执行对应的功能
* 08-(案例)添加功能实现
* 09-(案例)删除功能实现
* 10-(小结)上午知识点小结
* 11-(案例)修改功能实现
* 12-(案例)查询功能实现
* 13-(案例)遍历查询操作
* 14-(案例)保存数据到文件
* 15-(案例)加载文件中数据到系统
* 总结回顾/
* 16-(复习)注释变量与数据类型
* 17-(复习)类型转换运算符以及if分支结构
* 18-(复习)Python中的循环结构
* 19-(复习)Python函数
* 第二章 Python面向对象/
* 类定义/
* 01-(了解)学习目标
* 02-(理解)面向过程与面向对象设计思想
* 03-(重点)面向对象编程思想
* 04-(重点)类的定义(新式类)
* 05-(重点)类的实例化(产生对象)
* 06-(重点)self到底指向谁
* 类属性/
* 07-(重点)在类的外部添加与获取对象属性
* 08-(重点)在类的内部获取类外部定义的属性
* 09-(回顾)上午知识点小结
* 魔法方法/
* 10-(问题)为什么需要魔术方法?
* 11-(重点)__init__()魔术方法的使用
* 12-(重点)为对象赋予公共属性
* 13-(重点)__str__()魔术方法
* 14-(重点)__del__()魔术方法
* 15-(小结)魔术方法小结
* 16-(理解)面向对象程序执行流程
* 面向对象案例/
* 17-(案例)学生成绩打印
* 18-(案例)小明爱跑步
* 19-(重点)属性的封装(私有属性)
* 20-(重点)如何获取课程资料与提交作业
* 01-(回顾)昨日回顾
* 面向对象课堂作业/
* 02-(作业)高级题目4答案
* 03-(答疑)删除对象时顺序问题
* 04-(作业)搬家具案例(上)
* 04-(作业)搬家具案例(中)
* 05-(作业)搬家具案例(下)
* 封装与继承/
* 06-(重点)封装性之私有属性的概念
* 07-(重点)封装性之私有方法
* 08-(回顾)上午知识点小结
* 09-(重点)Python中继承基本语法
* 10-(重点)单继承
* 11-(重点)单继承传递性(多层继承)
* 12-(理解)多继承概念
* 13-(重点)使用mro了解类与类的继承关系
* 14-(重点)子类扩展之重写操作
* 15-(重点)super()方法强制调用父类中属性或方法
* 多态/
* 16-(了解)Python中的多态性
* 17-(了解)Python中多态案例
* 类属性方法/
* 18-(重点)类属性概念
* 19-(重点)类方法概念
* 20-(重点)静态方法
* 21-(作业)今日作业安排
* 01-(回顾)昨日回顾
* 面向对象版-学生管理系统/
* 02-(案例)学生类开发流程
* 03-(案例)入口文件实现
* 04-(案例)功能菜单之静态方法实现
* 05-(案例)学员添加功能实现
* 06-(案例)遍历所有学员功能实现
* 07-(案例)移除同学信息实现
* 08-(案例)修改学员信息实现
* 09-(案例)查找学员功能实现
* 10-(回顾)上午知识点小结
* 11-(案例)保存数据到文件(遗留了问题)
* 12-(案例)数据保存到文件完整版
* 13-(补充)数据保存补充
* 14-(案例)加载文件中的数据到系统
* 第三章 Python进阶编程/
* 闭包/
* 15-(了解)学习目标
* 16-(回顾)全局变量与局部变量概念
* 17-(理解)局部变量与局部变量访问范围
* 18-(理解)闭包三步走
* 19-(答疑)闭包执行原理
* 20-(重点)global关键字与nonlocal关键字
* 21-(案例)闭包案例
* 装饰器/
* 22-(重点)装饰器三步走
* 23-(案例)使用装饰器求程序执行时间
* 01-(回顾)昨日回顾
* 02-(重点)装饰器的基本语法
* 03-(理解)装饰器的执行原理
* 04-(理解)装饰器的雏形(底层原理)
* 05-(案例)求执行时间装饰器
* 06-(重点)使用装饰器装饰带有参数的函数
* 07-(重点)使用装饰器装饰带有不定长参数的函数
* 08-(重点)使用装饰器装饰带有返回值的函数
* 09-(重点)通用装饰器的编写
* 10-(扩展)带有参数的装饰器
* 11-(了解)类装饰器
* 前端环境安装/
* 12-(回顾)上午知识点小结
* 13-(了解)HTML与CSS学习目标
* 14-(了解)HTML概念与作用
* 15-(重点)VS Code软件安装与配置
* 16-(重点)VS Code编辑器配置
* HTML基础/
* 17-(重点)标题段落与div结构标签(双标签)
* 18-(重点)有序列表与无序列表
* 19-(重点)换行水平线以及图片标签(单标签)
* 20-(理解)绝对路径与相对路径
* 21-(重点)表格标签(适合做数据展示)
* 22-(重点)表单标签
* 23-(重点)表单提交
* CSS基础/
* 24-(重点)CSS概述与三种引入方式
* 01-(回顾)昨日回顾
* 02-(重点)常用三种选择器(标签ID以及类选择器)
* 03-(重点)层级选择器
* 04-(重点)组选择器
* 05-(重点)伪类选择器
* 06-(小结)6种选择器总结
* 07-(重点)布局属性
* 08-(重点)文本属性
* Socket网络编程/
* 09-(了解)学习目标
* 10-(理解)IP地址概念
* 11-(理解)端口与端口号概念
* 12-(回顾)上午知识点小结
* 13-(理解)端口号作用与分类
* 14-(理解)TCP传输控制协议
* 15-(理解)socket套接字工具
* TCP服务器开发流程/
* 16-(重点)TCP客户端开发五步走与服务器开发七步走
* 17-(重点)TCP客户端开发五步走代码实践
* 18-(难点)TCP服务器端开发七步走之前四步
* 19-(答疑)常见问题汇总
* 20-(重点)TCP服务器端开发七步走
* 21-(重点)TCP服务器端面向对象版本封装
* TCP服务器细节处理/
* 22-(答疑)常见问题回复
* 01-(回顾)昨日回顾
* 02-(重点)程序入口与端口复用
* 03-(理解)TCP网络应用程序开发注意事项
* 04-(扩展)Python代码如何操作飞Q软件
* 进程/
* 05-(了解)进程学习目标
* 06-(理解)多任务的概念
* 07-(理解)进程概念
* 08-(重点)使用多进程完成多任务
* 09-(小结)小结与答疑
* 10-(重点)使用多进程实现带有参数的多任务
* 11-(重点)获取主进程编号与子进程编号
* 12-(回顾)上午知识点小结
* 13-(重点)使用os.kill()方法杀掉进程
* 14-(注意点)多进程之间无法共享全局变量
* 15-(注意点)主进程与子进程结束顺序问题
* 16-(小结)注意点小结
* 线程/
* 17-(了解)线程学习目标
* 18-(理解)线程与进程区别和线程概念
* 19-(重点)使用多线程实现多任务(并发)
* 20-(重点)使用args与kwargs进行参数传递
* 21-(注意点)多线程之间共享全局变量
* 22-(注意点)主线程默认会等待子线程结束而结束
* 23-(注意点)线程之间的执行是无序的
* 24-(对比)进程与线程区别
* 25-(案例)多任务版本的TCP服务器端
* 01-(回顾)昨日回顾
* HTTP协议/
* 02-(了解)学习目标
* 03-(理解)HTTP协议概念
* 04-(理解)URL及URL组成
* 05-(重点)开发者工具使用
* 06-(重点理解)GET请求报文三部分
* 07-(重点)HTTP请求报文
* 08-(重点)HTTP响应报文
* 静态Web服务器/
* 09-(重点)使用Python搭建简单Web服务器
* 10-(重点)静态Web服务器开发
* 11-(回顾)上午知识点小结
* 12-(答疑)常见错误汇总
* 13-(重点)静态Web服务器开发之返回指定页面(上)
* 14-(重点)静态Web服务器开发之返回指定页面(中)
* 15-(重点)静态Web服务器开发返回指定页面(下)
* 16-(答疑)解决直接访问首页问题
* 17-(重点)解决访问页面不存在问题
* 18-(答疑)为什么要给文字添加编码
* 19-(重点)完整版Web服务器开发
* 20-(重点)FastAPI框架快速入门
* With上下文管理器/
* 01-(了解)学习目标
* 02-(重点)为什么要引入with上下文管理器
* 03-(重点)with上下文管理器
* 04-(重点)生成器的创建方式一
* Python生成器/
* 05-(重点)yield生成器
* 06-(理解)使用yield生成器生成斐波那契数列
* 07-(重点)生成器多种写法
* 08-(回顾)变量引用以及可变和不可变数据类型
* Python深浅拷贝/
* 09-(重点)Python中的浅拷贝
* 10-(重点)Python浅拷贝笔试题
* 11-(重点)Python中的深拷贝
* 12-(重点)Python中深拷贝特殊情况
* 正则表达式/
* 13-(重点)正则概述与快速入门
* 14-(重点)正则三步走之查什么
* 15-(重点)正则三步走之查多少
* 16-(重点)正则三步走之从哪查
* 17-(扩展)正则工具箱
* 正则表达式案例/
* 01-(回顾)昨日回顾
* 02-(分组)正则分组概念
* 03-(案例)分组练习题5则
* 04-(扩展)正则中的选择匹配符
* 05-(重点)re模块中的相关方法
* 06-(扩展)正则表达式起别名
* 07-(案例)正则综合案例二则
* 08-(案例)正则综合案例二则
* FastAPI搭建Web服务器/
* 09-(了解)学习目标
* 10-(重点)Web服务器搭建
* 11-(回顾)上午知识点小结
* 12-(重点)FastAPI图片请求通用配置
* 13-(答疑)FastAPI如何接收请求与处理请求
* 14-(重点)处理html页面请求
* Python爬虫/
* 15-(入门)爬虫概述与requests模块入门
* 16-(重点)使用爬虫爬取页面的图片url地址
* 17-(重点)根据爬虫爬取的图片地址保存数据
* 18-(重点)zip()函数的使用
* 19-(重点)GDP数据采集过程
* 20-(扩展)Xpath技术扩展(慎用)
* 01-(回顾)昨日回顾(上)
* 02-(回顾)昨日回顾(中)
* 03-(回顾)昨日回顾(下)
* 04-(重点)多任务实现爬虫
* 数据可视化/
* 05-(重点)pyecharts安装与快速入门
* 06-(重点)pyecharts新版链式操作
* 07-(重点)Faker随机类
* 08-(重点)pyecharts配置项说明
* 09-(重点)全球GDP前十名数据可视化
* 日志/
* 10-(重点)logging日志模块与日志格式化输出
* 11-(回顾)上午知识点小结
* 12-(重点)输出日志写入到文件
* 13-(重点)在Web项目中整合logging日志
* 下阶段课程准备/
* 14-(重点)MySQL8.0软件安装
* 15-(重点)DataGrip软件安装与配置
* python进阶课程回顾/
* 16-(回顾)面向对象基础
* 17-(回顾)面向对象三大特性
* 18-(回顾)面向对象其他特性
* 19-(回顾)闭包与装饰器
* 20-(补充)装饰器的补充
* 21-(重点)TCP套接字编程
* 22-(重点)Python中多任务编程
* 23-(重点)Python高级与正则表达式
* 01-(回顾)昨日回顾
* 阶段作业 Python大数据开发基础-第1套试卷/
* 试卷
* 阶段二 SQL(SQL+Kettle+FineBI)/
* 第一章 SQL/
* 阶段学习反馈/
* 【Python编程】阶段学习反馈
* 数据库基础/
* 02-(了解)MySQL基础学习目标
* 03-(了解)数据库介绍
* 04-(掌握)MySQL概述与软件下载
* 05-(了解)MySQL8.0下载
* 06-(了解)Windows版本MySQL安装
* 07-(重点)小皮面板与DataGrip软件安装与连接操作
* 08-(重点)DataGrip软件配置
* DDL/
* 09-(理解)SQL语言概述与SQL通用写法
* 10-(重点)DDL之数据库管理
* 11-(重点)DDL之数据表创建过程
* 12-(案例)数据表创建案例
* 13-(重点)DDL之数据表查看
* 14-(答疑)反撇号与引号区别
* 15-(重点)DDL之数据表修改(字段添加)
* 16-(重点)DDL之数据表修改(字段名称与类型修改)
* 17-(重点)DDL之数据表修改(字段删除)
* 18-(重点)DDL之数据表修改(数据表重命名)
* 19-(重点)DDL之数据表删除
* 20-(小结)数据表的增删改查
* DML/
* 21-(重点)数值类型(整数与浮点类型)
* 22-(重点)日期时间与文本类型
* 01-(回顾)昨日回顾
* 02-(重点)DML之数据插入操作
* 03-(重点)DML之数据更新操作
* 04-(重点)DML之数据删除操作
* SQL约束/
* 05-(重点)五大约束之主键约束
* 06-(重点)主键约束的添加与删除操作
* 07-(扩展)自动增长序列
* 08-(补充)如何移除带有自动增长的主键
* 09-(重点)五大约束之非空约束
* 10-(重点)五大约束之唯一约束
* 11-(回顾)上午知识点小结
* 12-(重点)五大约束之默认值约束
* 13-(重点)五大约束之外键约束
* 14-(小结)五大约束
* SQL条件查询/
* 15-(重点)简单查询
* 16-(重点)五子句之where子句与比较查询
* 17-(重点)五子句之where子句与范围查询
* 18-(重点)五子句之where子句与逻辑查询
* 19-(重点)五子句之where模糊查询
* 20-(重点)五子句之where非空查询
* SQL聚合函数/
* 21-(重点)聚合函数
* 22-(理解)聚合函数不统计空值
* 23-(重点)五子句之group by分组子句
* 24-(扩展)回溯统计
* 25-(重点)五子句之having子句
* 01-(回顾)昨日回顾
* 02-(重点)五子句之order by排序子句
* 03-(重点)五子句之limit子句限制查询数量
* 04-(重点)五子句之limit分页查询子句
* 05-(小结)五子句查询小结
* 06-(重点)distinct针对某列进行去重操作
* SQL多表查询/
* 07-(数据)多表数据集准备
* 08-(理解)多表查询之交叉连接查询
* 09-(重点)多表查询之内连接查询
* 10-(重点)多表查询之书写规则
* 11-(回顾)上午知识点小结
* 12-(重点)多表查询之内连接查询的另外一种写法
* 13-(重点)多表查询之外连接查询
* 14-(小结)内连接查询与外连接查询区别
* 15-(了解)自连接查询与数据集准备
* 16-(重点)多表查询之自连接查询代码实现
* SQL外键约束/
* 17-(理解)表与表之间关系
* 18-(扩展)外键约束
* 19-(扩展)引擎概念与外键关系
* SQL子查询/
* 20-(重点)子查询概念与案例演示
* 21-(重点)子查询案例2
* 22-(重点)子查询案例3
* 01-(回顾)昨日回顾
* 窗口函数/
* 02-(重点)窗口函数学习目标
* 03-(重点)窗口函数概述
* 04-(案例)聚合函数与窗口函数比较
* 05-(重点)数据集准备
* 06-(重点)窗口函数基本语法与使用案例
* 07-(重点)窗口函数案例
* 08-(重点)窗口函数案例
* 09-(重点)把over()计算结果进行进一步计算
* 10-(重点)窗口函数基本概念
* 11-(理解)数据集介绍
* 12-(重点)rank()排名函数
* 13-(重点)dense_rank()排名函数
* 14-(重点)row_number()排名函数
* 第二章 Kettle/
* Kettle入门/
* 15-(回顾)上午知识点小结
* 16-(了解)可视化ETL工具之Kettle
* 17-(重点)JDK环境配置
* 18-(重点)Kettle软件安装与启动
* 19-(重点)Kettle快速入门
* 20-(重点)程序小姐姐的烦恼(上)
* 21-(重点)程序小姐姐的烦恼(下)
* Kettle使用/
* 22-(重点)数据库连接共享
* 23-(重点)抽取MySQL数据装载到MySQL数据库中
* 01-(回顾)昨日回顾
* 02-(重点)数据表转换加载到数据表中
* 03-(重点)插入更新组件
* 04-(问题)常见问题汇总
* 05-(重点)switch-case组件
* 06-(重点)SQL脚本组件
* 07-(重点)执行带有参数的SQL脚本
* 08-(重点)Job计划任务
* 第三章 FineBI/
* FineBI/
* 09-(了解)BI系统概述
* 10-(了解)FineBI概述
* 11-(重点)FineBI安装以及试用
* 12-(回顾)上午知识点小结
* FineBI综合案例/
* 13-(重点)各学科学员数量分析
* 14-(重点)某集团各省份销售额与利润额分析
* 15-(案例)数据集准备(宽表来源)
* 16-(案例)每月销售额与毛利额信息展现
* 17-(案例)销售额环比数据与毛利额环比数据分析
* 18-(案例)全国各省份城市毛利率
* 19-(案例)全国各门店毛利率
* 20-(案例)全国各门店商品类别销售情况分析
* 21-(案例)全国各门店商品销售额与毛利率象限图
* 阶段学习反馈/
* 【SQL基础】阶段学习反馈
* 阶段作业 SQL基础(SQL+Kettle+FineBI)-第2套试卷/
* 试卷
* 阶段三 ETL实战/
* 第一章 ETL/
* ETL入门/
* 01-ETL的引出
* 02-常见数据格式-CSV
* 03-常见数据格式-JSON
* 04-常见数据格式-XML
* 05-结构化-半结构化-非结构化数据类型
* 06-ETL案例的采集需求
* 07-JSON数据的处理思路和元数据管理概念
* 08-关于MySQL在项目中的使用方式
* (补充)etl-项目搭建-配置文件作用
* (补充)etl-项目搭建工具类与单元测试类说明
* logging日志处理模块/
* 09-上午内容回顾-logging的基本使用
* 10-编写Logging工具方法
* 11-编写配置文件
* 12-编写单元测试
* 数据文件读取模块/
* 13-编写文件工具-完成递归查找文件夹内的文件
* 14-编写文件工具的单元测试
* 15-代码逻辑回顾
* 01-昨日内容简单回顾
* 02-优化代码-增加json数据文件夹的配置项
* 数据库数据存储模块/
* 03-创建mysql_util代码文件-演示pymysql的自动提交功能
* 04-编写mysql_util的功能代码
* 05-[补充]路径表示符的写法以及类的概念回顾
* 06-对mysql_util进行单元测试
* 数据文件搜索及核对/
* 07-编写从mysql中查询已经处理过的文件的工具方法
* 08-编写对比list,找出没有被处理的文件的工具方法
* 09-调用对比方法,找出可以被处理的文件
* 订单模型构建/
* 10-[拓展]使用模型来封装数据的方式
* 11-构建订单数据的基础模型
* 01-前两天代码的梳理
* 02-在模型中构建to_csv的方法
* 时间转化/
* 03-[扩展]-时间戳和常用转换的代码
* 04-构建时间戳转换的工具方法并单元测试
* 订单数据处理/
* 05-构建字符串工具检查空内容并将model数据的无意义省市区转换成未知省市区
* 06-构建模型中将数据组合成插入SQL语句的功能
* 订单详情数据处理/
* 07-构建订单详情(带商品信息)的模型代码
* 08-编写主逻辑代码完成CSV备份文件的写出
* 09-今日的内容快速回顾
* 订单数据入库/
* 01-对MySQLUtil进行改动让其支持更换数据库进行连接
* 02-将数据插入MySQL-1
* 03-将数据插入MySQL-2
* 04-将已经处理完成的数据记录到元数据库中
* 条形码数据采集/
* 05-需求2采集MySQL数据-前期准备
* 06-需求2前期准备-判断数据源表和目的地表是否存在
* 07-需求2从数据源中查询出数据
* 条形码数据写出/
* 08-需求2-构建barcode模型代码
* 09-需求2-将模型写出到MySQL和CSV
* 10-今日主业务代码回顾
* 11-[扩展]alt-shift快捷键演示
* 后台日志处理/
* 01-昨日内容简单回顾
* 02-需求3的需求分析
* 03-需求3快速实现演示
* 项目回顾/
* 04-上午内容需求3代码回顾
* 05-主业务逻辑代码的梳理回顾
* FineBI数据报表/
* 06-FineBI前期准备数据仪表板
* 07-FineBI-每日销售额走势图表构建
* 08-FineBI-热销商品词云图表构建
* 09-构建后台日志分析仪表板
* 阶段作业 Python进阶编程-第1套试卷/
* 试卷
* 阶段四 Hadoop技术栈/
* 第一章 Linux/
* 计算机操作系统/
* 00_课程内容大纲和学习目标
* 01--计算机原理与操作系统概述
* 02--Linux操作系统的发展与概述
* Vmware虚拟机安装与使用/
* 03--VMware虚拟机--虚拟设备与NAT网络模式
* 扩展1--VMware软件安装
* 04--VMware虚拟机--NAT模式安装Centos详解
* 05--VMware虚拟机--SSH协议原理与CRT软件的使用
* 06--VMware虚拟机--Linux上传下载文件--sftp、lrzsz
* Linux常用基础命令/
* 07--Linux常用基础命令--文件系统概述、特殊符号
* 08--Linux常用基础命令--常用操作命令--上
* 09--Linux常用基础命令--常用操作命令--下
* 10--Linux常用基础命令--搜索操作、软链接
* 11--Linux常用基础命令--打包解包、压缩解压缩
* 文本编辑器使用/
* 12--vim编辑器--概述与3种工作模式
* 13--vim编辑器--常用的命令使用
* 14--notepad++ FTP插件使用、finalshell(扩展)
* 用户与权限/
* 00--课程内容回顾总结
* 01--今日课程内容大纲和学习目标
* 02--Linux用户与权限--用户与组概念、权限概念
* 03--Linux用户与权限--用户与组的管理
* 04--Linux用户与权限--su、sudo权限
* 05--Linux用户与权限--权限相关管理命令
* 06--Linux系统信息查看--时间、内存磁盘、进程
* 大数据集群环境搭建/
* 07--大数据集群环境搭建--分布式与集群概念初识
* 08--大数据集群环境搭建--主从架构、主备架构概念
* 09--大数据集群环境搭建--虚拟机克隆、主机名和IP修改
* 10--大数据集群环境搭建--hosts映射修改
* 11--大数据集群环境搭建--防火墙关闭
* 12--大数据集群环境搭建--集群时间同步
* 13--大数据集群环境搭建--ssh免密登录
* 14--大数据集群环境搭建--scp远程拷贝
* Linux软件安装/
* 15--Linux软件安装--rpm包管理器与常用命令
* 16--Linux软件安装--MySQL的rpm安装详解
* 17--Linux软件安装--yum包管理器
* 18--Linux软件安装--JDK的安装、环境变量配置
* shell脚本/
* 19--了解shell编程--介绍、入门案例
* 20--了解shell编程--变量、字符串、反引号、动态传参
* 第二章 Hadoop/
* 大数据导论/
* 01--课程内容大纲和学习目标
* 02--大数据导论--数据、数据分析
* 03--大数据导论--数据分析的作用、方向
* 04--大数据导论--数据分析基本流程步骤(重要)
* 05--大数据导论--大数据时代(概念、5V特征)
* 06--大数据导论--大数据应用
* 07--大数据导论--分布式技术
* 就业基础知识学习
* 就业基础知识学习(应届生)
* 结构化表达-STAR法
* Zookeeper/
* 08--Apache zookeeper--概述、定位、功能
* 09--Apache zookeeper--全局数据一致性
* 10--Apache zookeeper--集群的架构与角色职责
* 11-Apache zookeeper--集群搭建--配置文件详解
* 12--Apache zookeeper--集群启停、进程查看、日志查看
* 13--Apache zookeeper--数据模型、znode类型(4种)
* 14--Apache zookeeper--shell命令行操作(CRUD)
* 15--Apache zookeeper--监听机制watch
* 16--Apache zookeeper--典型应用场景
* 课程阶段性回顾/
* 课程内容回顾总结--上
* 课程内容回顾总结--下
* 00--课程内容回顾总结
* 01--课程内容大纲和学习目标
* Hadoop入门/
* 02--Apache Hadoop--概述与起源发展
* 03--Apache Hadoop--特性优点(分布式、通用、简单易用)
* 04--Apache Hadoop--发行版本与自身版本发展
* 05--Apache Hadoop--集群架构与集群角色介绍
* Hadoop集群部署/
* 06--Apache Hadoop--集群部署--Hadoop安装部署模式
* 07--Apache Hadoop--集群部署--了解源码编译
* 08--Apache Hadoop--集群部署--集群规划
* 09--Apache Hadoop--集群部署--服务器基础环境准备
* 10--Apache Hadoop--集群部署--配置文件详解
* 11--Apache Hadoop--集群部署--scp同步、环境变量配置
* 12--Apache Hadoop--集群部署--namenode format操作
* 13--Apache Hadoop--集群启停--命令与状态日志查看
* Hadoop界面管理/
* 14--Apache Hadoop--Web UI页面、初体验
* 15--Apache Hadoop--jobhistory服务配置与功能
* 16--Apache Hadoop--HDFS垃圾桶机制
* Hadoop HDFS入门/
* 课程内容大纲和学习目标
* 01--传统文件系统及其面临的挑战
* 02--分布式文件存储系统核心特性与作用
* 03--Hadoop HDFS--简介
* 04--Hadoop HDFS--起源发展和设计目标
* 05--Hadoop HDFS--核心重要特性解读
* 06--Hadoop HDFS--shell 操作--命令行功能及使用说明
* 07--Hadoop HDFS--shell 操作--常见命令操作
* Hadoop HDFS工作机制/
* 08--Hadoop HDFS--工作机制--角色与角色职责
* 09--Hadoop HDFS--工作机制--上传文件流程--pipeline、ack、3副本策略
* 10--Hadoop HDFS--工作机制--上传文件流程--梳理与总结
* 11--Hadoop HDFS--工作机制--下载文件流程(读文件流程)
* 12--Hadoop HDFS--工作机制--NN和DN之间的通信机制
* Hadoop namenode管理/
* 13--Hadoop HDFS--辅助工具(distcp、archive)
* 14--Hadoop HDFS--namenode 安全模式
* 15--Hadoop HDFS--namenode元数据管理机制--整体概述
* 16--Hadoop HDFS--namenode元数据相关目录文件
* 17--Hadoop HDFS--SNN概述和checkpoint
* 课程内容回顾总结
* 00-课程内容回顾总结
* Hadoop MapReduce入门/
* 01--HDFS读写流程复习总结
* 02--课程内容大纲和学习目标
* 03--Hadoop MapReduce--理解分而治之的思想
* 04--Hadoop MapReduce--官方团队设计构思
* 05--Hadoop MapReduce--介绍、规范
* Hadoop MapReduce示例/
* 06--Hadoop MapReduce官方示例--计算圆周率(如何提交mr到yarn)
* 07--Hadoop MapReduce官方示例--单词统计(WordCount)需求剖析
* 08--Hadoop MapReduce官方示例--Wordcount--程序提交、java代码梳理
* 09--Hadoop MapReduce--python接口接入
* 10--Hadoop MapReduce--Hadoop Streaing提交python脚本
* 11--Hadoop MapReduce--输入输出路径及注意事项
* Hadoop MapReduce工作机制/
* 12--Hadoop MapReduce--工作机制--map阶段执行流程
* 13--Hadoop MapReduce--工作机制--reduce阶段执行流程
* 14--Hadoop MapReduce--工作机制--shuffle机制
* 15--Hadoop MapReduce--工作机制--Partition分区问题
* Hadoop YARN集群/
* 16--Hadoop YARN--功能职责概述
* 17--Hadoop YARN--集群架构、yarn3大组件
* 18--Hadoop YARN--mr程序提交yarn流程
* 19--Hadoop YARN--scheduler调度策略
* 20--Hadoop HA集群--什么是高可用、实现高可用注意事项
* 21--Hadoop HA集群--HDFS HA--QJM实现原理、了解YARN HA
* 00--课程内容回顾总结--MapReduce回顾
* 01--课程内容回顾总结--YARN、HA
* 第三章 Hive/
* 数据仓库/
* 02--课程内容大纲和学习目标
* 03--数据仓库--概念定位、起源由来
* 04--数据仓库--四大核心特征
* 05--数据仓库--OLTP、OLAP区别
* 06--数据仓库--数仓分层架构(ODS、DW、DA)
* 07--数据仓库--案例:数仓建设实践
* 08--数据仓库--ETL、ELT区别
* Apache Hive入门/
* 09--Apache Hive--概述、功能、与Hadoop关系
* 10--Apache Hive--如何模拟实现Hive的实现
* 11--Apache Hive--架构、组件
* 12--Apache Hive--hive与MySQL的差异
* Apache Hive部署/
* 13--Apache Hive--metadata、metastore
* 14--Apache Hive--3种部署模式(推荐掌握远程模式)
* 15--Apache Hive--远程模式安装部署--基础环境、与Hadoop整合
* 16--Apache Hive--远程模式安装部署--配置文件与初始化
* 17--Apache Hive--metastore服务启动、第一代客户端
* 18--Apache Hive--HS2服务启动、beeline客户端使用
* 19--Apache Hive--初体验--把hive当成MySQL的体验--慢
* 20--Apache Hive--初体验--如何才能映射成功文件
* 00--课程内容回顾总结
* Apache Hive建表预计/
* 01--今日课程内容大纲和学习目标
* 02--Apache Hive--DDL--概念与语法树介绍
* 03--Apache Hive--DDL--建表语句--数据类型
* 04--Apache Hive--DDL--建表语句--表存在忽略异常
* 05--Apache Hive--DDL--建表语句--SerDe机制、分隔符指定语法
* 06--Apache Hive--DDL--建表语句--课堂练习--复杂类型分隔符指定
* 07--Apache Hive--DDL--建表语句--默认分隔符
* 08--Apache Hive--DDL--建表语句--location存储位置
* 09--Apache Hive--DDL--建表语句--内部表、外部表
* Apache Hive分桶和分区/
* 10--Apache Hive--DDL--建表语句--分区表产生背景、创建语法
* 11--Apache Hive--DDL--建表语句--分区表创建、静态数据加载、分区裁剪
* 12--Apache Hive--DDL--建表语句--动态分区插入数据
* 13--Apache Hive--DDL--建表语句--多重分区及分区表注意事项
* 14--Apache Hive--DDL--建表语句--动态分区严格模式、非严格模式含义
* 15--Apache Hive--DDL--建表语句--分桶表语法、创建、加载
* 16--Apache Hive--DDL--建表语句--分桶表的好处、注意事项
* 17--Apache Hive--DDL--库、表、分区其他操作--上
* 18--Apache Hive--DDL--库、表、分区其他操作--下
* 19--Apache Hive--常见的show语法
* Apache Hive-DML/
* 20--Apache Hive--DML--load加载数据(注意local含义)
* 21--Apache Hive--DML--insert插入语法
* 22--Apache Hive--DML--insert导出数据操作
* 00--课程内容回顾总结
* Hive SQL DQL/
* 01--课程内容大纲和学习目标
* 附1--DataGrip连接HS2服务
* 02--Hive SQL--DQL--测试环境准备、动态分区使用
* 03--Hive SQL--DQL--基础查询语句及其注意事项
* 04--Hive SQL--DQL--高阶查询--cluster、distribute、sort
* 05--Hive SQL--DQL--高阶查询--CTE表达式
* 06--Hive SQL--DQL--高阶查询--CTE表达式
* 07--Hive SQL--DQL--Join语法及其使用(侧重inner、left)
* 08--Hive SQL--DQL--Join语法注意事项
* Hive SQL内置函数/
* 09--Hive SQL--第一代客户端的功能
* 10--Hive SQL--参数配置方式与优先级范围
* 11--Hive SQL--内置常见运算符
* 12--Hive SQL--函数及分类标准(UDF、UDAF、UDTF)
* 13--Hive SQL--内置函数梳理--字符串函数
* 14--Hive SQL--内置函数梳理--时间日期、数值
* 15--Hive SQL--内置函数梳理--条件转换、集合、加密
* 行列转换/
* 00--课程内容回顾总结
* 01--课程内容大纲和学习目标
* 02--Apache Hive--explode函数的使用与限制(UDTF表生成函数)
* 03--Apache Hive--lateral view侧视图的使用
* 04--Apache Hive--行列转换--多行转单列(collect_list、concat_ws)
* 05--Apache Hive--行列转换--单列转多行(explode、lateral view)
* Hive窗口函数/
* 06--Apache Hive--json格式数据处理
* 07--Apache Hive--窗口函数--快速理解与语法规则
* 08--Apache Hive--窗口函数--聚合函数
* 09--Apache Hive--窗口函数--window子句
* 10--Apache Hive--窗口函数--排序函数(row_number等)
* 11--Apache Hive--窗口函数--排序函数(ntile函数)
* 12--Apache Hive--窗口函数--lag、lead函数
* Hive调优/
* 13--Apache Hive--文件存储格式(text、ORC、parquet)
* 14--Apache Hive--数据压缩和文件格式搭配(ORC+snappy)
* 15--Apache Hive--通用调优--fetch抓取机制、MR本地模式
* 16--Apache Hive--通用调优--join优化
* 17--Apache Hive--通用调优--数据倾斜优化
* 18--Apache Hive--通用调优--MR程序task个数调整
* 19--Apache Hive--通用调优--执行计划
* 20--Apache Hive--通用调优--并行机制、推测执行机制
* 阶段作业 Hadoop技术栈-第2套试卷/
* 试卷
* 阶段五 千亿级离线数仓项目/
* 第一章 新零售项目/
* 新零售行业背景介绍/
* 01-今日内容
* 02-新零售的行业背景介绍
* 企业常用面试方法
* 业务模块介绍/
* 03-业务模块介绍(商品上架流程)
* 04-业务模块介绍(单店铺的订单流程)
* 05-业务模块介绍(购物车的流程)
* 06-业务模块介绍(配送流程)
* 07-业务模块介绍(退货流程)
* 项目架构介绍/
* 08-项目研发阶段说明
* 09-项目的集群和数据的说明
* 10-项目的架构介绍
* 11-上午总结
* 12-项目的架构介绍
* 环境介绍及部署/
* 13-cloudera manager的基本介绍
* 14-项目本地环境的部署操作
* 15-云环境的说明
* 维度分析介绍/
* 16-数据仓库的基本概念
* 17-数据仓库_维度分析的基本概念(上)
* 18-数据仓库_维度分析的基本概念(下)
* 19-今日总结
* 数仓建模介绍/
* 01-课前回顾和今日内容
* 02-数仓建模的二种建模方式介绍
* 03-维度建模_两种表介绍
* 04-维度建模_数仓发展三种模型(概念)
* 05-维度建模_数仓发展模型(图示)
* 06-维度建模_缓慢渐变维
* 数仓分层介绍/
* 07-数仓的分层介绍
* 08-上午的总结
* HUE的基本操作/
* 09-HUE的基本介绍以及访问操作
* 10-HUE基本使用_操作HDFS
* 11-HUE基本使用_操作HIVE
* oozie的基本操作/
* 12-工作流的基本介绍
* 13-oozie的使用_配置工作流
* 14-oozie的使用_定时配置操作
* 15-oozie的使用_批处理说明(了解)
* sqoop基本操作(上)/
* 16-sqoop的基本介绍
* 17-sqoop的基本使用操作
* 18-sqoop的基本使用_全量导入HDFS操作
* 19-今日总结
* sqoop基本操作(下)/
* 01-课前回顾和今日内容
* 02-sqoop的基本使用操作_全量导入到HIVE
* 03-sqoop的基本使用操作_条件导入到HDFS和HIVE
* 04_sqoop的基本使用操作_全量导出
* 05-sqoop的基本使用操作_相关sqoop参数
* dbeaver安装及数据导入/
* 06-数据库连接工具_dbeaver的安装操作
* 07-数据库连接工具_dbeaver连接mysql操作
* 08-将业务数据导入到MySQL数据库中
* 数仓优化/
* 09-基础优化_HDFS副本以及yarn和MR的资源配置
* 10-基于优化_hive基础配置以及压缩和执行引擎
* 11-HIVE中表存储格式选择方案
* 12-HIVE建表操作_数据存储格式和压缩方案选择
* ODS层数据同步介绍/
* 13-上午内容的总结
* 14-ODS层的数据同步的方式
* 15-HIVE的表说明信息乱码情况解决
* ODS层建表操作/
* 16-ODS层建表操作_各个表同步方式以及全量覆盖表建表操作
* 17-ODS层建表操作_仅新增同步和新增及更新同步建表操作
* 全量同步数据到ODS(上)/
* 18-基于sqoop完成数据导入到ODS层_全量覆盖导入
* 19-基于sqoop完成数据导入到ODS层_仅新增同步导入操作
* 20-基于sqoop完成数据导入到ODS_新增及更新导入操作
* 21-今日总结
* 全量同步数据到ODS(下)/
* 01-课前回顾和今日内容
* 02-在ODS层补充一张店铺表并导入数据
* 03-在ODS层为各不同的同步方式的表模拟一份增量数据
* 增量同步数据到ODS/
* 04-ODS层增量处理操作_全量覆盖表的处理
* 05-ODS层增量处理操作_仅新增同步和增量集更新同步的方案
* 06-ODS层增量处理_shell相关知识补充操作
* 07-ODS层增量处理_shell脚本编写
* 08-ODS层增量处理_shell脚本测试和校验操作
* 09-ODS层增量处理_基于oozie定时调度
* 分桶表/
* 10-上午内容的总结
* 11-分桶表的基本概念
* 12-分桶表的作用_如何提升Join效率
* 13-如何进行分桶采样的操作
* 14-如何使用执行计划, 以及执行计划的说明
* 15-演示_如何向桶表加载数据以及进行采样操作
* DWD层介绍/
* 16-DWD层相关作用说明以及构建DWD层库
* 17-DWD层建表操作实现
* 18-今日总结
* DWD层数据导入/
* 01-课前回顾和今日内容
* 02-DWD层数据导入操作_全量覆盖导入和仅新增同步导入
* 03-DWD层数据导入操作_新增及更新同步导入(转换处理)
* 04-DWD层数据导入操作_新增以及更新(全量导入)
* DWD层拉链表/
* 05-DWD层拉链表流程分析(上)_全量和增量过程
* 06-DWD层拉链表流程分析(中)_步骤一
* 07-DWD层拉链表流程分析(下)_步骤二
* 08-上午内容的总结
* 09-拉链表的整个实施过程
* 10-DWD其他的表处理方案
* join优化/
* 11-原生reduce端Join实现流程
* 12-join的优化_mapJoin整个过程
* 13-JOIN的优化_bucket map Join 说明
* 14-JOIN的优化_SMB join优化
* 15-今日总结
* 订单业务宽表处理(上)/
* 01-课前回顾和今日内容
* 02-DWB层基本介绍和库创建操作
* 03-订单业务宽表_表和表关系说明
* 04-订单业务宽表_建表操作说明
* 订单业务宽表处理(下)/
* 05-订单业务宽表_SQL实现操作(join过程)
* 06-订单业务宽表_SQL字段的实现操作
* 07-订单业务宽表_SQL优化说明以及执行操作
* 店铺明细宽表处理/
* 08-上午内容的总结说明
* 09-店铺明细宽表_表和表关系说明
* 10-店铺明细宽表_建表操作
* 11-店铺明细宽表_SQL实现操作
* 12-商品明细宽表_表和表关系的说明
* 商品明细宽表处理(上)/
* 13-商品明细宽表_建表操作
* 14-商品明细宽表_SQL实现操作(上)
* 商品明细宽表处理(下)/
* 15_-商品分类的具体说明
* 16-商品明细宽表_SQL实现操作(下)
* hive索引介绍/
* 01-课前回顾和今日内容
* 02-索引的基本介绍
* 03-HIVE的原始索引的基本介绍
* 04-HIVE的行组索引的基本介绍
* 05-HIVE的布隆过滤索引的基本介绍
* 06-在实际使用中, 如何应用索引
* join数据倾斜的处理/
* 07-数据倾斜的介绍以及Join倾斜解决方案上
* 08-数据倾斜的解决_JOIN解决方案下
* 09-Join数据倾斜中union all优化措施
* group_by数据倾斜的处理/
* 10-数据倾斜的解决_group by 数据倾斜发生原因
* 11-数据倾斜的解决_group by解决方案(方案一)
* 12-上午内容的总结
* 13-数据倾斜的解决_group by 解决方案二
* 14-如何发现数据倾斜的方式
* DWS层介绍/
* 15-DWS层基本介绍
* 16-DWS层销售主题日统计宽表_需求分析和建表操作
* 17-DWS层销售主题日统计宽表_日期和城市流程分析
* 销售主题日统计宽表处理(上)/
* 01-课前回顾和今日内容
* 02-如何使用dbeaver连接HIVE操作
* 03-销售主题日统计宽表_日期和城市维度
* 04-销售主题日统计宽表_日期和城市(指标统计)上
* 05-销售主题日统计宽表_日期和城市(指标统计)下
* 06-销售主题日统计宽表_日期和城市(写入目标表)
* 销售主题日统计宽表处理(下)/
* 07-销售主题日统计宽表_日期,城市和商圈统计
* 08-数仓中订单明细宽表数据特点(存在重复)
* 09-上午内容的总结
* 10-销售主题日统计宽表_日期和品牌流程分析处理
* 11-销售主题日统计宽表_日期和品牌SQL实现
* hive优化/
* 12-HIVE的其他优化_关联优化器和并行执行
* 13-HIVE的其他优化_HIVE小文件合并操作
* 14-HIVE的其他优化_矢量化查询和读取零拷贝
* presto基本介绍/
* 15-presto的基本介绍
* 16-presto的安装操作
* 17-如何使用dbeaver连接presto
* presto特点/
* 01-课前回顾和今日内容
* 02-presto的架构介绍
* 03-presto的日期类型的转换操作和计算操作
* 04-Presto的内存的调整操作
* 05-Presto中SQL特殊优化说明
* 06-Presto其他的补充说明点
* presto高级函数/
* 07-Presto高级函数_grouping sets 使用
* 08-Presto高级函数_cube操作
* 09-presto高级函数_rollup说明
* 10-presto的高级函数_grouping操作
* 销售日统计宽表(上)/
* 11-上午内容的总结
* 12-销售日统计宽表_SQL实现_去重处理
* 13-销售日统计宽表_分析为什么要做那么多的去重操作
* 14-销售日统计宽表_维度字段和group_type处理操作
* 销售日统计宽表(下)/
* 15-销售日统计宽表_指标统计(销售收入)
* 16-销售日统计宽表_指标统计(销售额相关指标)
* 17-销售日统计宽表_指标统计(订单量相关统计)
* 18-销售主题日统计宽表_导入数据操作以及测试
* 商品主题日统计宽表处理(上)/
* 01-课前回顾和今日内容
* 02-DWS层商品主题日统计宽表的建表操作
* 03-DWS层商品主题日统计宽表_需求分析
* 04-DWS层商品主题日统计宽表_指标实现(前二类)
* 05-DWS层商品主题日统计宽表_后续的指标统计
* 商品主题日统计宽表处理(下)/
* 06-二个表全外关联实现流程分析以及三个表引入
* 07-上午内容的总结说明
* 08-三个表进行全外关联的流程分析
* 09-DWS层商品主题日统计宽表_整体合并实现
* 销售主题宽表实现(上)/
* 10-DM层介绍以及建库和建表操作
* 11-DM层销售主题宽表实现_按日统计
* 销售主题宽表实现(下)/
* 12-DM层销售主题宽表实现_上卷统计的分析说明(上)
* 13-DM层销售主题宽表实现_上卷统计分析(中)
* 14-DM层销售主题宽表实现_上卷统计分析流程(下)
* 销售主题的统计宽表处理(上)/
* 01-课前回顾和今日内容
* 02-DM层销售主题的统计宽表_按周统计(指标)
* 03_DM层销售主题的统计宽表_按周统计(指标处理)
* 04-DM层销售主题统计宽表_按月和年进行统计
* 销售主题的统计宽表处理(中)/
* 05-DM层销售主题的统计宽表的增量处理思路
* 06-DM层商品主题的统计宽表_建表操作
* 07-DM层商品主题的统计宽表_统计总累计值和最近30天
* 08-DM层商品主题的统计宽表_合并结果
* 销售主题的统计宽表处理(下)/
* 09-上午内容的总结
* 10-DM层商品主题的统计宽表_增量的实现操作
* RPT层实现/
* 11-RPT层相关内容_需求一
* 12-RPT层相关内容_需求二
* 报表展示/
* 13-基于presto进行数据导出操作
* 14-图表展示工作
* 项目总结/
* 15-项目的总结说明
* 16-相关的面试题说明
* 阶段作业 Python数据处理与分析实战-第1套试卷/
* 试卷
* 阶段六 Spark技术栈/
* 第一章 PySpark/
* Spark介绍/
* 01-今日内容说明
* 02-Spark的基本介绍
* 03-Spark为什么执行效率比较高
* 04-Spark发展史
* Spark特点/
* 05-Spark的特点(前二个)
* 06-Spark的特点(后二个)
* Spark local模式/
* 07-local模式的基本介绍
* 08-如何更改网络适配器方案
* 09-如何安装local模式
* 10-上午内容的总结
* Pysaprk环境安装/
* 11-如何安装anaconda
* 12-安装好python环境后直接使用pyspark命令
* 13-安装pyspark库
* 集群介绍及Pycharm环境/
* 14-Spark集群模式的架构介绍
* 15-pycharm如何连接远程环境
* 16-pycharm的一些高级功能
* WordCount案例 方式一/
* 17-WordCount的流程分析
* 18-WordCount代码实现(上)
* 19-WordCount代码实现(下)
* 20-今日总结
* PySpark 入门示例/
* 01-课前回顾和今日内容
* 02-pySpark的入门案例_从HDFS读取数据写入到HDFS
* 03-pySpark的入门案例_排序操作
* 04-如何将spark程序提交到平台运行(初体验Local)
* Spark On Yarn/
* 05-spark on yarn集成操作
* 06-Spark On Yarn测试操作
* 07-Spark On Yarn提交测试以及Spark程序组成部分
* Spark提交运行/
* 08-Spark提交运行的两种部署方式
* 09-Spark的提交运行的两种方式_如何查看日志
* 10-Spark和PySpark的交互流程图(上)
* 11-上午内容的总结
* Spark与PySpark交互/
* 12-Spark和PySpark的交互流程(下)
* 13-Spark和PySpark的交互流程(集群模式)
* 14-Spark和PySpark交互流程(YARN)
* 15-Spark-submit的相关参数说明
* RDD介绍与特点/
* 16-RDD的基本介绍
* 17-RDD的五大特性
* 18-RDD的五大特点
* RDD构建/
* 19-如何构建RDD_方式一
* 20-今日总结
* PySpark DateSource/
* 01-课前回顾和今日内容
* 02-通过读取外部文件的方式以及小文件合并
* 03-读取外部文件的分区数量的确定
* RDD Transformations 算子及action算子/
* 04-RDD算子的分类介绍
* 05-RDD算子_转换算子(单值类型)
* 06-RDD算子_转换算子(双值类型)
* 07-RDD算子_转换算子(kv类型)
* 08-上午内容的总结
* 09-RDD相关算子_action算子
* RDD 分区/
* 10-RDD重要函数_分区函数
* 11-RDD的重分区的函数(上)
* 12-RDD的重分区的函数(下)
* RDD 聚合/
* 13-RDD的重要函数_聚合函数(单值)
* 14-RDD的重要算子_聚合函数(kv类型)
* 15-RDD的重要算子_关联函数
* 16-今日总结
* PySpark 搜索案例/
* 01-课前回顾和今日内容
* 02-搜狗案例的数据集说明
* 03-如何在pycharm设置模板
* 04-搜索案例实现_数据封装操作
* 05-搜索案例实现_需求一实现
* 06-搜索案例实现_需求二实现
* 07-点击流分析案例_需求1和需求2
* RDD 缓存/
* 08-今日内容的说明
* 09-缓存的基本介绍(理解)
* 10-缓存的基本使用操作
* RDD 检查点/
* 11-检查点的基本介绍
* 12-检查点的基本使用
* 13-缓存和检查点的区别
* 14-缓存和检查点共用操作
* RDD共享变量/
* 15-RDD共享变量的引入操作
* 16-RDD的共享变量_广播变量
* 17-RDD的共享变量_累加器的使用操作
* RDD累加器/
* 18-RDD的累加器的小问题说明(重复累加)
* 19-上午内容的总结
* DAG流程图/
* 20-RDD内核调度_RDD的依赖关系
* 21-DAG以及DAG流程图形成说明
* 22-DAG的阶段划分以及线程的划分操作
* 23-DAG和stage的划分操作(细化操作)
* RDD内核调度/
* 24-RDD内核调度_RDD的shuffle
* 25-RDD的内核调度_JOB的调度流程
* 26-RDD的内核调度_Spark的并行度
* 27-了解combinerByKey
* 28-今日总结
* SparkSQL介绍/
* 01-课前回顾和今日内容
* 02-SparkSQL的基本概念
* 03-Spark SQL的发展历程
* 04-Spark SQL 和 HIVE SQL异同点
* SparkSQL入门示例/
* 05-Spark SQL中数据结构
* 06-Spark SQL入门代码_如何构建SparkSession对象
* 07-Spark SQL入门案例代码
* PySpark DateFrame/
* 08-Spark SQL的dataFrame介绍
* 09-如何构建dataFrame对象_RDD转换DF
* 10-如何构建dataFrame对象_pandas的DF转换为Spark的DF
* 11-如何构建dataFrame对象_读取外部的方式
* 12-上午内容的总结
* 13-如何构建dataFrame_json以及总结说明
* 14-dataFrame的相关的API_DSL
* 15-dataFrame的相关的API_SQL方案
* 16-dataFrame的相关API_代码演示
* WordCount案例 方式二/
* 17-综合案例_WordCount案例(RDD转DF方案)
* 18-综合案例_WordCount案例的方式二
* 电影分析案例/
* 19-综合案例_电影分析案例需求一
* 20-综合案例_电影分析案例需求四_SQL实现
* 21-综合案例_电影分析案例_需求四
* 22-今日总结
* Spark SQL/
* 01-课前回顾和今日内容
* 02-Spark SQL的shuffle分区数量设置
* 03-Spark SQL的清洗相关的API演示
* 04-Spark SQL的输出操作_输出普通文件
* 05-Spark SQL的输出操作_输出到Mysql
* pandas介绍/
* 06-pandas的基本介绍及其入门案例
* 07-pandas的两个重要数据类型_series
* 08-pandas的两个重要的数据类型_dataFrame
* 09-pandas的数据的读写文件操作
* 10-上午内容的总结
* 11-pandas的读写数据库的操作
* 窗口函数/
* 12-pyspark SQL中函数_如何使用窗口函数_SQL
* 13-spark sql中函数_如何使用窗口函数_DSL
* 自定义UDF函数/
* 14-spark SQL的自定义UDF函数_使用步骤
* 15-spark SQL的自定义UDF函数_返回基本数据类型
* 16-spark SQL的自定义UDF函数_返回列表或者字典
* pandas UDF/
* 17-Spark SQL的pandas的UDF_如何互转DF操作
* 18-spark SQL的pandas的UDF使用操作
* 19-spark SQL的pandas的UDAF函数使用以及作业说明
* 20-今日总结
* Spark On Hive/
* 01-课前回顾和今日内容
* 02-Spark ON hive的基础原理说明
* 03-测试HIVE是否可以正常的启动
* 04-spark on hive的集成配置操作
* 05-Spark On HIVE 的集成_如何通过代码连接
* 06-Spark ON HIVE_分布式引擎(模拟hive server2)
* 07_spark on hive的分布式引擎_通过datagrip连接
* Spark SQL运行机制/
* 08-spark SQL的运行机制_回顾Driver执行流程
* 09-Spark SQL的运行机制详解
* 10-如何查看SQL的物理执行计划
* 新零售案例/
* 11-上午内容的总结
* 12-综合案例_新零售案例需求说明
* 13-综合案例_新零售案例实现_清洗操作
* 14-综合案例_新零售案例实现_需求一实现
* 15-综合案例_新零售案例_需求3和需求5
* 16-综合案例_新零售案例_需求9
* 17-综合案例_教育项目案例需求实现
* Spark总结/
* 18-spark阶段大总结(上)
* 19-spark阶段大总结(下)
* 阶段作业 Spark技术栈-第2套试卷/
* 试卷
* 阶段七 PB级内存计算项目实战/
* 第一章 富华保险/
* 保险业务说明/
* 01-今日内容说明
* 02-行业背景介绍
* 03-保险的分类和精算的介绍
* 04-保险行业相关的专业术语
* 05-保险行业的相关特点
* 06-用户投保流程
* 07-再保险部门的基本介绍
* 08-保险的分类(风险转移和理财型)
* 09-保险数据的业务数据来源地说明
* 10-项目背景说明
* 项目业务需求与架构介绍/
* 11-上午内容的总结
* 12-项目的需求描述
* 13-项目架构的描述以及技术选型
* 14-项目的基本情况的说明
* 项目虚拟机说明/
* 15-项目的统一环境的虚拟机说明
* 16-项目成果演示工作
* 大数据计算演示/
* 17-大数据计算流程的演示
* 18-今日总结
* 数仓建模/
* 01-课前回顾和今日内容
* 02-数仓的基本介绍
* 03-维度分析的基本内容
* 04-数仓建模的两套理论基本介绍
* 05-维度建模中事实表和维度表的基本介绍
* 06-维度建模中三种模型的整体说明
* 07-缓慢渐变维说明
* 数仓分层/
* 08-上午内容的总结
* 09-数据仓库的分层的基本描述
* 10-数仓架构技术选型说明
* 项目环境搭建/
* 11-如何清理远端环境
* 12-如何构建远端环境以及构建基础项目目录
* 13-基于pycharm连接远端服务器(替换CRT)
* 14-基于pycharm连接MySQL和spark
* 15-清洗昨日相关的数据集
* 16-将基础数据导入到Mysql中
* 17-今日总结
* hive数仓建库建表/
* 01-课前回顾和今日内容
* 02-hive中建表的思考点
* 03-启动项目的整体环境
* 04-在hive中构建ODS层库和表
* 基于sqoop完成数据采集/
* 05-sqoop的基本介绍
* 06-sqoop的安装操作
* 07-sqoop的基本使用操作
* 08-sqoop的数据采集操作实施
* 09-上午内容总结
* 10-完成后续的采集的脚本
* DolphinScheduler的使用/
* 11-DS的基本介绍
* 12-DS的安装配置操作
* 13-DS的安装与启动操作
* 14-DS的架构的说明
* 15-DS的基本使用操作
* 16-DS的工作流的配置和测试操作
* 17-使用DS完整ODS层数据采集操作
* 18-今日总结
* 寿险定价规则/
* 01-课前回顾和今日内容
* 02-寿险的定价的循环流程
* 03-寿险的定价原则
* 04-寿险定价假设
* 05-寿险传统定价方法说明
* 窗口函数回顾/
* 06-如何生成多行序列操作
* 07-如何快速生成一张表数据
* 08-回顾窗口函数_row_number以及兄弟们
* 09-回顾窗口函数_与聚合函数结合使用
* 10-回顾窗口函数与lead和lag以及其他计算函数操作
* 迭代计算/
* 11-上午内容的总结
* 12-如何进行横向迭代计算操作
* 13-如何进行纵向迭代计算操作(方式一)
* 14=如何进行纵向迭代计算操作(方式二)
* 15-UDAF函数结合窗口函数执行的流程说明
* 保费参数因子需求解析/
* 16-计算保费参数因子_需求说明(上)
* 17-计算保费参数因子_需求说明(下)
* 18-在DW层构建表以及字段信息说明
* 19-在DW层实现保费参数因子表的维度表生成
* 20-今日总结
* 保费参数因子表计算_上/
* 01-课前回顾和今日内容
* 02-保费参数因子表计算_步骤一
* 03-保费参数因子表计算_步骤二
* 04-保费参数因子表计算_步骤三
* 05-使用spark程序读取SQL脚本执行
* 06-保费参数因子表计算_步骤四(上)
* 07-保费参数因子表计算_步骤四(下)
* 08-保费参数因子表计算_步骤四的计算流程讲解
* 09-保费参数因子表计算_步骤五
* 保费参数因子表计算_下/
* 10-上午内容的总结说明
* 11-保费参数因子表计算操作_步骤五的函数流程说明
* 12-保费参数因子表计算操作_步骤六
* 13-保费参数因子表计算操作_步骤七
* 14-保费参数因子表计算操作_步骤八
* 15-保费参数因子表计算操作_步骤九
* 16-保费参数因子表计算操作_步骤10
* 17-保费参数因子表计算_保存至目标表
* 计算保费/
* 18-保费计算操作_结果表创建操作
* 19-保费计算操作_中间结果的计算实现_步骤11
* 20-保费计算流程_步骤12
* 21-保费计算流程_保存到目标表
* 现金价值计算_上/
* 01-课前回顾和今日内容
* 02-现金价值和保险准备金基本介绍
* 03-现金价值的需求说明
* 04-现金价值计算_建表操作
* 05-现金价值表计算_步骤13
* 06-现金价值表计算_步骤14~16计算操作
* 07-现金价值表计算_步骤17~18
* 现金价值计算_下/
* 08_现金价值计算_将毛保费结果保存到目标表
* 09-现金价值计算_步骤19
* 10-上午内容的总结
* 11-现金价值计算_步骤20~21
* 12-现金价值计算_步骤22~23
* 13-现金价值计算_导入到目标表
* 保险准备金计算/
* 01-保险准备金的需求分析以及建表操作
* 02-保险准备金计算_步骤24
* 03-保险准备金计算_步骤25
* 04-保险准备金计算_步骤26
* 05-保险准备金计算_步骤27
* 06-保险准备金计算_步骤28
* 07-保险准备金计算_步骤29~33
* 08-保险准备金计算_基于窗口函数实现聚合操作
* APP层计算操作/
* 09-APP层计算操作_保险精算结果表构建
* 10-app层计算操作_保险精算结果表导入操作
* 11-将数据导出到MySQL中
* 01-课前回顾和今日内容
* 用户投保详情计算/
* 02-用户投保详情表计算操作(上)
* 03-用户投保详情表计算操作(下)
* 计算保费收入增长率、首年保费与保费收入比/
* 04-计算保费收入增长率
* 05-计算首年保费与保费收入比(上)
* 06-计算首年保费与保费收入比(下)
* 件均保费及死亡发生率和残疾发生率计算/
* 07-计算件均保费
* 08-死亡发生率和残疾发生率
* 09-上午内容的总结
* 新业务价值率,高净值客户比例,各地区汇总保费计算/
* 10-新业务价值率的计算操作
* 11-高净值客户比例计算
* 12-各地区的汇总保费
* 上线yarn平台/
* 13-app指标说明
* 14-基于Yarn完成项目上线操作
* 项目总结/
* 15-项目总结(上)
* 16-项目总结(中)
* 17-项目总结(下)
* 18-面试总结
* 就业能力-试用期&工作常识科普/
* 01-应聘渠道使用技巧
* 02-面试篇1
* 03-面试篇2
* 04-试用期篇1
* 05-试用期篇2
* 阶段作业 离线数仓项目-知行教育-第1套试卷/
* 试卷





![[衡天云]爆款云服务器 低至12元/月](/hty.png)