大数据时代,程序员必备技能之一

*   第1章 从零开始 系统入门python爬虫工程师-课程导学(提醒:购买后记得加入课程群)/

  *   1-1 从零开始 系统入门python爬虫工程师-课程导学.mp4 13:44

*   第2章 彻底解决让人头疼的环境搭建问题 视频教程+文档补充 轻松帮你搞定!/

  *   2-1 python的安装.mp4 03:56

  *   2-2 python的安装和配置 - linux

  *   2-3 python的安装和配置 - mac

  *   2-4 pycharm的安装和配置 (必看!!).mp4 10:04

  *   2-5 课程中用到的pycharm快捷键(必看!!!).mp4 10:10

  *   2-6 mysql和navicat的安装和使用.mp4 09:10

  *   2-7 mysql和navicat的安装和配置 - linux

  *   2-8 mysql和navicat的安装和配置 - mac

  *   2-9 虚拟环境的安装和配置.mp4 14:25

  *   2-10 虚拟环境的安装和配置 - linux

  *   2-11 虚拟环境的安装和配置 - mac

*   第3章 我们从了解网络爬虫开始,重新认识爬虫。/

  *   3-1 爬虫能做什么?.mp4 12:30

  *   3-2 Python网络爬虫需要学习的知识和解决的问题.mp4 07:07

  *   3-3 爬虫是万能的吗?.mp4 07:03

*   第4章 爬虫工程师基本功--计算机网络协议基础/

  *   4-1 为什么我们需要学习计算机网络.mp4 11:58

  *   4-2 一个完整的网络请求过程.mp4 04:06

  *   4-3 ip地址和url详解 - 为什么网站一般不会封ip?.mp4 19:26

  *   4-4 有哪些网络协议?.mp4 09:51

  *   4-5 我们经常看到的tcp-ip协议是什么?.mp4 15:13

  *   4-6 socket编程 - 客户端和服务端通信 - 1.mp4 21:52

  *   4-7 socket编程 - 客户端和服务端通信-2.mp4 15:43

  *   4-8 基于tcp自定义第一个协议 - 模拟qq服务器和客户端 - 1.mp4 16:58

  *   4-9 基于tcp自定义第一个协议 - 模拟qq服务器和客户端 - 2.mp4 16:18

  *   4-10 基于tcp自定义第一个协议 - 模拟qq服务器和客户端 - 3.mp4 17:46

  *   4-11 正确认识http协议 - 1.mp4 17:31

  *   4-12 正确认识http协议 -2.mp4 18:32

  *   4-13 本章课后作业.mp4 03:53

*   第5章 爬虫工程师基本功--前端基础/

  *   5-1 html、css和JavaScript之间的关系...1.mp4 23:33

  *   5-2 浏览器的加载过程.mp4 06:44

  *   5-3 dom树和JavaScript操作dom树.mp4 17:52

  *   5-4 ajax、json和xml.mp4 24:02

  *   5-5 动态网页和静态网页.mp4 05:21

  *   5-6 GET、POST方法和Content-type详解.mp4 25:31

  *   5-7 ajax方式提交表单数据.mp4 10:13

  *   5-8 本章课后作业。.mp4 04:10

*   第6章 爬虫前置知识讲解&爬虫初体验/

  *   6-1 爬虫采集方案分类.mp4 09:19

  *   6-2 requests功能详解.mp4 26:49

  *   6-3 正则表达式-基本语法.mp4 25:23

  *   6-4 正则表达式 - python接口.mp4 17:22

  *   6-5 beautifulsoup用法 - find方法.mp4 21:19

  *   6-6 beautifulsoup用法 - 父子节点和兄弟节点获取.mp4 16:26

  *   6-7 xpath基本语法 - 1.mp4 17:00

  *   6-8 xpath基本语法 - 2.mp4 16:25

  *   6-9 css选择器提取元素.mp4 14:30

*   第7章 通过JS逆向实现论坛网站的数据抓取/

  *   7-1 2021更新重录说明.mp4 05:59

  *   7-2 pymysql的简单使用.mp4 21:40

  *   7-3 peewee自动生成表.mp4 20:12

  *   7-4 通过peewee对数据进行增、删、改、查.mp4 16:11

  *   7-5 目标网站需求分析.mp4 13:19

  *   7-6 表结构定义.mp4 15:58

  *   7-7 通过headers去识别反爬.mp4 11:17

  *   7-8 分析headers中的签名算法.mp4 07:39

  *   7-9 通过python调用js函数生成随机值.mp4 09:54

  *   7-10 模拟csdn生成参数签名防止反爬.mp4 22:46

  *   7-11 通过签名的参数请求正确的数据.mp4 03:13

  *   7-12 封装签名方法获取想要的数据.mp4 12:32

  *   7-13 获取所有的二级分类的url.mp4 13:05

  *   7-14 分析列表页的数据并解析.mp4 11:57

  *   7-15 解析列表页数据并进行下一页策略抓取.mp4 10:32

  *   7-16 抽取topic数据入库到mysql中.mp4 10:48

  *   7-17 解析帖子回复和用户信息.mp4 14:43

  *   7-18 签名中的参数顺序至关重要.mp4 13:12

  *   7-19 后续章节学习的说明.mp4 02:55

*   第8章 多线程和线程池编程 - 进一步改造爬虫/

  *   8-1 并发和并行.mp4 13:54

  *   8-2 多线程编程.mp4 18:00

  *   8-3 python的GIL真的会导致多线程慢吗?.mp4 22:40

  *   8-4 线程同步 - Lock.mp4 14:13

  *   8-5 使用多线程重构csdn爬虫 - 1.mp4 19:10

  *   8-6 使用多线程重构csdn爬虫 - 2.mp4 16:12

  *   8-7 使用多线程和Queue重构csdn爬虫.mp4 19:28

  *   8-8 进一步的思考 - 课后作业.mp4 11:39

  *   8-9 ThreadPoolExecutor的基本功能.mp4 24:06

  *   8-10 ThreadPoolExecutor线程池重构爬虫.mp4 07:22

  *   8-11 如果合适的话使用 asyncio 做爬虫的优势是什么?

*   第9章 项目实战2-电商网站,实现动态网网站的数据抓取/

  *   9-1 需求分析.mp4 12:30

  *   9-2 表结构设计.mp4 22:52

  *   9-3 chrome的f12后的调试工具栏介绍.mp4 05:59

  *   9-4 京东的商品详情页接口分析.mp4 26:01

  *   9-5 通过requests完成京东详情页数据的获取.mp4 17:39

  *   9-6 selenium的安装和使用.mp4 21:46

  *   9-7 通过selenium解析商品详情页 - 1.mp4 17:34

  *   9-8 通过selenium解析商品详情页 - 2.mp4 18:38

  *   9-9 通过selenium解析商品详情页 - 3.mp4 18:10

  *   9-10 通过selenium解析商品详情页 - 4.mp4 17:05

  *   9-11 通过selenium解析商品详情页 - 5.mp4 17:57

  *   9-12 chromedirver的headless模式和设置不加载图片.mp4 07:45

  *   9-13 课后作业和总结.mp4 06:29

*   第10章 实战项目3-社区网站,实现模拟登陆和验证码/

  *   10-1 章节目标和为什么需要模拟登录.mp4 02:50

  *   10-2 模拟登录的原理- session和cookie的原理.mp4 21:52

  *   10-3 requests模拟登录豆瓣.mp4 06:58

  *   10-4 将cookie保存到文件中并从文件中读取cookie.mp4 12:04

  *   10-5 selenium模拟登录豆瓣.mp4 18:23

  *   10-6 滑动验证码识别 和selenium模拟登录B站 - 1.mp4 19:36

  *   10-7 滑动验证码识别 和selenium模拟登录B站 - 2.mp4 20:19

  *   10-8 滑动验证码识别 和selenium模拟登录B站 - 3.mp4 21:25

  *   10-9 第三方验证码识别服务商推荐camproj.mp4 03:34

  *   10-10 课后作业和总结.mp4 05:09

  *   10-11 【讨论题】滑动验证码的解决办法

  *   10-12 词云热力图应该如何实现?

*   第11章 先懂反爬再应对反爬/

  *   11-1 反爬和反反爬.mp4 06:08

  *   11-2 常见的反爬方案.mp4 07:24

  *   11-3 通过user-agent反爬.mp4 16:54

  *   11-4 通过收费的代理ip绕过反爬 - 1.mp4 17:28

  *   11-5 通过收费的代理ip绕过反爬 - 2.mp4 13:12

  *   11-6 通过一个实际的案例分析一下反爬策略是什么.mp4 10:01

*   第12章 学会用框架,scrapy实现快速开发爬虫/

  *   12-1 新建scrapy项目.mp4 11:49

  *   12-2 通过pycharm调试scrapy.mp4 09:14

  *   12-3 编写spider的逻辑.mp4 15:18

  *   12-4 item和pipeline.mp4 19:32

  *   12-5 scrapy集成随机useragent和ip代理.mp4 14:28

*   第13章 帮你规划一条通往高级爬虫工程师的进阶之路/

  *   13-1 课程总结.mp4 20:28

  *   13-2 成为高级爬虫工程师的学习建议.mp4 20:08