**01 第一阶段 从零实现一个基于大模型的论文翻译系统**

- 01 第1课 开营仪式与ChatGPT的三阶段训练方式 (508.42 MB, 01:55:25)

- 02 第2课 论文PDF的解析与处理 (324.40 MB, 01:32:47)

- 03 第3课 基于大模型实现翻译功能 (355.25 MB, 01:10:50)


**02 第二阶段 从头开始微调出来一个中文金融审稿大模型**

- 01 第4课 Meta LLaMA的结构与原理:参数少但多数任务的效果好于GPT3 (189.54 MB, 52:20)

- 02 第4课之补充1:半小时总结LLaMA 2的技术架构精要 (77.68 MB, 27:06)

- 03 第5课 Stanford Alpaca:结合英文语料通过Self Instruct方式微调LLaMA 7B (369.69 MB, 01:57:06)

- 04 第5课之补充:Alpaca-LoRA微调过程「使用已清洗的alpaca数据基于LoRA微调LLaMA-7B」 (83.20 MB, 18:41)

- 05 第6课 ChatGLM2-6B(第二代)的结构与微调 (90.14 MB, 19:51)

- 06 第6课之补充1:ChatGLM2-6(第二代)的LoRAP-Tuning微调 (129.31 MB, 33:29)

- 07 第6课之补充2:ChatGLM3-6(第三代)的结构与LoRA微调 (170.53 MB, 47:45)

- 08 第7课 GLM4部署微调实战 (277.46 MB, 01:29:12)

- 09 第8课 Qwen系列模型及微调实战 (336.44 MB, 01:29:29)


**03 第三阶段 从爬取数据开始从零开发:七月论文审稿GPT(第2版已超过OpenAI的GPT4)**

- 01 第9课 论文审稿的项目背景与数据处理 (498.88 MB, 01:26:46)

- 02 第10课 第二版对论文PDF数据的解析 (279.36 MB, 01:16:14)

- 03 第11课 第二版对paper和review数据的处理 (219.15 MB, 01:06:35)

- 04 第12课 对review数据的进一步处理:规范Review的格式且多聚一 (204.00 MB, 01:04:46)

- 05 第13课 模型的选型:从Mistral、Mistral-YaRN到LongLora LLaMA (264.90 MB, 01:20:02)

- 06 第13课之补充:再谈审稿GPT第二版之模型的选型 (293.75 MB, 01:46:46)

- 07 第14课 模型的训练:如何微调LLaMA2、Yarn-Mistral (211.32 MB, 01:01:16)

- 08 第14课之补充:再谈审稿GPT第二版之微调llama2 7B (177.41 MB, 43:57)

- 09 第15课 模型的评估:如何评估审稿GPT的效果 (138.93 MB, 51:14)


**04 第四阶段 数据层面的不断优化,及Llama3.1的微调、与并行训练指南**

- 01 第16课 提升七月论文审稿之数据质量的三大要素 (427.54 MB, 01:20:45)

- 02 第17课 康奈尔大学之Reviewer2及我司七月对其的实现 (492.40 MB, 01:29:36)

- 03 第18课 通过paper-review数据集微调Llama3 (350.88 MB, 01:14:05)

- 04 第18课之补充1:结合论文速览Meta最新发布的Llama3 (139.42 MB, 51:53)

- 05 第18课之补充2:速览Llama 3:从Llama 3的模型架构到如何把长度扩展到100万 (125.61 MB, 36:52)

- 06 第19课 llama3微调结果分析与推理策略优化 (245.37 MB, 49:57)

- 07 第19课之补充1:速览Llama 3.1和Llama 3.2:涵盖语言、视觉的架构、原理 (140.95 MB, 33:38)

- 08 第20课 大模型并行训练指南初步:理解基本概念 (260.29 MB, 01:12:12)

- 09 第21课 大模型并行训练指南进阶:深入实战 (274.17 MB, 01:59:03)


**05 第五阶段 实现基于企业多文档的知识库问答系统(RAG检索增强生成)**

- 01 第22课 langchain的整体组成架构 (205.78 MB, 53:32)

- 02 第22课之补充:langchain十个应用示例(文档问答数据库问答智能体Agents等) (198.98 MB, 50:33)

- 03 第23课 如何通过LangChain+LLM搭建本地知识库问答 (113.19 MB, 41:23)

- 04 第23课之补充1:本地知识库问答系统的搭建与部署(以Langchain-Chatchat v0.3为例) (136.30 MB, 33:00)

- 05 第23课之补充2:七月的GPU登录及使用说明(如还不会用七月GPU则必看) (38.49 MB, 11:04)

- 06 第24课 如何解决知识库检索出错的问题:embedding算法是关键之一 (186.98 MB, 01:02:17)

- 07 第24课之补充:m3e模型与bge模型微调 (97.71 MB, 27:54)

- 08 第25课 如何更好的分割结构化的文档 (82.99 MB, 32:21)

- 09 第25课之补充视频:针对结构化文档采取更好的chunk分割的代码实现 (198.27 MB, 47:23)

- 10 第26课 如何解决非结构化文档分割不够准确的问题:比如按照语义切分(含Sora解读) (179.75 MB, 58:44)

- 11 第27课 逐行深入分析:langchain-ChatGLM项目的关键源码解读(特别是向量搜索匹配) (215.07 MB, 01:14:19)

- 12 第28课 如何确保召回结果的全面性与准确性:多路召回、重排及检索评估方式 (217.09 MB, 01:07:11)

- 13 第29课 如何基于文档中的表格进行问答 (155.79 MB, 55:53)

- 14 第30课 企业知识库场景下的RAG整体优化方案 (230.03 MB, 01:25:43)

- 15 第31课 RAG进阶之通用文档处理RAGFlow的源码剖析 (292.55 MB, 01:19:13)


**06 第六阶段 基于stable diffusion二次开发一个AIGC模特生成系统(也含代码)**

- 01 第32课 通俗理解Stable Diffusion:文本到图像的潜在扩散模型(改进版DDPM) (266.48 MB, 01:31:02)

- 02 第33课 Stable Diffusion WebUI安装部署及项目结构解析 (243.87 MB, 01:25:25)

- 03 第34课 Stable Diffusion Webui生成AI模特描述研究、参数及流程 (317.16 MB, 01:38:52)

- 04 第35课 AIGC模特生成系统核心代码详解 (235.37 MB, 01:19:54)


**07 第七阶段 三大AI Agent项目:自动对人类下达的任务进行拆解分析、工具调用**

- 01 第36课 阿里通义千问Qwen-7B的原理及ReAct用法 (156.68 MB, 35:00)

- 02 第37课 Qwen-Agent实现气候查询与气候图景绘制 (338.98 MB, 01:42:03)

- 03 第38课 CrewAI实现多Agent协同创意写作 (352.87 MB, 01:38:43)

- 04 第39课 CrewAI引入工具调用及人机协作 (282.06 MB, 01:22:29)

- 05 第40课 新式Agent:代码Action为主的Agent框架SmolAgents (205.13 MB, 58:57)

- 06 第41课 基于SmolAgents实现的知识搜索助手 (124.53 MB, 43:07)