聚焦大模型微调的算法原理与技术突破，专为想深入理解微调底层逻辑的技术开发者设计。最新版融入 2025 年微调算法前沿成果，通过 “理论解析→算法实现→效果优化” 的闭环教学，帮助学员掌握从基础微调算法到高阶优化策略的全链路知识，能独立设计适配不同场景的微调方案，解决复杂业务中的模型性能问题。

* 01 第一周/

* 01 第1节课 5月12日/

* 01 大模型的发展、Tokenizer、Self-Attention/

* 01 大模型的发展 (891.49 MB), 58:07

* 02 Tokenizer (646.19 MB), 01:04:45

* 03 Self-Attention (547.23 MB), 54:59

* 04 Positional Embedding (232.78 MB), 23:23

* 02 第二周/

* 01 第1节课补充课-5月15日/

* 01 Layer Normalization、Label Smoothing/

* 01 Layer Normalization (993.88 MB), 01:27:40

* 02 FFN、Label Smoothing、Decoding (688.00 MB), 52:29

* 02 第2节课 5月19日/

* 01 大模型微调概览、Pipeline、Transformers/

* 01 大模型微调概览-语言模型 (908.96 MB), 58:16

* 02 大模型微调pipeline (1.06 GB), 01:20:42

* 03 Transformers (646.42 MB), 47:42

* 03 第三周/

* 01 第3节课 5月26日/

* 01 指令微调数据集构建、LoRA训练模型/

* 01 指令微调 (1.05 GB), 01:09:20

* 02 指令微调数据集构建 (807.08 MB), 59:45

* 03 LoRA训练模型 (842.97 MB), 01:01:05

* 04 第四周/

* 01 第4节课 6月2日/

* 01 AdaLora与Alpaca、Vicuna微调大模型简介/

* 01 Lora、AdaLora (992.19 MB), 01:22:04

* 02 Alpaca、Vicuna微调大模型简介 (1.31 GB), 01:37:07

* 05 第五周/

* 01 第5节课 6月16日/

* 01 Quantization、Qlora/

* 01 Quantization (1.41 GB), 01:40:51

* 02 Qlora (1.04 GB), 01:09:35

* 06 第六周/

* 01 第6节课 6月23日/

* 01 More Quantization、Compression/

* 01 More Quantization-01 (1.30 GB), 01:19:01

* 02 More Quantization-02 (854.27 MB), 01:01:11

* 03 Compression (673.81 MB), 42:46

* 07 第七周/

* 01 第7节课 7月7日/

* 01 RLHF介绍、强化学习/

* 01 RLHF介绍 (608.62 MB), 40:09

* 02 强化学习01 (844.90 MB), 01:18:39

* 03 强化学习02 (666.89 MB), 55:11

* 04 Example-Gridworld (655.65 MB), 56:48

* 08 第八周/

* 01 第8节课 7月14日/

* 01 Monte Carlo、TD Prediction/

* 01 Monte Carlo (1.30 GB), 01:45:35

* 02 TD Prediction (1.01 GB), 01:20:09

* 09 第九周/

* 01 第8节课补充课1 7月24日/

* 01 Monte Carlo Policy Gradient/

* 01 Monte Carlo Policy Gradient (1.05 GB), 01:37:51

* 02 第8节课补充课2 7月28日/

* 01 PPO/

* 01 Off-policy policy gradient (752.05 MB), 01:02:12

* 02 PPO-01 (1.32 GB), 01:27:23

* 03 PPO-02 (597.50 MB), 43:40

* 10 第十周/

* 01 第9节课 8月4日/

* 01 DPO/

* 01 DPO-Direct Preference Optimization (1.54 GB), 01:38:46

* 02 Beyond DPO Applications of DPO (1.25 GB), 01:17:50

* 11 第十一周/

* 01 第10节课 8月18日/

* 01 More LoRA、IA3、训练技巧/

* 01 More LoRA (1.30 GB), 01:24:07

* 02 IA3、训练技巧 (1.58 GB), 01:32:09

* 12 第十二周/

* 01 第11节课 8月25日/

* 01 LLAMA 3 Technique Report/

* 01 LLAMA 3 Technique Report-01 (1.80 GB), 01:45:42

* 02 LLAMA 3 Technique Report-02 (1.06 GB), 01:10:14

* 13 第十三周/

* 01 第12节课 9月1日/

* 01 Flash Attention ZeRO/

* 01 LLAMA 3 Technique Report Cont (1.60 GB), 02:00:38

* 02 Flash Attention ZeRO (1.07 GB), 01:10:22

* 14 第十四周/

* 01 第13节课 9月8日/

* 01 Lifelong Learning/

* 01 Zero (1.39 GB), 01:27:30

* 02 Lifelong Learning (1.58 GB), 01:35:10

* 课件资料/

* 课件资料.zip (1.04 GB)

贪心科技大模型微调实战营-算法篇 最新版

贪心科技大模型微调实战营-算法篇最新版