聚焦大模型微调的算法原理与技术突破,专为想深入理解微调底层逻辑的技术开发者设计。最新版融入 2025 年微调算法前沿成果,通过 “理论解析→算法实现→效果优化” 的闭环教学,帮助学员掌握从基础微调算法到高阶优化策略的全链路知识,能独立设计适配不同场景的微调方案,解决复杂业务中的模型性能问题。

*   01 第一周/

  *   01 第1节课 5月12日/

    *   01 大模型的发展、Tokenizer、Self-Attention/

      *   01 大模型的发展 (891.49 MB), 58:07

      *   02 Tokenizer (646.19 MB), 01:04:45

      *   03 Self-Attention (547.23 MB), 54:59

      *   04 Positional Embedding (232.78 MB), 23:23

*   02 第二周/

  *   01 第1节课补充课-5月15日/

    *   01 Layer Normalization、Label Smoothing/

      *   01 Layer Normalization (993.88 MB), 01:27:40

      *   02 FFN、Label Smoothing、Decoding (688.00 MB), 52:29

  *   02 第2节课 5月19日/

    *   01 大模型微调概览、Pipeline、Transformers/

      *   01 大模型微调概览-语言模型 (908.96 MB), 58:16

      *   02 大模型微调pipeline (1.06 GB), 01:20:42

      *   03 Transformers (646.42 MB), 47:42

*   03 第三周/

  *   01 第3节课 5月26日/

    *   01 指令微调数据集构建、LoRA训练模型/

      *   01 指令微调 (1.05 GB), 01:09:20

      *   02 指令微调数据集构建 (807.08 MB), 59:45

      *   03 LoRA训练模型 (842.97 MB), 01:01:05

*   04 第四周/

  *   01 第4节课 6月2日/

    *   01 AdaLora与Alpaca、Vicuna微调大模型简介/

      *   01 Lora、AdaLora (992.19 MB), 01:22:04

      *   02 Alpaca、Vicuna微调大模型简介 (1.31 GB), 01:37:07

*   05 第五周/

  *   01 第5节课 6月16日/

    *   01 Quantization、Qlora/

      *   01 Quantization (1.41 GB), 01:40:51

      *   02 Qlora (1.04 GB), 01:09:35

*   06 第六周/

  *   01 第6节课 6月23日/

    *   01 More Quantization、Compression/

      *   01 More Quantization-01 (1.30 GB), 01:19:01

      *   02 More Quantization-02 (854.27 MB), 01:01:11

      *   03 Compression (673.81 MB), 42:46

*   07 第七周/

  *   01 第7节课 7月7日/

    *   01 RLHF介绍、强化学习/

      *   01 RLHF介绍 (608.62 MB), 40:09

      *   02 强化学习01 (844.90 MB), 01:18:39

      *   03 强化学习02 (666.89 MB), 55:11

      *   04 Example-Gridworld (655.65 MB), 56:48

*   08 第八周/

  *   01 第8节课 7月14日/

    *   01 Monte Carlo、TD Prediction/

      *   01 Monte Carlo (1.30 GB), 01:45:35

      *   02 TD Prediction (1.01 GB), 01:20:09

*   09 第九周/

  *   01 第8节课补充课1 7月24日/

    *   01 Monte Carlo Policy Gradient/

      *   01 Monte Carlo Policy Gradient (1.05 GB), 01:37:51

  *   02 第8节课补充课2 7月28日/

    *   01 PPO/

      *   01 Off-policy policy gradient (752.05 MB), 01:02:12

      *   02 PPO-01 (1.32 GB), 01:27:23

      *   03 PPO-02 (597.50 MB), 43:40

*   10 第十周/

  *   01 第9节课 8月4日/

    *   01 DPO/

      *   01 DPO-Direct Preference Optimization (1.54 GB), 01:38:46

      *   02 Beyond DPO Applications of DPO (1.25 GB), 01:17:50

*   11 第十一周/

  *   01 第10节课 8月18日/

    *   01 More LoRA、IA3、训练技巧/

      *   01 More LoRA (1.30 GB), 01:24:07

      *   02 IA3、训练技巧 (1.58 GB), 01:32:09

*   12 第十二周/

  *   01 第11节课 8月25日/

    *   01 LLAMA 3 Technique Report/

      *   01 LLAMA 3 Technique Report-01 (1.80 GB), 01:45:42

      *   02 LLAMA 3 Technique Report-02 (1.06 GB), 01:10:14

*   13 第十三周/

  *   01 第12节课 9月1日/

    *   01 Flash Attention ZeRO/

      *   01 LLAMA 3 Technique Report Cont (1.60 GB), 02:00:38

      *   02 Flash Attention ZeRO (1.07 GB), 01:10:22

*   14 第十四周/

  *   01 第13节课 9月8日/

    *   01 Lifelong Learning/

      *   01 Zero (1.39 GB), 01:27:30

      *   02 Lifelong Learning (1.58 GB), 01:35:10

*   课件资料/

  *   课件资料.zip (1.04 GB)