在大模型技术快速迭代的当下，深度求索（DeepSeek）凭借创新的混合专家架构、高效的训练范式和开源开放的生态，成为中文大模型领域的标杆。DeepSeek原理与项目实战营以“技术筑基+场景落地”为核心，带领学员从模型底层原理出发，打通“理论认知-技术实践-产业部署”全链路，助力开发者掌握新一代大模型的核心能力。

* 01 第一阶段回顾基础：ChatGPT的原理与复现，及mamba对Transformer的改造/

* 01 第一课 ChatGPT原理与实现.mp4 (439.75 MB), 02:03:25

* 02 第二课透彻理解Transformer中的自注意力.mp4 (214.47 MB), 01:04:20

* 03 第三课精讲想颠覆Transformer的Mamba：从SSM、HiPPO、S4到Mamba.mp4 (268.63 MB), 01:19:27

* 02 第二阶段 DeepSeek-V3之前的MoE、Math、V2模型(含GRPO、MLA算法讲解)/

* 01 第四课精讲DeepSeek LLM、DeepSeekMoE(含源码实现与解读).mp4 (183.75 MB), 01:04:22

* 02 第五课精讲DeepSeekMath及其提出的RL算法GRPO：将是最通俗讲解.mp4 (259.51 MB), 01:18:20

* 03 第七课 DeepSeek-V2：提出多头潜在注意力MLA且改进MoE.mp4 (250.44 MB), 01:13:08

* 03 第三阶段精讲把性价比做到极致的DeepSeek-V3(如何以十分之一成本超越llama 3.1 405B)/

* 01 第八课让Meta恐慌的DeepSeek-V3：在MoE、GRPO、MLA基础上提出Multi-Token预测.mp4 (266.77 MB), 01:04:35

* 04 第四阶段精讲火爆全球的DeepSeek-R1(含R1满血版的本地部署)/

* 01 第十二课速通DeepSeek R1：如何通过纯RL训练大模型的推理能力以比肩甚至超越OpenAI o1.mp4 (259.44 MB), 01:34:36

* 02 第十三课 DeepSeek-R1的本地部署——可联网、可实现本地知识库问答：包括671B满血版和各个蒸馏版的部署.mp4 (132.91 MB), 45:39

* 05 第五阶段从零复现DeepSeek R1：基于MoE，解读与实现MLA、MTP/

* 01 第十四课从头解读与实现多头潜在注意力MLA：图、公式、代码逐一对应.mp4 (260.92 MB), 01:09:09

* 06 第六阶段 Agent落地——让AI提炼idea、写代码、做实验且最终写成论文(含deepseek的应用)/

* 01 第十七课让AI写论文：基于大模型提炼idea、写代码、做实验且最终写成论文.mp4 (220.93 MB), 01:01:54

* 02 第十八课如何在本地部署运行AI科学家(跑通流程并取得一篇相应idea的论文).mp4 (201.29 MB), 50:21

* 07 第七阶段如何更好的落地AI Researcher-idea提炼(包含DeepSeek V3的应用)/

* 01 第十九课 AI Reseacher的idea提炼流程.mp4 (179.49 MB), 01:08:54

* 02 第二十课 AI Researcher-idea提炼的代码解析.mp4 (310.85 MB), 01:09:14

* 08 第八阶段从零开始微调出来一个论文审稿大模型(含deepseek的微调)/

* 01 第二十二课论文审稿的项目背景与数据处理.mp4 (498.88 MB), 01:26:46

* 02 第22课补充之1：论文审稿GPT第1版之模型的选型.mp4 (281.97 MB), 01:21:28

* 03 第22课补充之2：论文审稿GPT之RWKV的具体训练与推理.mp4 (335.04 MB), 01:31:15

* 04 第二十三课第2版之微调LLaMA2 7B以最终反超GPT4，涉及数据的爬取、模型的选项、训练、评估.mp4 (526.34 MB), 02:22:23

* 05 第23课补充1：对review数据的进一步处理及模型的选型.mp4 (495.82 MB), 02:23:22

* 06 第23课补充2：LaMA2 7b chat + LongQLoRA训练与模型评估.mp4 (366.58 MB), 01:51:53

* 07 第二十四课数据是项目效果的天花板：提升七月论文审稿之数据质量的三大要素.mp4 (427.54 MB), 01:20:45

* 08 第二十五课通过paper-review数据集微调Llama3.mp4 (350.88 MB), 01:14:05

* 09 第十阶段 DeepSeek系列的最新最前沿：包含NSA、DSA、DeepSeek-OCR等/

* 01 第三十一课 Native Sparse Attention(简称NSA)——动态分层下的“原生稀疏注意力”策略.mp4 (184.42 MB), 51:36

* 02 第三十二课通透DeepSeek-V3.2——核心在于DeepSeek Sparse Attention(简称DSA).mp4 (108.27 MB), 33:24

* 03 第三十三课 DeepSeek-OCR——上下文视觉压缩：同等长度下，通过更少的视觉token解决长上下文处理难题.mp4 (118.55 MB), 30:49

DeepSeek原理与项目实战营 [从V3R1的复现到其应用]