在大模型技术快速迭代的当下,深度求索(DeepSeek)凭借创新的混合专家架构、高效的训练范式和开源开放的生态,成为中文大模型领域的标杆。DeepSeek原理与项目实战营以“技术筑基+场景落地”为核心,带领学员从模型底层原理出发,打通“理论认知-技术实践-产业部署”全链路,助力开发者掌握新一代大模型的核心能力。
* 01 第一阶段 回顾基础:ChatGPT的原理与复现,及mamba对Transformer的改造/
* 01 第一课 ChatGPT原理与实现.mp4 (439.75 MB), 02:03:25
* 02 第二课 透彻理解Transformer中的自注意力.mp4 (214.47 MB), 01:04:20
* 03 第三课 精讲想颠覆Transformer的Mamba:从SSM、HiPPO、S4到Mamba.mp4 (268.63 MB), 01:19:27
* 02 第二阶段 DeepSeek-V3之前的MoE、Math、V2模型(含GRPO、MLA算法讲解)/
* 01 第四课 精讲DeepSeek LLM、DeepSeekMoE(含源码实现与解读).mp4 (183.75 MB), 01:04:22
* 02 第五课 精讲DeepSeekMath及其提出的RL算法GRPO:将是最通俗讲解.mp4 (259.51 MB), 01:18:20
* 03 第七课 DeepSeek-V2:提出多头潜在注意力MLA且改进MoE.mp4 (250.44 MB), 01:13:08
* 03 第三阶段 精讲把性价比做到极致的DeepSeek-V3(如何以十分之一成本超越llama 3.1 405B)/
* 01 第八课 让Meta恐慌的DeepSeek-V3:在MoE、GRPO、MLA基础上提出Multi-Token预测.mp4 (266.77 MB), 01:04:35
* 04 第四阶段 精讲火爆全球的DeepSeek-R1(含R1满血版的本地部署)/
* 01 第十二课 速通DeepSeek R1:如何通过纯RL训练大模型的推理能力以比肩甚至超越OpenAI o1.mp4 (259.44 MB), 01:34:36
* 02 第十三课 DeepSeek-R1的本地部署——可联网、可实现本地知识库问答:包括671B满血版和各个蒸馏版的部署.mp4 (132.91 MB), 45:39
* 05 第五阶段 从零复现DeepSeek R1:基于MoE,解读与实现MLA、MTP/
* 01 第十四课 从头解读与实现多头潜在注意力MLA:图、公式、代码逐一对应.mp4 (260.92 MB), 01:09:09
* 06 第六阶段 Agent落地——让AI提炼idea、写代码、做实验且最终写成论文(含deepseek的应用)/
* 01 第十七课 让AI写论文:基于大模型提炼idea、写代码、做实验且最终写成论文.mp4 (220.93 MB), 01:01:54
* 02 第十八课 如何在本地部署运行AI科学家(跑通流程并取得一篇相应idea的论文).mp4 (201.29 MB), 50:21
* 07 第七阶段 如何更好的落地AI Researcher-idea提炼(包含DeepSeek V3的应用)/
* 01 第十九课 AI Reseacher的idea提炼流程.mp4 (179.49 MB), 01:08:54
* 02 第二十课 AI Researcher-idea提炼的代码解析.mp4 (310.85 MB), 01:09:14
* 08 第八阶段 从零开始微调出来一个论文审稿大模型(含deepseek的微调)/
* 01 第二十二课 论文审稿的项目背景与数据处理.mp4 (498.88 MB), 01:26:46
* 02 第22课补充之1:论文审稿GPT第1版之模型的选型.mp4 (281.97 MB), 01:21:28
* 03 第22课补充之2:论文审稿GPT之RWKV的具体训练与推理.mp4 (335.04 MB), 01:31:15
* 04 第二十三课 第2版之微调LLaMA2 7B以最终反超GPT4,涉及数据的爬取、模型的选项、训练、评估.mp4 (526.34 MB), 02:22:23
* 05 第23课补充1:对review数据的进一步处理及模型的选型.mp4 (495.82 MB), 02:23:22
* 06 第23课补充2:LaMA2 7b chat + LongQLoRA训练与模型评估.mp4 (366.58 MB), 01:51:53
* 07 第二十四课 数据是项目效果的天花板:提升七月论文审稿之数据质量的三大要素.mp4 (427.54 MB), 01:20:45
* 08 第二十五课 通过paper-review数据集微调Llama3.mp4 (350.88 MB), 01:14:05
* 09 第十阶段 DeepSeek系列的最新最前沿:包含NSA、DSA、DeepSeek-OCR等/
* 01 第三十一课 Native Sparse Attention(简称NSA)——动态分层下的“原生稀疏注意力”策略.mp4 (184.42 MB), 51:36
* 02 第三十二课 通透DeepSeek-V3.2——核心在于DeepSeek Sparse Attention(简称DSA).mp4 (108.27 MB), 33:24
* 03 第三十三课 DeepSeek-OCR——上下文视觉压缩:同等长度下,通过更少的视觉token解决长上下文处理难题.mp4 (118.55 MB), 30:49




