前沿速递,直击微调复现技术核心
<p>DeepSeek-R1 的成功不仅为大模型的发展提供了新的方向,也为未来人工智能的研究和应用奠定了坚实基础。近期围绕 DeepSeek-R1 的讨论也越来越多,于是我们开设了这门前沿课程,希望能帮你拨开迷雾,更深入地了解大模型前沿知识,学习到 DeepSeek-R1 的核心技术,以及众多 DeepSeek-R1 开源项目的复现思路。</p> <p>课程涵盖以下话题:</p> <ul> <li>推理类模型是如何炼成的?</li> <li>DeepSeek-R1 类模型擅长做哪些事?</li> <li>蒸馏 DeepSeek-R1 进行微调复现的思路是怎样的?</li> <li>如何理解 DeepSeek-R1-zero中的核心技术(GRPO、奖励策略)?</li> <li>OpenAI 推出的 Deep Research 如何应用?</li> <li>DeepSeek-R1、Deep Research有哪些值得关注学习的开源项目?</li> </ul> <p>PS:课程形式为视频课,不提供课件。</p>





![[衡天云]爆款云服务器 低至12元/月](/hty.png)