2026年,大模型垂直商用进入“精细化落地期”!审稿作为媒体、出版、金融、企业合规等领域的核心刚需环节,市场规模超百亿,但传统审稿模式普遍面临“人工效率低(日均审核不足50篇)、标准难统一、合规风险高、突发任务应对弱”的困境。而通用大模型直接用于审稿,又存在“行业规范适配差、错误漏判率高、输出格式不达标”的问题,难以满足商用要求。

*   01 第一部分 论文审稿的数据爬取、处理与第一版的微调RWKV/

  *   01 第一课 论文审稿的项目背景与数据处理 (498.88 MB), 01:26:46

  *   02 第二课 论文审稿GPT第1版之模型的选型 (281.97 MB), 01:21:28

  *   03 第三课 论文审稿GPT之RWKV的具体训练与推理 (335.04 MB), 01:31:15

*   02 第二部分 第2版之微调LLaMA2 7B以最终反超GPT4(线上营1期中审稿部分只讲到这一层)/

  *   01 第四课 第2版对论文PDF数据的解析 (279.36 MB), 01:16:14

  *   02 第五课 第2版对paper和review数据的处理 (219.15 MB), 01:06:35

  *   03 第六课 对review数据的进一步处理:规范Review的格式且多聚一 (204.00 MB), 01:04:46

  *   04 第七课 模型的选型:从Mistral、Mistral-YaRN到LongLora LLaMA (264.90 MB), 01:20:02

  *   05 第八课 模型的训练:如何微调LLaMA2、Yarn-Mistral (211.32 MB), 01:01:16

  *   06 第九课 模型的评估:如何评估审稿GPT的效果 (138.93 MB), 51:14

*   03 第三部分 微调Mistral 7B instruct 0.2、Google gemma(本部分其他课程暂不涉及)/

  *   01 第十课 论文审稿GPT第3.2版:微调Mistral 7B instruct 0.2 (217.87 MB), 59:46

  *   02 第十一课 论文审稿GPT第3.5版:微调Google gemma (176.16 MB), 57:13

*   04 第四部分 上更大的模型:通过xtuner微调mixtral 8x7b和LLaMA2 70B/

  *   01 第十二课 第4版(上):通过llama factory微调mixtral 8x7b (191.88 MB), 01:03:18

  *   02 第十三课 第4版(下):通过xtuner微调mixtral 8x7b(首次把对GPT4的胜率达到了80%) (306.30 MB), 01:02:56

  *   03 第十四课 第4.2版之LLaMA 70B微调:通过1.5K条paper-review数据微调LLaMA2 70B (338.75 MB), 01:24:29

*   05 第五部分 数据是项目效果的天花板:进一步提高数据质量后再调Llama3/

  *   01 第十五课 提升七月论文审稿之数据质量的三大要素 (427.54 MB), 01:20:45

  *   02 第十六课 康奈尔大学之Reviewer2及我司七月对其的实现 (492.40 MB), 01:29:36

  *   03 第十七课 通过paper-review数据集微调Llama3 (350.88 MB), 01:14:05

  *   04 第十八课 llama3微调结果分析与推理策略优化 (245.37 MB), 49:57