【限时0.1秒杀】LLaMA与Chinese-LLaMA的解读及微调

体系课

28 人浏览发布 2026-06-09更新 2026-07-10

第一阶段 Meta LLaMA的复现与解读：参数少但多数任务的效果好于GPT3第二阶段 Vicuna(shareGPT)、BELLE(self-instruct

* 第一阶段 Meta LLaMA的复现与解读：参数少但多数任务的效果好于GPT3/

* 第1课 InstructGPT三阶段过程回顾

* 第2课 ColossalChat模型架构图

* 第3课 DeepSpeedChat的公式

* 第4课对话序列及奖励值序列的计算过程

* 第5课优势函数及returns的两种算法

* 第6课 DSC中计算return的过程：TD误差

* 第7课 LLaMA模型：参数少且效果好于GPT3

* 第8课 LLaMA架构解读：分词及RMSNorm

* 第9课 LLaMA架构解读：SwiGLU替代ReLU

* 第10课 LLaMA架构解读：位置编码RoPE

* 第11课 LLaMA架构解读：Attention架构及参数设置

* 第12课 LLaMA2 相比LLaMA1 的改进

* 第13课 LLaMA2 的分组查询注意力（GQA）

* 第14课 LLaMA2-Chat中的RLHF：三阶段训练方式

* 第二阶段 Vicuna(shareGPT)、BELLE(self-instruct)、Chinese-LLaMA/Chinese-Alpaca/

* 第1课 LLaMA2 排序阶段的损失函数

* 第2课 Vicuna—基于shareGPT数据的微调

* 第3课链家BELLE：结合中文预料通过self-instruct微调BLOOM

* 第4课 Chinese-LLaMA：词表扩充中文数据

* 第5课 Chinese-LLaMA：基于中文数据的预训练与微调

* 第6课姜子牙系列模型Ziya-LLaMA-13B-V1

* 第7课基于LLaMA微调的各模型对比

本篇 ¥29.00 · 开通 VIP 更划算