第一阶段 Meta LLaMA的复现与解读:参数少但多数任务的效果好于GPT3第二阶段 Vicuna(shareGPT)、BELLE(self-instruct
* 第一阶段 Meta LLaMA的复现与解读:参数少但多数任务的效果好于GPT3/
* 第1课 InstructGPT三阶段过程回顾
* 第2课 ColossalChat模型架构图
* 第3课 DeepSpeedChat的公式
* 第4课 对话序列及奖励值序列的计算过程
* 第5课 优势函数及returns的两种算法
* 第6课 DSC中计算return的过程:TD误差
* 第7课 LLaMA模型:参数少且效果好于GPT3
* 第8课 LLaMA架构解读:分词及RMSNorm
* 第9课 LLaMA架构解读:SwiGLU替代ReLU
* 第10课 LLaMA架构解读:位置编码RoPE
* 第11课 LLaMA架构解读:Attention架构及参数设置
* 第12课 LLaMA2 相比LLaMA1 的改进
* 第13课 LLaMA2 的分组查询注意力(GQA)
* 第14课 LLaMA2-Chat中的RLHF:三阶段训练方式
* 第二阶段 Vicuna(shareGPT)、BELLE(self-instruct)、Chinese-LLaMA/Chinese-Alpaca/
* 第1课 LLaMA2 排序阶段的损失函数
* 第2课 Vicuna—基于shareGPT数据的微调
* 第3课 链家BELLE:结合中文预料通过self-instruct微调BLOOM
* 第4课 Chinese-LLaMA:词表扩充中文数据
* 第5课 Chinese-LLaMA:基于中文数据的预训练与微调
* 第6课 姜子牙系列模型Ziya-LLaMA-13B-V1
* 第7课 基于LLaMA微调的各模型对比





![[衡天云]爆款云服务器 低至12元/月](/hty.png)