第一阶段 Meta LLaMA的复现与解读:参数少但多数任务的效果好于GPT3第二阶段 Vicuna(shareGPT)、BELLE(self-instruct

*   第一阶段 Meta LLaMA的复现与解读:参数少但多数任务的效果好于GPT3/

  *   第1课 InstructGPT三阶段过程回顾

  *   第2课 ColossalChat模型架构图

  *   第3课 DeepSpeedChat的公式

  *   第4课 对话序列及奖励值序列的计算过程

  *   第5课 优势函数及returns的两种算法

  *   第6课 DSC中计算return的过程:TD误差

  *   第7课 LLaMA模型:参数少且效果好于GPT3

  *   第8课 LLaMA架构解读:分词及RMSNorm

  *   第9课 LLaMA架构解读:SwiGLU替代ReLU

  *   第10课 LLaMA架构解读:位置编码RoPE

  *   第11课 LLaMA架构解读:Attention架构及参数设置

  *   第12课 LLaMA2 相比LLaMA1 的改进

  *   第13课 LLaMA2 的分组查询注意力(GQA)

  *   第14课 LLaMA2-Chat中的RLHF:三阶段训练方式

*   第二阶段 Vicuna(shareGPT)、BELLE(self-instruct)、Chinese-LLaMA/Chinese-Alpaca/

  *   第1课 LLaMA2 排序阶段的损失函数

  *   第2课 Vicuna—基于shareGPT数据的微调

  *   第3课 链家BELLE:结合中文预料通过self-instruct微调BLOOM

  *   第4课 Chinese-LLaMA:词表扩充中文数据

  *   第5课 Chinese-LLaMA:基于中文数据的预训练与微调

  *   第6课 姜子牙系列模型Ziya-LLaMA-13B-V1

  *   第7课 基于LLaMA微调的各模型对比