第一阶段 了解CUDA与寄存器使用第二阶段 掌握Cuda的Reduce/Gemm优化与通用库第三阶段 实战 Transformer Layer与量化优化

*   第一阶段 了解CUDA与寄存器使用/

  *   第一课 CUDA基本介绍

  *   第二课 Share memory与寄存器使用:

*   第二阶段 掌握Cuda的Reduce/Gemm优化与通用库/

  *   第三课 Cuda Reduce优化

  *   第四课 Cuda Gemm优化

  *   第五课 cuda的通用库介绍

*   第三阶段 实战 Transformer Layer与量化优化/

  *   第六课 实战优化: Transformer Layer的cuda实现

  *   第七课 量化优化