第一阶段 了解CUDA与寄存器使用第二阶段 掌握Cuda的Reduce/Gemm优化与通用库第三阶段 实战 Transformer Layer与量化优化
* 第一阶段 了解CUDA与寄存器使用/
* 第一课 CUDA基本介绍
* 第二课 Share memory与寄存器使用:
* 第二阶段 掌握Cuda的Reduce/Gemm优化与通用库/
* 第三课 Cuda Reduce优化
* 第四课 Cuda Gemm优化
* 第五课 cuda的通用库介绍
* 第三阶段 实战 Transformer Layer与量化优化/
* 第六课 实战优化: Transformer Layer的cuda实现
* 第七课 量化优化





![[衡天云]爆款云服务器 低至12元/月](/hty.png)