2022-11-05

本周见闻

  • kernl
  • OpenAI提出的Transformer类模型新加速库, 最高有12倍加速比(相对于huggging face)
  • 对Torch的transformer模型算子进行wrapper替换
  • 使用triton语言(not triton form NV)进行算子高效实现
  • 使用CUDA Graph进行图调度,节省时间
  • 实用torch Dynamo进行动态图构建

文件列表

  • 09.Weekly