Skip to content

Latest commit

 

History

History
14 lines (11 loc) · 595 Bytes

README.md

File metadata and controls

14 lines (11 loc) · 595 Bytes

常见编程模型及其优化

去年开始从java后端开发转到了这个方向,学习到了很多sycl的知识,但是cuda的应用范围更加广泛,所以还是打算研究一下。 这个仓库主要会记录下将建的并行编程模型,如reduce,scan,matmul,conv等算法的实现以及优化,总结下常见的性能优化方案,以及性能测量工具的使用,还有就是性能预估之类(Roof line model)

Todo List

  1. 仓库框架的搭建,主要是基础的工具类
  2. Roof line model
  3. reduce
  4. scan
  5. matmul
  6. conv
  7. 常见优化总结