Skip to content

leizhenyuan/Parallel_programming_pattern

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

常见编程模型及其优化

去年开始从java后端开发转到了这个方向,学习到了很多sycl的知识,但是cuda的应用范围更加广泛,所以还是打算研究一下。 这个仓库主要会记录下将建的并行编程模型,如reduce,scan,matmul,conv等算法的实现以及优化,总结下常见的性能优化方案,以及性能测量工具的使用,还有就是性能预估之类(Roof line model)

Todo List

  1. 仓库框架的搭建,主要是基础的工具类
  2. Roof line model
  3. reduce
  4. scan
  5. matmul
  6. conv
  7. 常见优化总结

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • C++ 73.6%
  • C 16.4%
  • Makefile 6.2%
  • CMake 2.5%
  • Cuda 1.3%