Skip to content

wushenhaoyu/ZYNQ_CNN

Repository files navigation

ZYNQ并行卷积核

本项目在ZYNQ7020实现一个并行卷积核,使得卷积操作能够像流水一样迅速通过各种卷积层

优点:

计算速度快、流水线式操作、有几个filter就存在几个卷积核同时进行

缺点:

1.如果filter过多消耗资源极大,建议用PS端实现这一部分,如LeNet的最后一部分卷积层(input:5,kernel:5) x 120 资源占用量约为在此之前卷积层之和的19倍
2.计算速度过快无法设计合理的Linear层,采用传统的设计方式会加入一个Ram存储数据,但Linear处理数据又消耗时间,无法跟上卷积核的流式处理,势必造成数据堵塞,建议将PS作为一个门卫,CPU单线程,监视卷积操作的入口和出口,牺牲小部分的并行度和处理时间实现数据等待然后进行相应linear操作

About

ZYNQ手搓卷积核

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published