首页 | 本学科首页   官方微博 | 高级检索  
     

基于数据局部相似性的卷积神经网络加速器
作者姓名:蔡元鹏  孙文浩  陈松
作者单位:中国科学技术大学微电子学院
基金项目:国家重点研发计划(2019YFB2204800);;国家自然科学基金(61931008);
摘    要:为提高卷积神经网络的处理速度,使用零梯度近似处理的卷积方法(梯度卷积)来提高数据的复用率,减少计算量。以卷积核为单位对数据进行梯度计算,针对不同网络的不同层次采用灵活的梯度阈值计算策略,以合理复用相邻窗口的卷积结果。将其中关键的梯度处理模块和卷积计算部分在现场可编程门阵列(FieldProgrammable Gate Array, FPGA)上进行实现,与脉动阵列相结合以提高资源利用率,并针对负载不均衡的问题设计出适合梯度卷积的数据流。基于YOLOv3模型和Pascal VOC数据集的目标检测实验中,在付出较小精度损失的前提下,软件端减少约23.2%的计算量,结合硬件加速比约为17.8%。

关 键 词:加速器  数据局部相似性  卷积神经网络  梯度卷积  现场可编程门阵列
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号