一种通用型卷积神经网络加速器架构研究 |
| |
引用本文: | 董刚,胡克坤,杨宏斌,赵雅倩,李仁刚,赵坤,曹其春,鲁璐.一种通用型卷积神经网络加速器架构研究[J].微电子学与计算机,2023(5):97-103. |
| |
作者姓名: | 董刚 胡克坤 杨宏斌 赵雅倩 李仁刚 赵坤 曹其春 鲁璐 |
| |
作者单位: | 1. 浪潮电子信息产业股份有限公司;2. 广东浪潮大数据研究有限公司 |
| |
基金项目: | 山东省重点研发计划项目(2019TSLH0201);;山东省自然科学基金创新发展联合基金(ZR2021LZH004); |
| |
摘 要: | 针对当前AI专用加速器设计复杂且存在内存瓶颈等不足,提出一种通用型卷积神经网络加速器架构.其RISC(Reduced Instruction Set Computer)指令集支持不同类型卷积神经网络到硬件加速器的高效映射.其通用卷积计算模块是一个由多个基本运算单元组成的可重构三维脉动阵列,支持不同尺寸的二维卷积计算;脉动阵列规模可根据需要进行配置,适用不同的并行加速需求.为缓解内存瓶颈、提高算力,输入模块引入多级缓存结构,可实现对片外数据的高速读取;输出模块设计一种基于“乒乓”架构的多级数据累加结构,以实现卷积计算结果的高速缓存输出.将所提架构在FPGA芯片上予以实现,实验结果表明该架构凭借较少计算资源和较低功耗取得了与当前先进加速器相近的性能,且通用性更强.
|
关 键 词: | AI加速器 卷积神经网络 多尺寸卷积核 三维脉动阵列 多级累加结构 |
|
|