基于“承影”GPGPU的张量处理器设计 |
| |
引用本文: | 师雨洁,杨轲翔,刘旭东,何虎.基于“承影”GPGPU的张量处理器设计[J].微电子学与计算机,2024(5):109-116. |
| |
作者姓名: | 师雨洁 杨轲翔 刘旭东 何虎 |
| |
作者单位: | 清华大学集成电路学院 |
| |
摘 要: | 针对神经网络对算力和通用性的需求进一步扩大,基于开源项目“承影”GPGPU,设计了张量处理器,可以对卷积、通用矩阵乘进行加速。首先,分析现有张量处理器设计方案及其对应算法,与直接进行卷积计算进行对比,分析性能差异。然后,提出基于三维乘法树结构的张量处理器设计,将其部署在Xilinx VCU128开发板上。在VCU128开发板上,张量处理器的工作频率为222 MHz。同时,开发了指数运算单元,辅助完成神经网络运算。在VCU128开发板上的工作频率为159 MHz。最后,利用编写汇编程序的方法,验证张量处理器的功能正确性。引入张量处理器后,预期运行时间明显减少。
|
关 键 词: | 通用图形处理器 张量处理器 卷积 通用矩阵乘 指数运算 |
|
|