文档名:MRNDA一种基于资源受限片上网络的深度神经网络加速器组播机制研究
摘要:片上网络(Network-on-Chip,NoC)在多处理器系统中得到了广泛的应用.近年来,有研究提出了基于NoC的深度神经网络(DeepNeuralNetwork,DNN)加速器.基于NoC的DNN加速器设计利用NoC连接神经元计算设备,能够极大地减少加速器对片外存储的访问从而减少加速器的分类延迟和功耗.但是,若采用传统的单播NoC,大量的一对多数据包会极大的提高加速器的通信延迟.并且,目前的深度神经网络规模往往非常庞大,而NoC的核心数量是有限的.因此,文中提出了一种针对资源受限的NoC的组播方案.该方案利用有限数量的处理单元(ProcessorEl-ement,PE)来计算大型的DNN,并且利用特殊的树形组播加速网络来减少加速器的通信延迟.仿真结果表明,和基准情况相比,本文提出的组播机制使加速器的分类延迟最高降低了86.7%,通信延迟最高降低了88.8%,而它的路由器面积和功耗仅占基准路由器的9.5%和10.3%.
Abstract:Network-on-Chip(NoC)deviceshavebeenwidelyusedinmultiprocessorsystems.Inrecentyears,NoC-baseddeepneuralnetwork(DNN)acceleratorshavebeenproposedtoconnectneuralcomputingdevicesusingNoCs.Suchdesignsdramaticallyreduceoff-chipmemoryaccessesoftheseplatformsthusreducetheaccelerators'classificationlatencyandpowerconsumption.However,thelargenumberofone-to-manypackettransferssignificantlyincreasethecommunica-tionlatencywithtraditionalunicastchannels.Weproposedamulticastmechanismforresource-constrainednoc-baseddeepneuralnetworkaccelerators(MRNDA)tocomputelargeDNNmodelsbyusinglimitednumberofprocessorelements(PEs).Thispaperproposesatree-basedmulticastaccelerationnetworktodecreasethecommunicationlatencyofDNNac-celerators.Simulationresultsshowthat,comparedwiththebaselinemethod,themulticastmechanismproposedinthispa-perreducestheclassificationlatencyoftheacceleratorbyupto86.7%andthecommunicationlatencybyupto88.8%,whileitsrouter'sareaandpoweronlyaccountfor9.5%and10.3%ofthebaselinerouters.
作者:欧阳一鸣 王奇 汤飞扬 周武 李建华 Author:OUYANGYi-ming WANGQi TANGFei-yang ZHOUWu LIJian-hua
作者单位:合肥工业大学计算机与信息学院,安徽合肥230009合肥工业大学微电子学院,安徽合肥230009
刊名:电子学报 ISTICEIPKU
Journal:ActaElectronicaSinica
年,卷(期):2024, 52(3)
分类号:TP302
关键词:片上网络 深度神经网络加速器 组播 路由器架构 多物理网络
Keywords:network-on-chip deepneuralnetworkaccelerator multicast routerarchitecture multiplenetwork
机标分类号:TP393TN915.05F626.5
在线出版日期:2024年5月16日
基金项目:MRNDA:一种基于资源受限片上网络的深度神经网络加速器组播机制研究[
期刊论文] 电子学报--2024, 52(3)欧阳一鸣 王奇 汤飞扬 周武 李建华片上网络(Network-on-Chip,NoC)在多处理器系统中得到了广泛的应用.近年来,有研究提出了基于NoC的深度神经网络(DeepNeuralNetwork,DNN)加速器.基于NoC的DNN加速器设计利用NoC连接神经元计算设备,能够极大地减少加速器...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
MRNDA:一种基于资源受限片上网络的深度神经网络加速器组播机制研究 MRNDA:A Multicast Mechanism for Resource-Constrained Noc-Based Deep Neural Network Accelerators
MRNDA:一种基于资源受限片上网络的深度神经网络加速器组播机制研究.pdf
|