文档名:卷积神经网络低位宽量化推理研究
随着深度卷积神经网络对计算量与访存量的需求增加,网络压缩与加速技术成为近几年的研究热点.针对网络架构改进、伪量化等重训练方法在压缩深度卷积神经网络时存在算力要求大、数据集难获得以及部署周期长等缺点,论文提出一种有效利用卷积神经网络数值均衡以及批规范化和ReLU非线性激活组合信息特点的压缩加速方法,只需对预训练网络模型权值进行调整即可达到较好的压缩加速效果.该方法适合在FPGA或ASIC这类定制硬件上实现,并能够实现硬件逻辑资源、能耗、访存带宽以及物体检测精度之间的平衡.最后,在人脸检测任务上验证了该卷积神经网络低位宽量化推理方法的有效性.
作者:付强姜晶菲窦勇
作者单位:国防科技大学计算机学院长沙410073
母体文献:第二十三届计算机工程与工艺年会论文集
会议名称:第二十三届计算机工程与工艺年会
会议时间:2019年8月15日
会议地点:湖北恩施
主办单位:中国计算机学会
语种:chi
分类号:
关键词:卷积神经网络 数值均衡 批规范化 非线性激活组合信息 压缩加速 量化推理
在线出版日期:2022年1月20日
基金项目:
相似文献
相关博文
- 文件大小:
- 733.73 KB
- 下载次数:
- 60
-
高速下载
|
|