文档名:智能嵌入式技术及应用开发
对于输入数据量比较大的网络层,因为数据大,那么计算过程中所需要访问的内存就会大。而对于内存的访问模式是可以根据计算过程来提前了解到的。所以可以将计算的输入数据(输入特征图和卷积核)的内存根据计算过程中的内存访问模式来重排,增强访存的局部性,提高cache命中率,减少内存延迟对CPU计算的影响。
作者:毕盛
作者单位:华南理工大学计算机科学与工程学院
母体文献:2019年中国嵌入式技术大会论文集
会议名称:2019年中国嵌入式技术大会
会议时间:2019年12月19日
会议地点:深圳
主办单位:博闻创意(深圳)会展公司,嵌入式系统联谊会,电子圈
语种:chi
分类号:
关键词:人工智能 嵌入式技术 软件开发 深度学习
在线出版日期:2022年9月21日
基金项目:
相似文献
相关博文
|
|