文档名:基于LLVM实现尾循环向量化
SIMD体系结构呈现向量长度越来越长的发展趋势,允许同时以向量方式处理更多的数据;但是,循环向量化会产生更多的循环尾部指令无法向量化.为了更有效地利用SIMD,本文提出了尾循环向量化方法,通过掩码存取访问内存数据和向量填充方法,基于LLVM实现尾循环的向量化.实验结果表明方法有效,对TSVC测试程序最高可获得1.85倍加速效果,对SPEC2006应用最高达到1.05倍加速.
作者:黄亚斌李春江冯璐霞
作者单位:湖南省长沙市国防科学技术大学计算机学院410073
母体文献:第二十届计算机工程与工艺年会暨第六届微处理器技术论坛论文集
会议名称:第二十届计算机工程与工艺年会暨第六届微处理器技术论坛
会议时间:2016年8月10日
会议地点:西安
主办单位:中国计算机学会
语种:chi
分类号:TP3U46
关键词:处理器 单指令多数据 尾循环向量化 底层虚拟机
在线出版日期:2017年10月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 1.77 MB
- 下载次数:
- 60
-
高速下载
|
|