返回列表 发布新帖

基于多核DSP的矢量高效QR分解技术

6 0
admin 发表于 2024-12-14 12:02 | 查看全部 阅读模式

文档名:基于多核DSP的矢量高效QR分解技术
摘要:以多核数字信号处理器(DigitalSignalProcessor,DSP)作为计算节点的多核DSP集群系统成为一大发展趋势.当前阶段,由于多核DSP内核硬件资源利用不充分与访存带宽限制,峰值性能与实际性能间存在鸿沟.基于C66x内核丰富的指令集架构以及运算指令编排原则,结合编译器提供的汇编信息,设计并优化了QR分解算法,在充分挖掘DSP单核性能极致的同时减少了矩阵分解的计算时间.根据掌握的优化技术,设计并实现基于多核DSP集群系统的大规模并行QR分解模型,并在分布式计算框架上完成了分解任务.分析结果表明,优化后的QR分解计算效率以及C66x单核硬件资源使用率均提升了二十余倍,随着待分解矩阵规模的成倍增加,多核DSP集群相比于单核的计算性能提升也愈加明显.

作者:张宇帆   陈颖   方科   费霞 Author:ZHANGYufan   CHENYing   FANGKe   FEIXia
作者单位:中国西南电子科技研究所,成都610036敏捷智能计算四川省重点实验室,成都610036
刊名:电讯技术 ISTICPKU
Journal:TelecommunicationEngineering
年,卷(期):2023, 63(4)
分类号:TN911.72
关键词:多核数字信号处理器(DSP)  QR分解  软件优化  分布式计算  
机标分类号:TP311.52TN915.02TP273
在线出版日期:2023年5月5日
基金项目:基于多核DSP的矢量高效QR分解技术[
期刊论文]  电讯技术--2023, 63(4)张宇帆  陈颖  方科  费霞以多核数字信号处理器(DigitalSignalProcessor,DSP)作为计算节点的多核DSP集群系统成为一大发展趋势.当前阶段,由于多核DSP内核硬件资源利用不充分与访存带宽限制,峰值性能与实际性能间存在鸿沟.基于C66x内核丰富的指...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        基于多核DSP的矢量高效QR分解技术  High Efficient QR Decomposition by Vector Technology on Multi-core DSP

基于多核DSP的矢量高效QR分解技术.pdf
2024-12-14 12:02 上传
文件大小:
3.17 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表