返回列表 发布新帖

MapReduce并行加速数据流多模式相似性搜索

11 0
admin 发表于 2024-12-9 12:37 | 查看全部 阅读模式

MapReduce并行加速数据流多模式相似性搜索.pdf
设计时间序列数据在Hadoop分布式文件系统(HDFS)中的有效存储方式,利用分布式缓存工具DistributedCache将各子序列分发到Hadoop集群的计算节点上,将动态时间弯曲距离矩阵划分成多个子矩阵,采取并行迭代计算每条反对角线上子矩阵的方法,基于MapReduce编程模型,实现高效并行计算时间序列动态弯曲距离,通过改进剪裁冗余计算方法,设计实现一种数据流多模式相似性搜索并行算法.中国雪深长时间序列数据集的实验结果表明,当每条时间序列的长度达到5000以上时,并行计算动态弯曲距离所需时间少于串行计算所需时间,当每条时间序列的长度达到9000以上时,参与计算的集群节点越多,并行计算所需时间越少;当模式长度达到4000、参与计算的集群节点数达5个以上时,从数据流中并行搜索出与模式匹配的相似子序列所需时间约为串行搜索所需时间的20%.
作者:付晨 钟诚 叶波
作者单位:广西大学计算机与电子信息学院,南宁530004广西科技信息网络中心,南宁530012
母体文献:2016年全国开放式分布与并行计算学术年会论文集
会议名称:2016年全国开放式分布与并行计算学术年会  
会议时间:2016年8月19日
会议地点:南宁
主办单位:中国计算机学会
语种:chi
分类号:
关键词:数据流  时间序列  并行搜索  模式匹配
在线出版日期:2019年4月24日
基金项目:
相似文献
相关博文
2024-12-9 12:37 上传
文件大小:
3.19 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表