返回列表 发布新帖

基于Kspectrum的下一代测序数据的纠错算法分析

7 0
admin 发表于 2024-12-10 13:09 | 查看全部 阅读模式

文档名:基于Kspectrum的下一代测序数据的纠错算法分析
目的:对现有的下一代测序(NextGenerationSequencing,NGS)纠错算法和工具进行分析,提出基于Hadoop平台的纠错算法,以解决大数据处理中计算机内存不足和运行时间长的问题,提升纠错性能.方法:使用特定的数据对现有的基于K-spectrum的纠错算法进行测试,对各纠错工具的运行时间、内存峰值和纠错结果进行比较来衡量纠错工具的性能.在此基础上提出Hadoop分布式并行纠错算法(Parallelalgorithm),并与串行程序、Lighter和Racer进行比较,分析分布式并行实现的可行性.结果:现有的基于K-spectrum的纠错工具普遍存在较大的内存消耗现象,其中Racer和Sga的纠错效果较好.而Hadoop分布式并行纠错算法对计算机单机内存的消耗较低,当数据量超过一定值时,并行分布式程序的运算时间比串行单机程序明显减少.结论:本研究提出的Hadoop分布式并行纠错算法不仅降低了内存消耗,而且提高了运算性能,更有利于大规模基因数据的分析处理.
作者:赖德焕 陈庆锋 黄丽宇 梁家海
作者单位:广西大学计算机与电子信息学院,广西南宁530004广西大学计算机与电子信息学院,广西南宁530004;广西大学亚热带农业生物资源保护与利用国家重点实验室,广西南宁530004广西大学信息网络中心,广西南宁530004钦州学院电子与信息工程学院,广西钦州535000
母体文献:广西计算机学会成立30周年庆典暨2016年学术年会论文集
会议名称:广西计算机学会成立30周年庆典暨2016年学术年会  
会议时间:2016年11月26日
会议地点:南宁
主办单位:广西计算机学会
语种:chi
分类号:
关键词:下一代测序  大数据处理  纠错算法  Hadoop分布式并行运算
在线出版日期:2019年6月26日
基金项目:
相似文献
相关博文
2024-12-10 13:09 上传
文件大小:
1.34 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表