文档名:稀疏数据频繁项集挖掘算法研究综述
频繁项集挖掘(FrequentItemsetMining,FIM)是最重要的数据挖掘任务之一,被挖掘数据集的特征对FIM算法的性能有着显著影响.在大数据时代,稀疏是大数据的典型特征之一,对传统FIM算法的性能带来严峻挑战.针对在稀疏数据中如何高效进行FIM的问题,本文从稀疏数据的特征出发,分析了稀疏数据对三种类型FIM算法性能的主要影响,对已经提出的稀疏数据FIM算法进行了综述,对算法中采用的优化策略进行了讨论,最后通过实验对代表性的稀疏数据FIM算法进行了性能分析.实验结果表明,采用伪构造策略的模式增长算法最适合用于稀疏数据的FIM,该算法在运算时间和存储空间上比其他算法具有较大的优势.
作者:肖文胡娟
作者单位:河海大学文天学院,安徽马鞍山243031
母体文献:第六届中国计算机学会大数据学术会议论文集
会议名称:第六届中国计算机学会大数据学术会议
会议时间:2018年10月11日
会议地点:西安
主办单位:中国计算机学会
语种:chi
分类号:
关键词:稀疏数据 频繁项集挖掘 伪构造策略
在线出版日期:2020年11月30日
基金项目:
相似文献
相关博文
- 文件大小:
- 820.93 KB
- 下载次数:
- 60
-
高速下载
|
|