文档名:基于覆盖模式的频繁子树挖掘方法
无序树常用于半结构化数据建模,对其进行频繁子树挖掘有利于发现隐藏的知识.传统的频繁子树挖掘方法常常输出大规模且带有冗余信息的频繁子树,这样的输出结果会降低后续操作的效率.针对传统方法的不足,提出了一种用于挖掘覆盖模式(MCRP)算法.首先,采用宽度孩子数编码对树进行编码;然后,通过基于最大前缀编码序列的边扩展方式生成所有的候选子树;最后,在频繁子树集和δ'-覆盖概念的基础上输出覆盖模式集.与传统的挖掘频繁闭树模式和极大频繁树模式的算法相比,该算法能够在保留所有频繁子树信息的情况下输出更少的频繁子树,并且将处理效率提高15%到25%.实验结果表明,所提算法能有效减小输出频繁子树的规模,减少冗余信息,在实际操作中具有较高的可行性.
作者:夏英李洪旭
作者单位:重庆邮电大学计算机科学与技术学院,重庆400065
母体文献:第十七届中国Rough集与软计算学术会议、第十一届中国Web智能学术研讨会、第十一届中国粒计算研讨会及第五届三支决策学术会议联合会议(CRSSC-CWI-CGrC-3WD2017)论文集
会议名称:第十七届中国Rough集与软计算学术会议、第十一届中国Web智能学术研讨会、第十一届中国粒计算研讨会及第五届三支决策学术会议联合会议(CRSSC-CWI-CGrC-3WD2017)
会议时间:2017年5月26日
会议地点:合肥
主办单位:中国计算机学会,中国人工智能学会
语种:chi
分类号:
关键词:频繁子树 数据挖掘 前缀编码 覆盖模式
在线出版日期:2018年7月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 844.88 KB
- 下载次数:
- 60
-
高速下载
|
|