文档名:数据流上基于可伸缩模式的潜在语义事件发现
随着大数据时代的来临,人类社会产生了大量的数据,这些数据反映了人们的生活习惯、社会规律以及自然规律.数据流作为大数据最重要的表现形式之一,应用的范围非常广泛.在实际的数据流应用领域中,连续数据点组成的波段往往更具领域价值,因为单个数据点仅仅表示了值的变化,而波段则是在宏观层次上展示了丰富的语义,因此以模式(波段)为粒度来表达数据流显得尤为重要.虽然各个领域的数据流表现复杂,但是都有一定规律可循,如何从复杂的数据流中获取知识,一直是数据挖掘研究领域的热点与挑战,挖掘和预测数据流中隐含的数据模式及领域价值具有重要的理论和现实意义.基于SP-Tree挖掘的可伸缩模式,提出了Pattern2vec的方法,将可伸缩模式向量化,从而利用向量来发现数据流上潜在的隐含语义,完成分类工作.在医疗和电力数据开展实验,实验结果表明Pattern2vec相比其他对比方法,具有更好的分类表现.
作者:邱镇 刘迪 王琪媛
作者单位:国网信息通信产业集团有限公司北京102211国网节能设计研究院北京100052
母体文献:第六届中国计算机学会大数据学术会议论文集
会议名称:第六届中国计算机学会大数据学术会议
会议时间:2018年10月11日
会议地点:西安
主办单位:中国计算机学会
语种:chi
分类号:
关键词:数据挖掘 可伸缩模式 隐含语义 分类精度
在线出版日期:2020年11月30日
基金项目:
相似文献
相关博文
- 文件大小:
- 1.09 MB
- 下载次数:
- 60
-
高速下载
|
|