文档摘要:为了自动识别出博主的专业兴趣活动,提出了一种基于LDA的专业个人微博事件提取算法.该算法利用改进的TF-IDF来提取特征词以及采用LDA为语料库建模,以此来挖掘出不同主题和词之间的关系,使得权重较大的词更能反映出微博主题.进一步得到了微博在各主题下的概率分布,并结合时间相似度来计算微博之间的综合相似度,最后通过改进的K-Means聚类并与人工数据作比对.实验结果验证了该算法的有效性,同时表明了该算法可以有结构、有条理的呈现出人们感兴趣的微博事件.
作者:高永兵 熊振华Author:GAOYong-bing XIONGZhen-hua
作者单位:内蒙古科技大学信息工程学院,内蒙古包头,014010
刊名:内蒙古科技大学学报
Journal:JournalofInnerMongoliaUniversityofScienceandTechnology
年,卷(期):2015, 34(3)
分类号:TP399
关键词:专业个人微博 LDA 相似度 事件提取
机标分类号:TP3G71
在线出版日期:2015年11月26日
基金项目:基于LDA的专业个人微博事件提取[
期刊论文] 内蒙古科技大学学报--2015, 34(3)高永兵 熊振华为了自动识别出博主的专业兴趣活动,提出了一种基于LDA的专业个人微博事件提取算法.该算法利用改进的TF-IDF来提取特征词以及采用LDA为语料库建模,以此来挖掘出不同主题和词之间的关系,使得权重较大的词更能反映出微博主...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
关键词:
- 文件大小:
- 2.52 MB
- 下载次数:
- 60
-
高速下载
|
|