一种基于共词网络的社交媒体数据主题挖掘方法.pdf
对社交媒体所包含文本数据的深入挖掘,有利于有效地进行后续的时空分析.提出了一种新的基于共词网络的社交媒体数据主题挖掘方法,依据词频-逆文档频率分析,自动筛选出与主题相关的关键词汇,基于微博间是否包含相同的关键词汇,提出构建以微博为节点的共词网络,并结合Louvain社区探测算法进行文本主题挖掘.所提出的方法是一种无监督方法,且具有不需要指定聚类数目的优点.实验表明,该方法在主题挖掘表现上,准确率和召回率均优于常用的文档主题生成模型.以收集的2012年北京暴雨期间包含关键词的微博为例,利用提出的方法对微博数据集进行挖掘和时空分析,结果表明所提方法在实际应用中的有效性.
作者:王艳东 付小康 李萌萌
作者单位:武汉大学测绘遥感信息工程国家重点实验室,湖北武汉,430079;地球空间信息技术协同创新中心,湖北武汉,430079;东华理工大学测绘工程学院,江西南昌,330013武汉大学测绘遥感信息工程国家重点实验室,湖北武汉,430079
母体文献:2018测绘遥感高层论坛论文集
会议名称:2018测绘遥感高层论坛
会议时间:2018年12月1日
会议地点:武汉
主办单位:武汉大学
语种:chi
分类号:
关键词:社交媒体 文本数据 主题挖掘 共词网络
在线出版日期:2019年11月20日
基金项目:
相似文献
相关博文
- 文件大小:
- 1.86 MB
- 下载次数:
- 60
-
高速下载
|
|