文档名:基于微博对话链的命名实体识别
伴随着因特网和信息产业的快速发展,微博已经成为一种新型的信息发布和传播的社交媒介,自然微博也为命名实体抽取提供了一个新的载体.本文针对微博数据的命名实体识别由于博文短小不足以提供抽取命名实体的足够信息的问题,提出一种基于微博对话链的中文微博命名实体识别方法.利用每条微博的评论扩充博文的上下文,选取词性、中国人名角色、地名角色、组织名角色4个特征,用条件随机场方法来抽取命名实体,主要识别博文中的人名、地名、组织名.在新浪微博数据上的实验结果表明该方法可以有效地提高微博中人名、地名、组织名的识别效果.
作者:尉舒舒
作者单位:国防科学技术大学,湖南,长沙,41000
母体文献:第十一届中国通信学会学术年会论文集
会议名称:第十一届中国通信学会学术年会
会议时间:2015年10月28日
会议地点:南昌
主办单位:中国通信学会
语种:chi
分类号:TP3TP1
关键词:社交网络 命名实体 汉字识别 对话链
在线出版日期:2018年3月21日
基金项目:
相似文献
相关博文
- 文件大小:
- 245.79 KB
- 下载次数:
- 60
-
高速下载
|
|