文档名:基于非对称孪生网络的新闻与案件相关性分析
新闻与案件的相关性分析是法律领域新闻舆情分析的重要环节,可转化为新闻文本与案件文本的相似度计算任务.借助孪生网络计算文本相似度是一种有效途径,其对平衡样本具有良好的学习能力,但在新闻与案件的相关性计算中面临文本不平衡和新闻文本冗余的问题,因此,提出了基于非对称孪生网络的新闻与案件相关性计算方法.通过计算文本中句子与标题的相似度选取与新闻标题最相关的句子表征文档,去除新闻文本中的冗余句子,利用非对称孪生网络建模,考虑到案件要素蕴含案件的关键语义信息,将案件要素作为监督信息融入到非对称孪生网络中对新闻文档和案件描述进行编码,解决新闻和案件在结构和语义上不平衡的问题,最终实现新闻与案件的相关性判断.实验表明建立的模型相比基线模型准确率提升了2.5%.
作者:赵承鼎郭军军余正涛黄于欣刘权宋燃
作者单位:昆明理工大学信息工程与自动化学院,云南昆明650500;昆明理工大学云南省人工智能重点实验室,云南昆明650500
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:新闻文本 案件文本 相似度计算 非对称孪生网络
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 561.72 KB
- 下载次数:
- 60
-
高速下载
|
|