文档名:基于远程监督的藏文实体关系抽取
关系抽取任务是对句子中的实体对进行关系分类.远程监督用于关系抽取是用预先构建的知识库来对齐朴素文本,自动标注数据,在一定程度上减少了人工标注的成本,因而可以用在缺少训练语料的藏文领域.但是基于远程监督的实体关系抽取还存在错误标记,提取特征时出现噪声等问题.本文用远程监督方法进行藏文实体关系抽取,基于已经构建的藏文知识库,利用分段卷积神经网络结构,加入语言模型和注意力机制来改善语义歧义问题以及学习句子的信息;在训练过程中加入联合得分函数来动态修正错误标签问题.实验结果表明改进的模型有效提高了藏文实体关系的准确率,且优于基线模型效果.
作者:王丽客孙媛夏天赐
作者单位:中央民族大学信息工程学院,北京100081;中央民族大学国家语言资源监测与研究中心少数民族语言分中心,北京100081
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:藏文 实体关系抽取 远程监督 分段卷积神经网络 语言模型 注意力机制
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 685.91 KB
- 下载次数:
- 60
-
高速下载
|
|