文档名:一种基于门控空洞卷积的高效中文命名实体识别方法
近年来,基于RNN的模型架构在命名实体识别任务中被广泛采用,但其循环特性导致无法GPU的并行计算能力无法被充分利用.普通一维卷积虽可以并行处理输入文本,显著缩短模型训练时长,但为对长距离依赖获得良好的建模效果,处理长文本时往往需要堆叠多个卷积层,进而增加梯度消失的风险.针对以上问题,本文采用可通过参数调节感受野范围的空洞卷积,并引入了带有残差连接的门控机制,以强化有效信息、降低无效信息的影响,同时改善梯度消失问题;针对字向量表示能力有限的问题,本文还将字向量与其所属词的位置信息融合,以丰富文本特征.为验证本文所提出方法的有效性,在MSRA数据集以及SinaResume数据集上进行了实验,F1值分别达到了92.97%与94.98%.与传统基于Bi-LSTM-CRF的命名实体识别模型相比,模型训练速度提升5~6倍,且表现优于一般的RNN架构.
作者:王笑月李茹段菲
作者单位:山西大学计算机科学与技术学院,山西太原030006
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:R31TP1
关键词:中文文本 命名实体识别 空洞卷积 门控机制
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 763.08 KB
- 下载次数:
- 60
-
高速下载
|
|