文档名:基于门控化上下文感知网络的词语释义生成方法
传统的词典编纂工作主要采用人工编纂的方式,效率较低且耗费大量的资源.为减少人工编纂的时间和经济成本,本文提出一种基于门控化上下文感知网络的词语释义生成方法,利用门控循环神经网络(GRU)对词语释义生成过程进行建模,自动为目标词生成词语释义.该模型基于编码器-解码器架构.编码器首先利用双向GRU对目标词的上下文进行编码,并采用不同的匹配策略进行目标词与上下文的交互,结合注意力机制分别从粗粒度和细粒度两个层次将上下文信息融合到目标词的向量表示中,最终获得目标词在特定语境中的编码向量.解码器则同时基于目标词的语境与语义信息为目标词生成上下文相关的词语释义.此外,通过向模型提供目标词字符级特征信息,进一步提高了生成释义的质量.在英文牛津词典数据集上进行的实验表明,本文提出的方法能够生成易于阅读和理解的词语释义,在释义建模的困惑度和生成释义的BLEU值上分别超出此前模型4.45和2.19,具有显著提升.
作者:张海同 孔存良 何姗 杨麟儿 杜永萍 杨尔弘
作者单位:北京工业大学信息学部,北京100124;北京语言大学语言资源高精尖创新中心,北京100083北京语言大学语言资源高精尖创新中心,北京100083;北京语言大学信息科学学院,北京100083云南师范大学华文学院国际汉语教育学院,昆明650500北京工业大学信息学部,北京100124
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:英语 释义生成 上下文感知网络 门控循环神经网络
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 852.89 KB
- 下载次数:
- 60
-
高速下载
|
|