文档名:基于最长名词短语分治策略的神经机器翻译
神经机器翻译自兴起以来,不断给机器翻译领域带来振奋人心的消息.但神经机器翻译没有显式地利用语言学知识对句子结构进行分析,因此对结构复杂的长句翻译效果不佳.本文基于分治法的思想,识别并抽取句子中的最长名词短语,保留特殊标识或核心词与其余部分组成句子框架.通过神经机器翻译系统分别翻译最长名词短语和句子框架,再将译文重新组合的方法,缓解了神经机器翻译对句子长度敏感的问题.实验结果表明,本文提出的方法获得的译文与基线系统相比,BLEU分值提升了0.89.
作者:张学强蔡东风叶娜吴闯
作者单位:沈阳航空航天大学人机智能研究中心,辽宁沈阳110136
母体文献:第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会论文集
会议名称:第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
会议时间:2017年10月13日
会议地点:南京
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:神经机器翻译 最长名词短语 分治策略
在线出版日期:2020年7月21日
基金项目:
相似文献
相关博文
- 文件大小:
- 507.44 KB
- 下载次数:
- 60
-
高速下载
|
|