文档名:基于BiLSTMCRF模型的蒙古文形态素切分方法
蒙古文形态素切分是蒙古文自然语言处理的核心任务之一.该文针对传统蒙古文的构词特点,提出了一种新的蒙古文形态素标注方法,在蒙古文天然的词边界划分基础上,进一步将形态素进行划分.相比传统的蒙古文词切分方法,本文重点研究构词成分的形态素单元切分,提出的方法在充分学习蒙古文词和字知识的同时,通过自动学习蒙古语构词的形态素成分上的语言学知识,能够更加有效地捕捉形态素单元上的语义信息.该文使用新标注方法并基于Bi-LSTM-CRF模型构建了蒙古文形态素切分系统,显著提高了蒙古文形态素切分的精度.
作者:吴都徐金安陈钰枫张颖陈圣爱张玉洁
作者单位:北京交通大学计算机与信息技术学院,北京100044
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:U46TH1
关键词:蒙古文 形态素切分 Bi-LSTM-CRF模型
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 1.03 MB
- 下载次数:
- 60
-
高速下载
|
|