文档名:基于深度神经网络的维吾尔文命名实体识别研究
现有的维吾尔文命名实体识别主要采用基于条件随机场的统计学习方法,但依赖于人工提取的特征工程和领域知识.针对该问题,该文提出了一种基于深度神经网络的学习方法,并引入不同的特征向量表示.首先利用大规模未标注语料训练的词向量模型获取每个单词具有语义信息的词向量;其次,利用Bi-LSTM提取单词的字符级向量;然后,利用直接串联法或注意力机制处理词向量和字符级向量,进一步获取联合向量表示;然后Bi-LSTM-CRF深度神经网络模型进行命名实体标注.实验结果表明,以基于注意力机制的联合向量表示作为输入的Bi-LSTM-CRF方法在维吾尔文命名实体识别上F值达到90.13%.
作者:王路路艾山·吾买尔吐尔根·依布拉音买合木提·买买提卡哈尔江·阿比的热西提
作者单位:新疆大学信息科学与工程学院,新疆乌鲁木齐830046;新疆大学新疆多语种信息技术实验室,新疆乌鲁木齐830046
母体文献:第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL2018)论文集
会议名称:第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL2018)
会议时间:2018年10月19日
会议地点:长沙
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:维吾尔文 命名实体识别 长短时记忆网络 条件随机场 注意力机制
在线出版日期:2021年9月13日
基金项目:
相似文献
相关博文
- 文件大小:
- 596.07 KB
- 下载次数:
- 60
-
高速下载
|
|