CRF与规则相结合的维吾尔文地名识别研究.pdf
通过维吾尔文地名的分析研究,提出了一种基于条件随机场和规则的维吾尔文地名识别方法.根据维吾尔文地名黏着性、音译等特点,针对维吾尔文地名识别任务,在词汇和词性特征基础之上,引入音节、词向量获取的相似单词、常用地名词典、地名特征词、地名词缀等特征进行实验,结果表明这些特征对识别性能有较大的影响.通过对错误识别结果分析,提出了基于规则的后处理,进一步提高了识别性能,准确率达到94.68%,召回率达到89.52%,F值达到92.03%.
作者:买合木提·买买提卡哈尔江·阿比的热西提艾山·吾买尔吐尔根·依布拉音王路路
作者单位:新疆大学信息科学与工程学院,新疆乌鲁木齐830046;新疆多语种信息技术重点实验室,新疆乌鲁木齐830046
母体文献:第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会论文集
会议名称:第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
会议时间:2017年10月13日
会议地点:南京
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:命名实体 维吾尔文 地名识别 条件随机场 词向量
在线出版日期:2020年7月21日
基金项目:
相似文献
相关博文
- 文件大小:
- 915.7 KB
- 下载次数:
- 60
-
高速下载
|
|