文档名:基于句法树的藏语最长名词短语识别
最长名词短语携带着丰富的句法和语义信息,经常与句法成分对应,在句子中充当一定的语义角色.最长名词短语识别在自然语言处理中占重要地位,是分析和理解句子结构和意义的基础.本文通过梳理不同概念的最长名词短语的含义,从句法树角度界定了藏语最长名词短语的基本概念;从句法树库中抽取6038个句子,分析了最长名词短语的结构类型、边界特征和出现频次,最后采用序列标注模型和句法分析模型对最长名词短语进行识别.序列标注模型识别结果的正确率、召回率和F1值分别为87.14%、84.72%、85.92%.句法分析模型识别结果的正确率、召回率、F1值分别为85.02%、84.51%、84.76%.
作者:龙从军 刘汇丹 周毛克
作者单位:中国社会科学院民族学与人类学研究所,北京100081中国科学院软件研究所,北京100190中国社会科学院研究生院,北京100081
母体文献:第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL2018)论文集
会议名称:第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL2018)
会议时间:2018年10月19日
会议地点:长沙
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:藏语识别 最长名词短语 句法树
在线出版日期:2021年9月13日
基金项目:
相似文献
相关博文
- 文件大小:
- 720.44 KB
- 下载次数:
- 60
-
高速下载
|
|