文档名:汉语复合名词短语语义关系知识库构建与自动识别研究
汉语复合名词短语因其使用范围广泛、结构独特、内部语义复杂的特点,一直是语言学分析和中文信息处理领域的重要研究对象.国内关于复合名词短语的语言资源极其匮乏,且现有知识库只研究名名复合形式的短语,包含动词的复合名词短语的知识库构建仍处于空白阶段,同时现有的复合名词短语知识库大部分脱离了语境,没有句子级别的信息.针对这一现状,该文从多个领域搜集语料,建立了一套新的语义关系体系,标注构建了一个具有相当规模的带有句子信息的复合名词语义关系知识库.该库的标注重点是标注句子中复合名词短语的边界以及短语内部成分之间的语义关系,总共收录27007条句子.该文对标注后的知识库做了详细的计量统计分析.最后基于标注得到的知识库,该文使用基线模型对复合名词短语进行了自动定界和语义分类实验,并对实验结果和未来可能的改进方向做了总结分析.
作者:张文敏李华勇邵艳秋
作者单位:北京语言大学信息科学学院,北京100083
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:汉语复合名词短语 语义关系体系 知识库 定界识别
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 1.15 MB
- 下载次数:
- 60
-
高速下载
|
|