文档名:基于抽象语义表示的汉语构式的标注与分析
构式作为组成成分与实际意义不能完全对应的结构,与常规句子差异较大,对句法和语义分析器的影响较大,构式的自动分析则更是困难.因此,需要研究构式的内部结构标注与语料构建.由于构式的语义结构与句法结构有较大差异,使用中文抽象语义表示(CAMR)来直接标注构式的语义结构.目前收录最全的构式库是北京大学现代汉语构式知识库,通过对该构式库共1057条构式进行人工标注并统计后,发现CAMR可以表示出61.2%的基本符合组合原则的构式;而38.8%不符合组合原则的构式需要修改或添加概念,存在缺少概念、组成成分难以拆分、修辞意义难以表示等情况.该文给出的策略是将其整体作为一个谓词标注或只标注其表层义.汉语构式库的标注可以为构式语义的自动分析提供理论与数据基础.
作者:黄彤 李斌 闫培艺 戴玉玲 曲维光
作者单位:南京师范大学文学院,江苏南京210097南京师范大学文学院,江苏南京210097;哈佛大学计量社会科学研究所,剑桥美国02138南京师范大学计算机科学与技术学院,江苏南京210023
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:汉语构式 自动标注 抽象语义表示
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 935.28 KB
- 下载次数:
- 60
-
高速下载
|
|