文档名:自然语言显式命题自动识别和解析方法
自然语言中包含很多显式命题,正确理解这些命题是理解文本信息的关键.正确识别显式命题并解析其中的关键成分有助于理清语言中的逻辑关系、辅助自然语言理解.该文基于百度百科数据构建了自然语言显式命题标注数据集,并提出两个研究任务:自然语言显式命题自动识别和命题关键成分解析.其中,显式命题自动识别任务判断一个自然语言句子是否是命题;命题解析任务从已获取的命题中解析出支撑该命题成立的重要成分.针对任务一,构建基于BERT的二分类模型;针对任务二,构建基于BERT-BiLSTM-CRF的序列标注模型.实验结果表明,模型在任务一的正确率达到74.90%,超过基线模型15.25%;在任务二的F值达到90.74%,超过基线模型17.69%.该文为下一步研究提供了可靠的标注数据集和基线方法.
作者:刘璐彭诗雅玉郴于东
作者单位:北京语言大学信息科学学院,北京100083
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:自然语言 显式命题 自动识别 关键成分解析
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 669.72 KB
- 下载次数:
- 60
-
高速下载
|
|