文档名:汉语委婉语语言资源建设
委婉语是语言交流中的不可或缺的交际手段,委婉语研究一直是语言学界的热门话题之一,但在自然语言处理领域,尚未有委婉语相关研究.该文借助现有纸质词典,基于语料库检索和专家人工判别的方式,初步构建了规模为63000余条语料的汉语委婉语语言资源;并根据自然语言处理的相关任务需求,结合词典释义对委婉语进行分类.该文提出了利用同类委婉语的上下文语境辅助进行标注的方法.经过实验,对简单语义的委婉语义判别的准确率达89.71%,对语义复杂的兼类委婉语判别准确率达74.65%,初步验证了利用计算机辅助人工标注构建委婉语语言资源的可能.
作者:张辰麟 王明文 谭亦鸣 肖文艳
作者单位:江西师范大学计算机信息工程学院,江西省南昌市330022东南大学网络空间安全学院,江苏省南京市210000
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:汉语委婉语 语义辨析 自动标注 上下文语境
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 734.51 KB
- 下载次数:
- 60
-
高速下载
|
|