文档名:基于词分布式表征的汉语框架排歧模型
框架排歧是根据句子中目标词的上下文语境,从框架库中为该目标词自动选择一个合适的框架.该任务在一定程度上解决了动词中一词多义的现象.本文基于词语及句子的分布式表征,提出了基于距离和基于词语相似度矩阵的框架排歧模型.与传统方法相比,本模型有效避免了人工选择特征,克服了特征空间维度过高、特征之间没有关联性等缺点,使框架排歧的准确率达到65.71%.并与当前最好的模型,进行显著性和一致性检验,进一步验证了词分布式表征对框架排歧任务的有效性.
作者:张力文 王瑞波 李茹 张晟
作者单位:山西大学计算机与信息技术学院,山西太原030006山西大学计算机与信息技术学院,山西太原030006;山西大学软件学院,山西太原030006山西大学计算机与信息技术学院,山西太原030006;山西大学计算智能与中文信息处理教育部重点实验室,山西太原030006;山西省大数据挖掘与智能技术协同创新中心,山西太原030006
母体文献:第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会论文集
会议名称:第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
会议时间:2017年10月13日
会议地点:南京
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:汉语词汇 框架排歧 分布式表征
在线出版日期:2020年7月21日
基金项目:
相似文献
相关博文
- 文件大小:
- 425.74 KB
- 下载次数:
- 60
-
高速下载
|
|