文档名:基于知网相关概念场的中文词向量
词向量是词的低维稠密实数向量表示,在自然语言处理的各项任务中都扮演了重要角色.目前词向量大多都是通过构造神经网络模型,在大规模语料库上以无监督学习的方式训练得到,这样的模型存在着两个问题:低频词词向量的语义表示质量较差;忽视了知识库可以对该模型提供的帮助.该文提出了利用知网相关概念场来提升词向量语义表示质量的模型.实验结果表明,在词语相似度任务(ws297s)上该模型将GloVe词向量的斯皮尔曼相关性系数提高了10.29,在词语相关度任务(ws240r)上将SG词向量提高了3.39;在词语类比任务上将GloVe词向量的准确率提高了10.59个百分点.
作者:冯煜博 蔡东风 宋彦
作者单位:沈阳航空航天大学人机智能研究中心,辽宁沈阳110136创新工场,广东深圳518061
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:汉语 词向量 语义表示质量 概念场
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 742.25 KB
- 下载次数:
- 60
-
高速下载
|
|