文档名:基于跨语言词向量模型的蒙汉查询词扩展方法研究
跨语言信息检索指用户以一种语言提问,检索出另一种或几种语言描述的信息资源的检索技术,是信息检索领域重要的研究方向之一.近年来,跨语言词向量为跨语言信息处理提供了良好的表示形式,受到很多学者的关注.该文利用跨语言词向量实现从汉文查询词到蒙古文查询词扩展和映射,并利用该文提出的串联式查询扩展、串联式查询扩展过滤、交叉验证过滤三种查询扩展方法在进行词向量映射时对候选的蒙古文查询词进行筛选和排序,选择符合上下文的蒙古文词语.实验结果表明:在蒙汉跨语言信息检索任务中引入交叉验证方法对检索结果有很大的提升.
作者:马路佳赵小兵赖文
作者单位:中央民族大学国家语言资源监测与研究少数民族语言中心,北京100081
母体文献:第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL2018)论文集
会议名称:第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL2018)
会议时间:2018年10月19日
会议地点:长沙
主办单位:中国中文信息学会
语种:chi
分类号:TP3TP1
关键词:跨语言信息检索 查询词扩展 跨语言词向量
在线出版日期:2021年9月13日
基金项目:
相似文献
相关博文
- 文件大小:
- 570.66 KB
- 下载次数:
- 60
-
高速下载
|
|