文档名:基于深度学习的主题对齐模型研究
在主题深度表示学习的基础上,本文提出了一种融合双语词嵌入的主题对齐模型(TopicAlignmentModel,TAM),通过双语词嵌入扩充语义对齐词汇词典,在传统双语主题模型基础上设计辅助分布用于改进不同词分布的语义共享,以此改善跨语言和跨领域情境下的主题对齐效果;提出了两种新的指标,即双语主题相似度(BilingualTopicSimilarity,BTS)和双语对齐相似度(BilingualAlignmentSimilarity,BAS),用于评价辅助分布对齐的效果.在跨语言主题对齐任务中,相比于传统的对齐模型,双语对齐相似度提升了约1.5%;在跨领域主题对齐任务中,F1值提升了约10%.TAM模型在跨语言和跨领域主题对齐上的效果优于传统方法,研究结果对于改进跨语言和跨领域信息处理具有重要意义.
作者:余传明 原赛 胡莎莎 安璐
作者单位:中南财经政法大学信息与安全工程学院,湖北武汉430073中南财经政法大学统计与数学学院,湖北武汉430073武汉大学信息管理学院,湖北武汉430072
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:跨语言主题对齐 跨领域主题对齐 深度学习 双语词嵌入 知识对齐
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 893.89 KB
- 下载次数:
- 60
-
高速下载
|
|