返回列表 发布新帖

多模态检索数据增强方法研究

16 0
1 黄金阳光 发表于 2024-10-3 23:53 | 查看全部 阅读模式
文档摘要:多模态检索领域中,基于Transformer的多模态模型因其强大的推理能力和高精度的检索效果而备受关注,该模型通常采用预训练和微调的方法进行训练.微调过程使用更大规模数据集可以提高检索精度,构建大规模有标注数据集需要耗费大量人力物力,因此本文提出了3个数据增强方法,即概念增强、EDA搭配回译、图文标签化来扩大数据集规模,从而提升多模态模型检索精度.实验结果表明,使用这3种方法和3种方法的组合对训练数据进行增强,3个多模态检索模型的图文检索精度均有所提升.

Abstract:Inthefieldofmultimodalretrieval,Transformerbasedmultimodalmodelshaveattractedmuchattentionduetotheirpowerfulreasoningabilityandhigh-precisionretrievalresults.Thesemodelsareusuallytrainedusingpretrainingandfine-tuningmethods.Thefine-tuningprocessusinglargerdatasetscanimproveretrievalaccuracy.Buildinglarge-scaleannotateddatasetsrequiresalotofmanpowerandmaterialresources.Therefore,weproposesthreedataaugmentationmethods,namelyconceptaugmentation,EDAcombinedwithbacktranslation,andimagetextlabeling,toexpandthesizeofthedatasetandimprovetheretrievalaccuracyofmultimodalmodels.Theexperimentalresultsshowthatusingthesethreemethodsandtheircombinationtoenhancethetrainingdata,theimageandtextretrievalaccuracyofthethreemultimodalretrievalmodelshasbeenimproved.

作者:吴强Author:WUQiang
作者单位:东华大学计算机科学与技术学院,上海201620
刊名:智能计算机与应用
Journal:IntelligentComputerandApplications
年,卷(期):2024, 14(7)
分类号:TP399
关键词:多模态模型  数据增强  检索精度  
Keywords:multimodalretrieval  dataaugmentation  retrievalaccuracy  
机标分类号:TP391A849TP183
在线出版日期:2024年7月22日
基金项目:多模态检索数据增强方法研究[
期刊论文]  智能计算机与应用--2024, 14(7)吴强多模态检索领域中,基于Transformer的多模态模型因其强大的推理能力和高精度的检索效果而备受关注,该模型通常采用预训练和微调的方法进行训练.微调过程使用更大规模数据集可以提高检索精度,构建大规模有标注数据集需要...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

关键词:多模态模型,数据增强,检索精度,

2024-10-3 23:53 上传
文件大小:
1.09 MB
下载次数:
0
附件售价:
1 下载券 [赞助会员免费下载]
本地下载 立即购买
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
  • 联系QQ客服
2022-2024 新资汇 - 参考资料分享下载网站
关灯 返回顶部
快速回复 返回顶部 返回列表