返回列表 发布新帖

基于多文本描述的图像生成方法

7 0
admin 发表于 2024-12-14 11:59 | 查看全部 阅读模式

文档名:基于多文本描述的图像生成方法
摘要:针对单条文本描述生成的图像质量不高且存在结构错误的问题进行研究,采用多阶段生成对抗网络模型,并提出对不同文本序列进行插值操作,从多条文本描述中提取特征,以丰富给定的文本描述,使生成图像具有更多细节.为了生成与文本更为相关的图像,引入了多文本深度注意多模态相似度模型以得到注意力特征,并与上一层视觉特征联合作为下一层的输入,从而提升生成图像的真实程度和文本描述之间的语义一致性.为了能够让模型学会协调每个位置的细节,引入了自注意力机制,让生成器生成更加符合真实场景的图像.优化后的模型在CUB和MS-COCO数据集上进行验证,生成的图像不仅结构完整,语义一致性更强,视觉上的效果更加丰富多样.

Abstract:Aimingatthechallengesassociateswiththelowqualityandstructuralerrorsexistedintheimagesgener-atedbyasingletextdescription,amulti-stagegenerativeadversarialnetworkmodelwasusedtostudy,anditwaspro-posedtointerpolatedifferenttextsequencestoenrichthegiventextdescriptionsbyextractingfeaturesfrommultipletextdescriptionsandimpartinggreaterdetailtothegeneratedimages.Inordertoenhancethecorrelationbetweenthegeneratedimagesandthecorrespondingtext,amulti-captionsdeepattentionalmulti-modalsimilaritymodelthatcap-turedattentionfeatureswasintroduced.Thesefeaturesweresubsequentlyintegratedwithvisualfeaturesfromthepre-cedinglayer,servingasinputforthesubsequentlayer.Thisintegrationimprovedtherealismofthegeneratedimagesandenhancedtheirsemanticconsistencywiththetextdescriptions.Inaddition,aself-attentionmechanismtoenablethemodeltoeffectivelycoordinatethedetailsateachpositionwasincorporated,resultinginimagesthatweremorealignedwithreal-worldscenarios.TheoptimizedmodelwasverifiedontheCUBandMS-COCOdatasets,demon-stratingthegenerationofimageswithintactstructures,strongersemanticconsistency,andrichervisualdiversity.

作者:聂开琴  倪郑威Author:NIEKaiqin  NIZhengwei
作者单位:浙江工商大学信息与电子工程学院,浙江杭州310018
刊名:电信科学 ISTICPKU
Journal:TelecommunicationsScience
年,卷(期):2024, 40(5)
分类号:TP183
关键词:文本生成图像  生成对抗网络  计算机视觉  语义一致性  自注意力  
Keywords:text-to-image  generativeadversarialnetwork  computervision  semanticconsistency  self-attention  
机标分类号:TP391.41TN911.73TP183
在线出版日期:2024年7月1日
基金项目:基于多文本描述的图像生成方法[
期刊论文]  电信科学--2024, 40(5)聂开琴  倪郑威针对单条文本描述生成的图像质量不高且存在结构错误的问题进行研究,采用多阶段生成对抗网络模型,并提出对不同文本序列进行插值操作,从多条文本描述中提取特征,以丰富给定的文本描述,使生成图像具有更多细节.为了生成与...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        基于多文本描述的图像生成方法  Image synthesis method based on multiple text description

基于多文本描述的图像生成方法.pdf
2024-12-14 11:59 上传
文件大小:
28.35 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表