CNN图像标题生成.pdf
图像标题生成是人工智能领域一个非常有挑战性的任务,该任务需要在给定一张图片的情况下能够生成与它内容相符的标题句子.它需要同时处理图像和文本两个模态的数据,并发现不同数据彼此间的关联.针对该任务通常采用一个编码器-解码器模型来解决,编码器则通常利用RNN网络来处理文本数据、CNN网络来处理图像数据.而本文则提出一个完全基于CNN的模型来同时处理两个模态的数据,通过在Flickr8k和Flickr30k数据上进行实验,实验结果表明了该模型的有效性,由于该模型是可并行运算的,在运行效率也有所提升.
作者:李勇成红红梁新彦郭倩钱宇华
作者单位:山西大学大数据科学与产业研究院,山西太原030006;山西大学计算智能与中文信息处理教育部重点实验室,山西太原030006;山西大学计算机与信息技术学院,山西太原030006
母体文献:第六届中国计算机学会大数据学术会议论文集
会议名称:第六届中国计算机学会大数据学术会议
会议时间:2018年10月11日
会议地点:西安
主办单位:中国计算机学会
语种:chi
分类号:
关键词:图像标题生成 多模态数据 卷积神经网络 特征提取
在线出版日期:2020年11月30日
基金项目:
相似文献
相关博文
- 文件大小:
- 894.78 KB
- 下载次数:
- 60
-
高速下载
|
|