基于空间注意力及条件增强的文本生成图像方法

马军, 车进, 贺愉婷, 马鹏森

山东大学学报(工学版) ›› 2024, Vol. 54 ›› Issue (06) : 49 -56.

PDF
山东大学学报(工学版) ›› 2024, Vol. 54 ›› Issue (06) : 49 -56.

基于空间注意力及条件增强的文本生成图像方法

    马军, 车进, 贺愉婷, 马鹏森
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对文本生成图像语义不一致、训练不稳定、生成图像单一等问题,在一种简单有效的文本生成图像基准模型上提出基于空间注意力及条件增强的文本生成图像模型。为提高训练过程的稳定性、增加生成图像的多样性,在原有模型基础上增加条件增强模型;从文本分布出发拟合图像分布,增加视觉特征的多样性,扩大表现空间,在原有的DF-Block模块中增加一层Affine仿射块。在判别器中加入空间注意力模型,提高文本与合成图像的语义一致性。试验结果表明,在CUB和Oxford-102数据集上,初始得分分别提高了2.05%和2.63%;在CUB和COCO数据集上,特征空间距离分别降低了20.73%和9.25%。本研究提出的模型生成的图像更具多样性且更接近真实图像。

关键词

文本生成图像 / DF-GAN / 条件增强模型 / Affine仿射块 / 空间注意力模型

Key words

引用本文

引用格式 ▾
基于空间注意力及条件增强的文本生成图像方法[J]. 山东大学学报(工学版), 2024, 54(06): 49-56 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

60

访问

0

被引

详细

导航
相关文章

AI思维导图

/