基于选择状态空间的去噪扩散概率模型研究

山西大学学报(自然科学版) ›› 2025, Vol. 48 ›› Issue (01) : 120 -129.

PDF (55381KB)
山西大学学报(自然科学版) ›› 2025, Vol. 48 ›› Issue (01) : 120 -129. DOI: 10.13451/j.sxu.ns.2024140

基于选择状态空间的去噪扩散概率模型研究

作者信息 +

Author information +
文章历史 +
PDF (56709K)

摘要

针对去噪扩散概率模型(DDPM)的采样效率低、训练时间长和硬件资源开销大等问题,提出了选择状态空间的去噪扩散概率模型。该方法首先用选择状态空间模型(SSM)的动态选择性来提高DDPM在长序列上的采样效率;其次通过多方向扫描图像,使得DDPM扩散时获取更多有效的图像信息;最后利用SSM的线性时间复杂以及并行运算减少DDPM训练时的时间和硬件资源的开销。DDPM、改进的扩散模型(DDIM)、变分自编码器的去噪扩散概率模型(VAE-DDPM)、视觉Transformer的去噪扩散概率模型(VIT-DDPM)和本文方法在ImageNet和人脸图像数据集(FFHQ)数据集进行图像生成实验时,对不同分辨率图像的Frechet距离(FID)、结构相似性(SSIM)、峰值信噪比(PSNR)和生成时间等参数对比分析,本文方法生成128×128图像时FID、SSIM和PSNR的值分别提升了5.6%~22.6%、4.7%~15.5%和1.9%~6.6%,得出该方法能够有效解决DDPM的缺陷,并且优于其他扩散模型。

关键词

扩散模型 / 线性时间复杂度 / 多方向扫描

Key words

引用本文

引用格式 ▾
基于选择状态空间的去噪扩散概率模型研究[J]. 山西大学学报(自然科学版), 2025, 48(01): 120-129 DOI:10.13451/j.sxu.ns.2024140

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF (55381KB)

35

访问

0

被引

详细

导航
相关文章

AI思维导图

/