融合对比学习和生成对抗网络的图像去雾算法

罗向龙; 魏欣语; 赵茂军; 刘若辰

doi:10.13229/j.cnki.jdxbgxb.20240111

吉林大学学报(工学版) ›› 2025, Vol. 55 ›› Issue (10) : 3296 -3308. DOI: 10.13229/j.cnki.jdxbgxb.20240111

计算机科学与技术

融合对比学习和生成对抗网络的图像去雾算法

罗向龙 ¹ ,
魏欣语 ¹ ,
赵茂军 ² ,
刘若辰 ¹

作者信息 +

Image dehazing algorithm based on contrast learning and generative adversarial network

Author information +

文章历史 +

PDF (2593K)

摘要

针对目前去雾算法依赖有雾、无雾图像对的局限，以及监督学习导致的成本消耗等问题，提出了一种基于对比学习和循环一致性生成对抗网络的图像去雾算法。首先，通过非成对的有雾图像和清晰图像训练循环一致性生成对抗网络，提高图像去雾算法在真实场景中的应用价值，缓解去雾算法的域偏移问题；其次，设计对比指导分支学习图像的潜在特征分布，隐式约束不同样本在深度特征空间中的嵌入信息，深入挖掘有雾图像和清晰图像的相似特征，拉近图像相似特征的距离，保留两类图像间的互信息，维持图像内容的一致性，提高网络去雾性能；然后，引入频率损失函数，约束生成器的输出，降低频域信息损失，进一步保留图像的内容和结构信息，减少去雾图像的模糊和失真，提高生成图像的质量和清晰度。实验结果表明，本文模型相比目前主流的基于深度学习的传统去雾算法，信息熵和平均梯度均有所提高，细节信息更丰富，是一种有效的图像去雾算法。

Abstract

Aiming at the limitations of some current defogging algorithms caused by using foggy and non-foggy image pairs and the cost consumption caused by supervised learning， this paper proposes an image defogging algorithm based on comparative learning and recurrent consistent generative adversarial network. By training recurrent generative adversarial network with unpaired foggy and clear images， the value of image defogging algorithm in real scenes is improved， and the domain shift problem of defogging algorithm is alleviated； meanwhile， we design the contrast-guided branch to learn the potential feature distribution of the image， implicitly constrain the embedding of different samples in the depth feature space， deeply mine the similar features of foggy and clear images， pull the similar characteristics of the images closer together， retain the mutual information between the two types of images， maintain the consistency of image content， and improve the performance of network defogging； introduce the frequency loss， constrain the output of the generator， reduce the loss of information in the frequency domain， further retain the content and structural information of the image， reduce the blurring and distortion of the defogged image， and improve the quality and clarity of the generated image. Experimental results show that the model proposed in this paper is an effective image defogging algorithm with improved information entropy and average gradient and richer detail information compared to the current mainstream deep learning-based and traditional defogging algorithms.

Graphical abstract

关键词

图像去雾 / 非成对图像 / 生成对抗网络 / 对比学习

Key words

image defogging / unpaired images / generative adversarial networks / contrast learning

引用本文

引用格式 ▾

罗向龙,魏欣语,赵茂军,刘若辰. 融合对比学习和生成对抗网络的图像去雾算法[J]. 吉林大学学报(工学版), 2025, 55(10): 3296-3308 DOI:10.13229/j.cnki.jdxbgxb.20240111

登录浏览全文

4963

注册一个新账户忘记密码

0 引　言

目前，图像去雾算法可分为基于图像增强、基于物理模型和基于深度学习3大类。基于图像增强的去雾算法主要通过直方图均衡化处理^［1］、Retinex变换^［2］、小波变换^［3］等方法提高图像的对比度，以达到去雾的效果，虽然能基本满足人类的视觉要求，但其未考虑图像退化的本质原因，只从调整图像对比度与饱和度等角度出发来增强图像的视觉主观能见度，往往会造成图像细节信息丢失、局部过度增强和块效应等问题，不利于完成高级别的图像处理任务。

基于物理模型的去雾算法更加注重从图像退化的本质出发解决图像去雾问题。该类方法以Cantor^［4］提出的大气散射模型为基础，Nayar等^［5］对其进行了进一步总结：He等^［6］在大气散射模型的基础上提出了基于暗通道先验（Dark channel prior，DCP）的去雾算法，根据有雾图像的暗通道图对场景透射率和全局大气光值进行估计，并将2个估计的参数值代入大气散射模型公式，从而得到无雾图像；Tang等^［7］提出了改进的颜色衰减先验（Color attenuation prior， CAP）算法，解决了高频区域图像模糊问题；牛宏侠等^［8］和许懿娜等^［9］提出基于DCP的改进图像去雾算法，有效校正色偏，更好地提升图像清晰度及对比度，提高图像质量。基于物理模型的算法能以各种先验知识作为额外约束条件估计退化模型中的未知参数，并利用大气散射模型实现图像去雾，但在不同场景下的图像存在参数估计不准确的问题，导致某些特定场景的去雾效果不理想。

随着机器学习技术的发展，基于深度学习的去雾算法成为目前该领域的研究热点。早期该算法受传统算法中基于物理模型和先验知识的启发，将大气散射模型与卷积神经网络（Convolutional neural network，CNN）结合，利用CNN的特征提取能力提取图像特征信息，以提高透射率和大气光值等参数估计的准确性。王勇等^［10］提出的多尺度编码-解码（Multi-scale encoding decoding， MSAOD）模型神经网络以及李永福等^［11］提出的改进一体化去雾网络（All-in-one dehazing network， AOD-Net），本质上仍是基于参数估计的方法，同样存在参数估计不准确导致的去雾效果不理想问题。目前主流的基于深度学习的去雾算法主要为端到端算法，其无需对中间参数进行估计，可直接利用不同结构的网络模型生成无雾图像。由于生成对抗网络（Generative adversarial network，GAN）^［12］在图像复原、风格转换、图像修复等任务中具有很大的优势，基于GAN的端到端图像去雾算法得到广泛关注。屠杭垚等^［13］总结了条件GAN在图像翻译中的进展。Wang等^［14］提出了双倍多尺度生成对抗网络（Twofold multi-scale generative adversarial network， TMS-GAN），提高了去雾的性能。Engin等^［15］使用循环生成对抗网络（Cycle-consistent generative adversarial network，CycleGAN）完成无监督图像的去雾，使用循环一致性损失和感知损失增强了去雾图像的纹理信息。Zhang等^［16］、Zhong等^［17］和但志平等^［18］通过引入注意力机制、感知损失等对CycleGAN进行改进，提高了去雾图像的视觉质量。钱旭淼等^［19］提出一种基于注意力特征融合的图像去雾算法，在网络的解码器中加入“增强-操作-减去”的增强策略，解决了去雾后图像细节丢失的问题。基于深度学习的算法去雾彻底，去雾图像的视觉效果好，但仍存在依赖数据集、场景普适性不高、鲁棒性差等问题。同时，现有研究大多依赖有雾和无雾图像对，受各种因素的限制，获取大量匹配的图像对难以实现，合成有雾图像和自然真实有雾图像始终存在差异，导致训练好的网络模型在处理真实场景有雾图像时产生域偏移问题，从而限制了其在实际中的应用。

为解决非匹配图像在去雾时易产生域偏移、去雾不彻底以及难以应用于实际场景等问题，提高图像去雾算法在真实场景下的应用价值，本文提出了一种基于对比学习和CycleGAN的图像去雾算法C-CycleGAN，该算法无需监督学习中的成对图像，可利用非匹配的有雾图像和无雾图像，自动学习有雾与无雾图像之间的映射关系，进行域间图像转换；为解决监督学习因标注数据而产生的高成本和时间消耗问题，采用对比学习拉近图像相似特征的距离，摆脱对训练样本数量和标签的依赖，增强网络捕捉相似图像语义信息的能力，保持图像内容的一致性；为提高模型的性能和泛化能力，引入频率损失函数对网络参数进行优化，进一步保留图像的内容和结构信息，降低频域信息损失，减少图像的模糊和失真，提高网络去雾效果。在RESIDE^［20］数据集和构建的Realdata数据集上对本文算法进行测试，结果表明本文方法具有有效性。

1 CycleGAN和对比学习

1.1　CycleGAN

Cycle-GAN由Zhu等^［21］首次提出，其网络训练无须成对输入和输出图像，而是直接通过学习2个图像域^［22］之间的映射关系，将一组图像从一个域转换到另一个域。CycleGAN由2个GAN网络组成，包括2个生成器

G

、

F

和2个判别器

D X

、

D Y

。如图1所示，

X

域的图像通过生成器

G

生成

Y ˜

域的图像，再通过生成器

F

重构回

X ˜

域的原图像；

Y

域的图像通过生成器

F

生成

X ˜

域图像，再通过生成器

G

重构回

Y ˜

域输入的原始图像。

该网络通过对抗博弈不断训练优化：训练

G

，使其尽可能生成与真实图像相似的图像：训练

D Y

，使其尽可能分辨真实图像和生成图像。

G

和

D Y

的对抗损失函数为：

m i n G m a x D Y ℒ G A N (G, D Y, X, Y) = E y ~ P d a t a (y) [l g D Y (y)] +

E x ~ P d a t a (x) [l g (1 - D Y (G (x)))]

（1）

式中：

x 、 y

分别为

X 、 Y

域中的原始图像。根据式（1）同理可以得到

F

和

D X

的对抗损失函数为：

m i n F m a x D X ℒ G A N (F, D X, X, Y) = E x ~ P d a t a (x) [l g D X (x)] +

E y ~ P d a t a (y) [l g (1 - D X (F (y)))]

（2）

如果只有循环对抗损失，则不能保证生成器

G

生成的图片内容信息不会改变，因为映射

x → G (x)

可能存在多种方式，没有内容上的限制，可能出现较大偏差，所以引入循环一致性损失函数，通过限制输入图像经过2次域的转换后仍能保持原有内容来确保模型输出的一致性。

循环一致性损失

L c y c

由前向循环一致性损失和后向循环一致性损失组成。如图1所示，前向循环一致性损失的计算为：将

X

域的图像输入

G

，得到

G (x)

，再将

G (x)

输入

F

，得到前向循环重构的图像

F (G (x))

，然后计算

F (G (x))

与

x

之间的损失；同理可得后向循环一致性损失，即为

G (F (y))

与

y

之间的损失。

L c y c

的表达式为：

ℒ c y c (G, F) = E y ~ P d a t a (y) [| | G (F (y)) - y | | 1] +

E x ~ P d a t a (x) [| | F (G (x)) - x | | 1]

（3）

令

λ

为权重系数，CycleGAN总的损失函数为：

ℒ (G, F, D X, D Y) = ℒ G A N (G, D Y, X, Y) +

ℒ G A N (F, D X, X, Y) + λ ℒ c y c

（4）

1.2　对比学习

相较于监督学习需要标注数据，无监督学习利用数据本身的特征进行学习，避免了标注数据带来的高成本和时间消耗，摆脱了对数据标签的依赖。对比学习是无监督学习的方式之一，其利用同一样本内部的相似信息和不同样本的区别，将相似的对象映射到高维特征空间，拉近相似特征向量的距离，反之则拉远距离，从而增强网络捕捉相似图像语义信息的能力，对比学习结构如图2所示。

特征提取将输入图像转换为对应的特征向量，为提取图像更高级别的语义信息，获取全局特征表示，在特征提取后使用多层感知机（Multilayer perceptron，MLP）进行非线性变换，以更好地学习相似与不相似样本对之间的特征表示。

对比学习的核心思想是构建正负样本对进行特征比较和学习，让相似（正）样本间的距离尽可能缩小，不相似（负）样本间的距离尽可能扩大，将相似样本映射到接近的特征空间，不相似样本映射到远离的特征空间。

对比学习的目标函数为：

d (f (x), f (x +)) ≫ d (f (x), f (x -))

（5）

式中：

x

为原始图像；

x +

为与

x

相似的正样本；

x -

为负样本；

f (·)

为特征映射函数；

d (·)

为特征向量间的距离函数。

对比学习主要应用于图像分类和目标检测等高级视觉任务，最近相关研究发现，其也可用于图像去雾等视觉任务，如文献［23］在图像去雾网络中使用对比正则化项，提升了去雾网络的性能。

2 C-CycleGAN网络设计

2.1　去雾网络的整体架构

为克服非匹配图像在去雾时易产生域偏移、去雾不彻底以及难以应用于实际场景等问题，本文基于对比学习和CycleGAN，提出一种图像去雾C-CycleGAN模型，其整体结构如图3所示。

C-CycleGAN由生成器

G

、生成器

F

、判别器

D c l e a r

和判别器

D h a z e

组成。

G

将有雾图像还原成清晰图像，同时引入对比学习深度挖掘有雾图像和无雾图像的互信息，利用互信息辅助模型学习两者的映射关系，提高去雾效果；

F

模拟清晰图像到有雾图像的降质过程，生成有雾图像；

D c l e a r

判断

G

产生的去雾图像是否足够清晰，评估去雾图像和真实清晰无雾样本之间的真实度，引导

G

生成更真实的图像，

D h a z e

工作原理与之类似。

2.2　生成器网络

生成器

G

的作用是将有雾图像转换为无雾图像，生成器

F

的作用是将无雾图像转换为有雾图像，由于作用不同，两者在结构上也有所差异。

G

能有效提取有雾图像的全局特征信息，并能通过判别器的反馈缩小有雾和无雾图像之间的差异，从而生成更接近真实的无雾图像。因此，

G

的核心思想在于设计一个能有效提取有雾特征信息的网络框架，其结构见图4，主要包括编码模块、多尺度特征提取模块、解码模块3个部分。

（1）编码模块

编码模块用于特征提取，将有雾图像转换为特征图，它主要通过3个串联的卷积层来提取图像特征，同时通过下采样降低特征图的分辨率。如图5所示，每个卷积单元都由1个3×3的卷积层、1个实例归一化层和1个Leaky ReLU层组成。其中，卷积层主要用于特征提取；实例归一化层用于加快模型的收敛；Leaky ReLU层用于非线性拟合。

（2）多尺度特征提取模块

为增强去雾效果，模型采用多尺度特征提取的方法来提取特征信息。多尺度特征提取模块的网络架构如图6所示，该网络共有4个分支，首先，通过1×1的卷积核减少特征图通道数，降低网络复杂度；其次，通过最大池化增加网络的感受野，提取更大尺度的特征信息。最后，通过使用不同大小的卷积核（1×1、3×3、5×5）获取不同尺度的特征信息，并将其合并。

（3）解码模块

解码器的功能是通过压缩卷积的方式将转换器输出的特征向量转化为无雾图像，其网络结构与编码器的结构对称，由3个反卷积单元块组成，反卷积单元包含1个3×3的反卷积层、1个归一化层和1个ReLU激活层。反卷积层可以恢复图像的细节信息，从而进行无雾图像的重构。

生成器

F

需要将无雾图像转换为有雾图像，与

G

类似，

F

也会通过不断学习提高转换能力。由于

G

、

F

生成的数据风格不同，因此C-CycleGAN对其采用不同的网络结构来确保有效完成图像去雾任务。

F

采用具有保持图像风格和细节信息能力的U-Net网络，其结构如图7所示。

U-Net网络基于编码器-解码器构成，编码器主要由卷积块和下采样卷积块组成，通过多个卷积块堆叠提取图像不同层次的特征信息，再通过IN和ReLU函数进行归一化和非线性变换，减少内部协变量偏移，提高模型的稳定性和表达能力。采用步长为2的卷积层进行下采样操作，降低特征图的尺寸，捕捉图像更加抽象和高级的特征表示。细节解码器通过反卷积块将编码器的抽象特征重新恢复成原始图像。在下采样过程中，随着特征图尺寸的缩小，图像信息可能丢失，因此U-Net网络通过反卷积提高特征图的尺寸，并采用跳跃连接将编码器的特征图与解码器的特征图进行融合，将低级别的特征信息传递到高级别的解码模块，保留更多的上下文信息，加强对浅层特征的利用，从而共享特征信息的同时保留更多的图像细节，提高图像处理效果。

2.3　对比指导分支

有雾图像和去雾图像具有相似的场景和结构特征，采用对比学习分析生成图像和原始图像间的相似度，深入挖掘有雾图像和无雾图像的相似特征，学习图像的潜在特征分布，促使相似的特征分布更接近，将不相似的特征分布推得更远，保留图像的内容信息，利用相似特征指导图像去雾，以更好地恢复无雾图像。以生成器

G

为例，对比指导分支（Contrastive guidance branch，CGB）结构如图8所示。

假设

x 、 y

分别为有雾图像域

X

和真实无雾图像域

Y

的图像，将生成器分解为编码和解码2个部分，生成无雾图像可表示为

y ˜ = G (x) = G d e c (G e n c (x))

。使用生成器

L

个编码层作为CGB的辅助编码器，提取

x 、 y ˜

在不同维度的特征图，每层特征图中的元素代表原始图像中的局部图像块，不同位置对应着原图中不同的图像块。以第

l

层提取的特征图为例，将该层特征图的每个元素转换为特征向量，将其发送到2层MLP投影头

H

，最大化保留向量互信息。选择

y ˜

的某个特征向量为查询向量

z

，则

x

相应位置的向量为正样本

z +

，其他位置为负样本

z i -

，在原始图像中表现为局部图像块，即查询向量代表

y ˜

中紫色图像块，

x

对应位置的图像块为正样本，

x

中绿框等区域为负样本，最小化相似样本在特征空间中的距离，最大化不相似样本间的距离，即增强

z

与

z +

的相似度，同时降低与

z i -

的相似度。

如图9所示，对比学习的目标是学习相似与不相似样本对的特征表示，使相似样本间的相似度尽可能接近1，不相似样本间的相似度尽可能接近0，从而保持图像内容的一致性，具体如下：

ℱ (z, z +, z -) =

- l g s i m (z, z +) s i m (z, z +) + ∑ i = 1 N s i m (z, z i -)

（6）

式中：

s i m (u, v) = e x p (u T v u v τ)

为计算2个归一化特征向量的余弦相似函数；

N

为选取的负样本个数；

τ

为温度系数，根据文献［24］，本文令

τ = 0.07

。

CGB为充分提取图像的特征信息，共选择

L

层编码提取图像特征，不同编码层提取的特征图不同，不同特征图对应原图中不同的图像块，层数越深，对应特征图的感受野越大，表示的图像块尺寸也越大；选择不同编码层可以获得不同尺度的特征图，更好地捕捉图像的语义信息。有雾图像

x

经CGB特征提取后得到特征向量

{z l} L = {H (G e n c (x) l)} L

，同理可得生成图像

y ˜ = G (x)

的特征向量为

{z ˜ l} L = {H (G e n c (G (x)) l)} L

，每个特征向量代表原图中1个的局部图像块。若第

l

层特征图有

S N

个向量，

z ˜ l m ∈ R C l

为

y ˜

第

l

层特征图位置为

m

的查询向量，则

x

特征图对应位置的特征向量

z l m

为正样本，其余位置为负样本

z l S N / m ∈ R (S N - 1) × C l

，其中

C l

为该层特征图的通道数，由此可得CGB在特征空间的损失函数为：

ℒ c o n t (G, H, X) = E x ∼ X ∑ l = 1 L ∑ m = 1 S N ℱ (z ˜ l m, z l m, z l S N / m)

（7）

2.4　判别器网络

C-CycleGAN去雾模型包含2个判别器：

D c l e a r

判别

G

生成的去雾图像和真实无雾图像的真伪；

D h a z e

判别

F

生成的有雾图像和真实有雾图像的真伪，

D c l e a r

和

D h a z e

的网络结构如图10所示。PatchGAN^［25］采用全卷积网络分块判别图像，关注图像各区域细节信息，提高判别能力，解决了训练不稳定和收敛慢的问题，因此本文采用PatchGAN架构。PatchGAN输入为有雾图像和无雾图像或有雾图像和去雾图像的组合，通过多层卷积级联提取输入特征，利用归一化减少数据分布对网络的影响。判别器输出经Sigmoid激活函数处理，限制每个元素值在［0，1］内，代表输入图像局部patch的评价值，分块判别图像的真假，增强图像局部判别能力，提高判别的准确性，避免判别器极端输出。

2.5　网络损失函数

合理的损失函数可以保证生成图像质量，同时实现生成器和判别器的有效训练和协同优化，提高模型的泛化能力。C-CycleGAN去雾模型采用对抗损失、颜色循环一致性损失、映射损失和频率损失线性叠加进行网络参数优化，有利于减少去雾图像的失真，提高鲁棒性。

对抗损失可以提高生成器和判别器的对抗能力，优化生成器性能，引导生成数据学习目标数据的数据分布，同时提高判别器的鉴别能力。C-CycleGAN生成器

G : X → Y

和判别器

D c l e a r

对抗损失为：

ℒ G A N (G, D c l e a r, X, Y) = E y ~ P d a t a (y) [l g D c l e a r (y)] +

E x ~ P d a t a (x) [l g (1 - D c l e a r (G (x)))]

（8）

式中：

X 、 Y

分别为有雾图像域和无雾图像域。

同理可得生成器

F : Y → X

和判别器

D h a z e

的对抗损失

ℒ G A N (F, D h a z e, X, Y)

。采用循环一致性约束，限制生成图像回到原始图像的域中，保证生成图像与原始图像一致。为增强循环一致性损失的约束作用，分别计算生成图像和原始图像3个通道的像素差异，得到颜色循环一致性损失，具体如式（9）所示：

ℒ c o l o r c y c = ∑ i ∈ R, G, B (E y ~ P d a t a (y) i [| | G (F (y)) - y | | 1] + E x ~ P d a t a (x) i [| | F (G (x)) - x | | 1])

（9）

G

将有雾图像转换为无雾图像，为避免网络对输入图像过度处理导致的图像失真问题，引入映射损失约束网络的训练过程，确保生成的无雾图像尽可能接近真实无雾图像，而真实无雾图像经

G

转换不发生大的改变，同理可得

F

的映射损失。整体映射损失如式（10）所示：

ℒ i d e n = E y ~ P d a t a (y) [| | G (y) - y | | 1] +

E x ~ P d a t a (x) [| | F (x) - x | | 1]

（10）

为进一步保留图像的内容和结构信息，本文在提出的C-CycleGAN模型中引入频率损失函数^［26］，计算生成图像和真实图像在频域上的差异，约束生成器的输出，减少图像的模糊和失真，提高生成图像的质量，具体如（11）式所示：

ℒ f r e q = E y ~ P d a t a (y) W y [| D F T (G (F (y))) - D F T (y) | 2] + E x ~ P d a t a (x) W x [| D F T (G (x)) -

D F T (x) | 2]

（11）

式中：

D F T (⋅)

为离散傅里叶变换；

W y 、 W x

为归一化的频谱权重矩阵，矩阵值范围为［0，1］。令

λ 1 、 λ 2 、 λ 3 、 λ 4 、 λ 5

为权重系数，网络总优化目标为：

ℒ a l l = λ 1 ℒ c o n t (G, H, X) + λ 2 (ℒ G A N (G, D c l e a r, X, Y) + ℒ G A N (F, D h a z e, X, Y)) + λ 3 ℒ c o l o r c y c + λ 4 ℒ i d e n + λ 5 ℒ f r e q

（12）

3 实验结果及分析

3.1　数据集

基于对比学习和生成对抗网络的图像去雾算法，使用非成对的有雾图像和无雾图像训练网络，降低了数据获取的难度，提高了算法在真实有雾场景的应用价值。本文不使用人工合成有雾图像，通过收集真实的有雾和无雾室外图像，构建RealData数据集。训练集中真实有雾和无雾图像各4 000张，测试集中真实有雾图像400张。为验证网络的泛化和跨域性能，随机选取现有RESIDE数据集^［20］的RTTS子集中200张有雾图像，评估模型在不同场景下的去雾效果。

3.2　网络参数与训练

经过反复实验，本文生成器

G

、生成器

F

及判别器的详细参数如表1~3所示。

输入图像尺寸为

256 × 256 × 3

，网络迭代次数为300，前150次学习率固定为

10 - 4

，后150次迭代学习率线性衰减至0，损失函数的权重系数

λ 1 = 2, λ 2 = λ 3 = λ 4 = 1, λ 5 = 0.1

；使用Adam优化器训练模型，优化器动量参数

β 1

、

β 2

分别为0.5、0.999。

C-CycleGAN图像去雾算法参数优化算法如下：

有雾图像集

x ∈ X

，无雾图像集

y ∈ Y

，生成器为

G 、 F

，判别器为

D c l e a r 、 D h a z e

（1）固定

G 、 F 、 D h a z e

参数：①将有雾图像

x

输入

G

，输出

x → G (x)

；

②将

G (x) 、 y

输入

D c l e a r

，根据式（8）计算判别器

D c l e a r

损失；③更新

D c l e a r

权重参数。

（2）固定

F 、 D c l a e r 、 D h a z e

参数：①将有雾图像

x

输入

G

，输出

x → G (x)

；

②根据式(8)计算生成器

G

损失；③将生成无雾图像

G (x)

输入

F

，输出恢复的有雾图像

F (G (x))

；④根据式（7）（9）（11）分别计算对比损失、正向颜色循环一致性损失和频率损失；⑤将无雾图像

y

输入

G

，输出

y → G (y)

；⑥根据式（10）计算生成器

G

映射损失；⑦更新

G

权重参数。

（3）固定

G 、 F 、 D c l e a r

参数：①将无雾图像

y

输入

F

，输出

y → F (y)

；②将

F (y) 、 x

输入

D h a z e

，计算判别器

D h a z e

损失；③更新

D h a z e

权重参数。

（4）固定

G 、 D c l a e r 、 D h a z e

参数：①将无雾图像

y

输入

F

，输出

y → F (y)

；②根据式(8)计算生成器

F

损失；③将生成有雾图像

F (y)

输入

G

，输出恢复的无雾图像

G (F (y))

；④根据式（7）（9）（11）分别计算对比损失、反向颜色循环一致性损失和频率损失；⑤将有雾图像

x

输入

F

，输出

x → F (x)

；⑥根据式（10）计算生成器

F

映射损失；⑦更新

F

权重参数。

（5）重复（1）~（4），直到达到预设迭代次数。

3.3　图像去雾结果及分析

由于真实有雾图像没有对应的清晰图像作为参考，本文选用信息熵（Information entropy，IE）、平均梯度（Average gradient，AG）和自然图像质量评估（Natural image quality evaluator，NIQE）对去雾图像进行评价。

3.3.1　去雾评价指标

（1）IE。IE描述的是图像信息量大小，信息熵越大则图像还原后的质量越高。定义如下：

H (x) = I E [l o g 2 P (x)] = - ∑ i = 0 255 P (i) l o g 2 P (i)

（13）

式中：

i

为灰度等级；

P (i)

为

i

的出现概率。

（2）AG。AG用于评价去雾图像的细节还原程度，较高的AG意味着图像具有更好的细节信息和清晰度。定义如下：

A G = 1 W × H ∑ i = 1 W ∑ j = 1 H

[I^(i, j) - I^(i + 1, j)] 2 + [I^(i, j) - I^(i, j + 1)] 2 2

（14）

式中：

I^(i, j)

为去雾图像在

(i, j)

位置的像素值。

（3）NIQE。NIQE的基本思想是建立一个无雾图像库，计算去雾图像和无雾模型参数的距离，该距离越小，去雾图像的质量越好，定义如下：

D (υ 1, υ 2, Σ 1, Σ 2) =

(υ 1 - υ 2) T (Σ 1 + Σ 2) - 1 2 (υ 1 - υ 2)

（15）

式中：

υ 1

、

υ 2

和

Σ 1

、

Σ 2

分别为无雾图像和去雾图像得到的均值向量和协方差矩阵。

3.3.2　去雾结果分析

（1）RealData数据集实验分析

如图11所示，为验证C-CycleGAN算法的有效性，选取RealData测试集图像，并与DCP^［6］、CAP^［7］、FFA-Net^［27］、GCA-Net^［28］、CycleGAN^［21］和Cycle-Dehaze^［15］等算法进行定量和定性比较。

如图11所示，DCP去雾图像出现明显失真，特别是在天空区域，整体图像颜色偏深；CAP去雾不彻底，仅能去除近景区域的薄雾，去雾图像存在色偏（见图11（c）第3幅图中间区域）；CycleGAN虽然取得一定的去雾效果，但去雾图像无法保持原始图像的结构信息，特别是图11（d）第4幅图存在不符合原始图像的内容；Cycle-Dehaze去雾图像缺少细节，存在失真，远处物体轮廓恢复不清晰（见图11（e）第1幅图）。本文算法有效减少了雾霾对图像的影响，去雾图像失真小，恢复图像色彩真实，能够清晰还原图像的细节和纹理信息。

计算各去雾图像的IE、AG和NIQE，结果如表4所示，其中↑表示该评价指标的值越大，去雾效果越好，↓表示值越小去雾效果越好。可见本文算法的各种性能指标明显优于其他算法，尤其是IE和AG，均取得最优结果。相较于DCP、CAP、FFA-Net、GCA-Net、CycleGAN和Cycle-Dehaze算法，本文算法的IE和AG平均提高2.02%和24.99%；虽然NIQE略高于Cycle-Dehaze，但IE和AG均优于Cycle-Dehaze；相较于DCP、CAP、FFA-Net、GCA-Net和CycleGAN算法，本文算法的NIQE分别降低26.23%、29.95%、27.85%、24.35%和8.18%。实验结果表明，C-CycleGAN可有效提升网络的去雾性能。

（2）RTTS数据集实验分析

为验证本文算法的跨域性能，选择RTTS数据集^［20］验证算法在不同环境的稳定性和泛化能力，进一步评估算法的实用性和可靠性，图12为各算法去雾效果实验结果。

由图12可知，DCP去雾图像亮度较低，天空等高亮度区域出现色彩失真；CAP去雾不均匀，图12（c）第2幅图和第4幅图仅去除部分雾，去除浓雾的效果差，去雾图像存在色偏（见图12（c）第3幅图中间区域）；CycleGAN物体轮廓恢复不清晰（见图12（d）第2、6幅图的汽车），在道路上出现色彩失真（见图12（d）第3幅图的道路区域）；Cycle-Dehaze在图12（e）第5幅图中存在不符合原始图像的内容，去雾图像缺少细节（见图12（e）第4、6幅图中远处楼房），去雾图像亮度偏低；图12（f）为本文算法，可知本文算法取得了较好的去雾效果，去雾彻底，去雾图像失真小，恢复图像清晰。

分别计算去雾图像的IE、AG和NIQE，结果如表5所示，相较于DCP、CAP、FFA-Net、GCA-Net、CycleGAN和Cycle-Dehaze算法，本文算法的IE和AG平均提高2.21%、34.62%；本文算法的NIQE与DCP、CAP、FFA-Net、GCA-Net和CycleGAN相比，分别降低26.85%、32.69%、29.66%、33.64%和8.56%。综合实验表明，C-CycleGAN算法具有良好的跨域性能和鲁棒性。

4 消融实验

为进一步验证本文模型的有效性，通过消融实验分析CGB和频率损失函数对模型性能的影响。分别设计以下4种消融实验：实验1，不添加CGB和频率损失函数；实验2，仅添加CGB；实验3，仅添加频率损失函数；实验4，采用本文提出的完整网络结构。上述实验在RealData测试集上的客观评价指标如表6和图13（a）所示。

实验结果表明，CGB可学习图像的潜在特征分布，深入挖掘有雾图像和无雾图像相似特征的距离，保留两类图像间的互信息，拉近图像的相似特征的距离，保持图像内容的一致性；频率损失函数有助于生成器学习更加准确的图像频率信息，降低频域信息损失，提高生成图像的质量和清晰度。CGB和频率损失函数提高了模型的去雾性能，去雾图像的IE、AG平均提高0.73%、4.55%，NIQE平均降低5.32%。

为更全面地验证算法在不同数据集上的性能，进一步评估模型的有效性，在RTTS数据集进行相同的4种消融实验，客观评价指标如表7和图13（b）所示。实验结果表明，CGB和频率损失函数提升了模型的去雾性能，去雾图像的IE、AG平均提高0.59%、4.50%，NIQE平均降低5.95%，进一步验证了本文算法整体设计的有效性。

5 结束语

本文提出基于对比学习和CycleGAN的图像去雾算法，无须成对的训练数据，旨在解决缺乏大量同一场景匹配图像对训练样本的问题。采用对比学习摆脱对训练样本数量和标签的依赖，约束不同样本在深度特征空间中的嵌入信息，学习有雾图像和无雾图像间的特征差异，拉近相似特征之间的距离，增强网络捕捉相似图像语义信息的能力，保持图像内容的一致性，提高网络去雾性能。为进一步保留图像的内容和结构信息，引入频率损失函数，计算生成图像和真实图像在频域上的差异，约束生成器的输出，降低频域信息损失，减少去雾图像的模糊和失真。实验结果表明，采用本文算法得到的去雾图像细节信息更丰富，图像更清晰，去雾性能相比其他算法有所提升。本文算法虽然能够达到较好的去雾效果，但训练时间较长，而且处理大尺寸图像时速度较慢。未来将研究如何提高算法的效率和速度，以满足实际应用中对算法速度的要求。

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	Bansode N V, Ingale V, Ingale S. An appropriate histogram equalization technique for thermal image enhancement of neck region[C]∥IEEE Pune Section International Conference(PuneCon), Pune, India: IEEE,2023:1-5.

[2]	李英, 李欣玥, 王佳琦, 等. 基于Retinex去雾算法的水射流辅助激光加工特征图像融合算法[J]. 中国激光, 2023, 50(24): 67-76.

[3]	Li Ying, Li Xin-yue, Wang Jia-qi,et al. Water jet assisted laser processing feature image fusion algorithm based on Retinex defogging algorithm[J]. Chinese Journal of Lasers, 2023, 50(24): 67-76.

[4]	Dai W, Ren X M. Defogging algorithm for road environment landscape visual image based on wavelet transform[C]∥International Conference on Networking, Informatics and Computing(ICNETIC), Palermo, Italy, 2023: 587-591.

[5]	Cantor A E J. Optics of the atmosphere: scattering by molecules and particles[J]. IEEE Journal of Quantum Electronics, 1978, 14(9): 698-699.

[6]	Nayar S K, Narasimhan S G. Vision in bad weather [C]∥Proceedings of the Seventh IEEE International Conference on Computer Vision, Kerkyra, Greece, 1999: 820-827.

[7]	He K M, Sun J, Tang X O. Single image haze removal using dark channel prior[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(12): 2341-2353.

[8]	Tang J L, Zhang Z D, Niu L H, et al. Research on image defogging algorithms based on color attenuation prior[J]. Journal of Physics: Conference Series, 2022, 2216(1): No. 012080.

[9]	牛宏侠, 王春智, 梁乐观, 等. 基于改进暗通道先验的沙尘图像清晰化算法[J]. 吉林大学学报: 理学版,2023, 61(6): 1407-1418.

[10]	Niu Hong-xia, Wang Chun-zhi, Liang Le-guan, et al. Sand and dust image clarification algorithm based on improved dark channel prior[J]. Journal of Jilin University(Science Edition), 2023, 61(6): 1407-1418.

[11]	许懿娜, 王义, 黄华平, 等. 一种改进暗通道先验的航空影像快速去雾方法[J]. 遥感信息, 2023, 38(6):36-41.

[12]	Xu Yi-na, Wang Yi, Huang Hua-ping, et al. A fast defogging method for aerial images with improved dark channel prior[J]. Remote Sensing Information, 2023, 38(6):36-41.

[13]	王勇, 边宇霄, 李新潮, 等. 基于多尺度编码-解码神经网络的图像去雾算法[J]. 吉林大学学报:工学版, 2024, 54(12):3626-3636.

[14]	Wang Yong, Bian Yu-xiao, Li Xin-chao, et al. Image defogging algorithm based on multi-scale encoding-decoding neural network[J]. Journal of Jilin University(Engineering and Technology Edition), 2024, 54(12):3626-3636.

[15]	李永福, 崔恒奇, 朱浩, 等. 一种基于改进AOD-Net的航拍图像去雾算法[J]. 自动化学报, 2022, 48(6): 1543-1559.

[16]	Li Yong-fu, Cui Heng-qi, Zhu Hao, et al. An improved AOD-Net based defogging algorithm for aerial images[J]. Acta Automatica Sinica, 2022, 48(6): 1543-1559.

[17]	Goodfellow I, Pouget-Abadie J, Mirza M, et al. Generative adversarial networks[J]. Communications of the ACM, 2020, 63(11): 139-144.

[18]	屠杭垚, 王万良, 陈嘉诚, 等. 基于条件生成对抗网络的图像翻译综述[J]. 计算机辅助设计与图形学学报, 2024, 36(1): 14-32.

[19]	Tu Hang-yao, Wang Wan-liang, Chen Jia-cheng, et al. A review of image translation based on conditional generative adversarial networks[J]. Journal of Computer Aided Design and Graphics, 2024, 36(1): 14-32.

[20]	Wang P Y, Zhu H Q, Huang H, et al. TMS-GAN: A twofold multi-scale generative adversarial network for single image dehazing[C]∥IEEE Transactions on Circuits and Systems for Video Technology. IEEE, 2022, 32(5): 2760-2772.

[21]	Engin D, Genç A, Kemal Ekenel H. Cycle-dehaze: Enhanced CycleGAN for single image dehazing[C]∥ IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops, Salt Lake City, USA,2018: 825-833.

[22]	Zhang X J, Hu Q, Wei Y N, et al. CycleGAN image defogging method based on residual dual attention mechanism[C]∥Electronic Information Engineering and Computer Science(EIECS), Changchun, China: 2023: 234-237.

[23]	Zhong M Q, Wang X, Wang J, et al. A remote sensing image defogging method based on improved CycleGAN network[C]∥International Conference on Computer Vision, Image and Deep Learning, Zhuhai,China, 2023: 113-116.

[24]	但志平, 方帅领, 孙航, 等. 基于双判别器异构CycleGAN框架下多阶通道注意力校准的室外图像去雾[J]. 电子学报, 2023, 51(9): 2558-2571.

[25]	Dan Zhi-ping, Fang Shuai-ling, Sun Hang, et al. Outdoor image defogging based on dual discriminator heterogeneous CycleGAN framework with multi-order channel attention calibration[J]. Acta Electronica Sinica, 2023, 51(9): 2558-2571.

[26]	钱旭淼, 段锦, 刘举, 等. 基于注意力特征融合的图像去雾算法[J]. 吉林大学学报:理学版, 2023, 61(3): 567-576.

[27]	Qian Xu-miao, Duan Jin, Liu Ju, et al. Image defogging algorithm based on attention feature fusion[J]. Journal of Jilin University(Science Edition), 2023, 61(3):567-576.

[28]	Li B Y, Ren W Q, Fu D P, et al. Benchmarking single-image dehazing and beyond[J]. IEEE Transactions on Image Processing, 2019, 28(1): 492-505.

[29]	Zhu J Y, Park T, Isola P, et al. Unpaired image-to-image translation using cycle-consistent adversarial networks[C]∥IEEE International Conference on Computer Vision(ICCV), Venice, Italy,2017: 2223-2232.

[30]	Shao Y J, Li L, Ren W Q, et al. Domain adaptation for image dehazing [C]∥IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, USA, 2020: 2808-2817.

[31]	Wu H Y, Qu Y Y, Lin S H, et al. Contrastive learning for compact single image dehazing[C]∥IEEE/CVF Conference on Computer Vision and Pattern Recognition, Nashville, USA,2021: 10551-10560.

[32]	Chen X, Pan J S, Jiang K, et al. Unpaired deep image deraining using dual contrastive learning[C]∥IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR), New Orleans, USA, 2022: 2017-2026.

[33]	Isola P, Zhu J Y, Zhou T H, et al. Image-to-image translation with conditional adversarial networks[C]∥IEEE International Women in Engineering(WIE) Conference on Electrical and Computer Engineering, Honolulu,USA,2017: 1125-1134.

[34]	Jiang L M, Dai B, Wu W, et al. Focal frequency loss for image reconstruction and synthesis[C]∥IEEE/CVF International Conference on Computer Vision, Montreal, Canada, 2021: 13899-13909.

[35]	Qin X, Wang Z L, Bai Y C, et al. FFA-Net: Feature fusion attention network for single image dehazing [C]∥AAAI Conference on Artificial Intelligence, New York, USA: 2020: 11908-11915.

[36]	Das S, Saiful Islam M, Ruhul Amin M. GCA-Net: Utilizing gated context attention for improving image forgery localization and detection[C]∥IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops(CVPRW), New Orleans,USA,2022:81-90.

基金资助

国家自然科学基金项目(62001059)

陕西省自然科学基金项目(2022JM-056)

AI Summary AI Mindmap

PDF (2533KB)

访问

被引

详细

导航

Received	Accepted	Published
2024-01-28
Issue Date
2026-06-15

摘要

Abstract

Graphical abstract

关键词

Key words

引用本文

0 引 言

1 CycleGAN和对比学习

1.1 CycleGAN

1.2 对比学习

2 C-CycleGAN网络设计

2.1 去雾网络的整体架构

2.2 生成器网络

2.3 对比指导分支

2.4 判别器网络

2.5 网络损失函数

3 实验结果及分析

3.1 数据集

3.2 网络参数与训练

3.3 图像去雾结果及分析

3.3.1 去雾评价指标

3.3.2 去雾结果分析

4 消融实验

5 结束语

参考文献

基金资助

AI思维导图

0 引　言

1.1　CycleGAN

1.2　对比学习

2.1　去雾网络的整体架构

2.2　生成器网络

2.3　对比指导分支

2.4　判别器网络

2.5　网络损失函数

3.1　数据集

3.2　网络参数与训练

3.3　图像去雾结果及分析

3.3.1　去雾评价指标

3.3.2　去雾结果分析