基于改进YOLOv8的混凝土裂缝检测算法

赵文华; 刘澳鹏; 杜常博; 孙琦; 孔佳慧

doi:10.11956/j.issn.1008-0562.20250135

辽宁工程技术大学学报（自然科学版） ›› 2025, Vol. 44 ›› Issue (05) : 590 -596. DOI: 10.11956/j.issn.1008-0562.20250135

力学与土木工程

基于改进YOLOv8的混凝土裂缝检测算法

作者信息 +

Concrete crack detection algorithm based on improved YOLOv8

Author information +

文章历史 +

PDF (2085K)

摘要

为实现混凝土裂缝准确高效检测，提出一种基于YOLOv8s的混凝土裂缝检测模型YOLO-CCD。引入多尺度卷积模块PSConv（poly-scale convolution），增强跨尺度特征的学习能力，提高对微小裂缝和复杂背景下裂缝的检测效果。采用高效通道注意力机制（efficient channel attention，ECA），增强特征通道之间的依赖关系，优化特征表示。引入SIoU损失函数，通过综合考虑几何特征优化边界框回归过程，提高模型的检测精度。与YOLOv8s模型相比，改进后模型的平均精度mAP₅₀、mAP_50-95分别提升了7.9%和2.4%。与其他检测方法相比，本文提出的模型在检测精度和计算效率方面均有显著优势。研究结论为混凝土裂缝检测提供了新的可行方法。

Abstract

In order to realize the accurate and efficient detection of concrete cracks, a concrete crack detection model YOLO-CCD based on YOLOv8 s is proposed. The multi-scale convolution module PSConv (poly-scale convolution) is introduced to enhance the learning ability of cross-scale features and improve the detection effect of small cracks and cracks in complex backgrounds. The efficient channel attention (ECA) mechanism is used to enhance the dependence between feature channels and optimize feature representation. The SIoU loss function is introduced to optimize the bounding box regression process by comprehensively considering the geometric features, so as to improve the detection accuracy of the model. Compared with the YOLOv8 s model, the average accuracy mAP₅₀ and mAP_50-95 of the improved model are increased by 7.9 % and 2.4 %, respectively. Compared with other detection methods, the model proposed in this paper has significant advantages in detection accuracy and computational efficiency. The research conclusion provides a new feasible method for concrete crack detection.

Graphical abstract

关键词

目标检测 / YOLOv8 / 混凝土裂缝 / 混凝土裂缝检测 / 高效通道注意力 / 多尺度卷积 / 损失函数

Key words

object detection / YOLOv8 / concrete crack / concrete crack detection / efficient channel attention / poly-scale convolution / loss function

引用本文

引用格式 ▾

[Author(id=1276234658614776216, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, orderNo=0, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=zhwh09@163.com, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1276234658677690779, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, authorId=1276234658614776216, language=EN, stringName=Wenhua ZHAO, firstName=Wenhua, middleName=null, lastName=ZHAO, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Civil Engineering, Liaoning Technical University, Fuxin 123000, China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1276234658732216733, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, authorId=1276234658614776216, language=CN, stringName=赵文华, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=辽宁工程技术大学土木工程学院，辽宁阜新 123000, bio={"content":"

赵文华（1980-），男，辽宁阜新人，博士，副教授，主要从事桥梁检测与加固、边坡稳定理论方面的研究。E-mail：zhwh09@163.com

"}, bioImg=null, bioContent=

赵文华（1980-），男，辽宁阜新人，博士，副教授，主要从事桥梁检测与加固、边坡稳定理论方面的研究。E-mail：zhwh09@163.com

, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1276234658535084433, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, xref=null, ext=[AuthorCompanyExt(id=1276234658547667347, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, companyId=1276234658535084433, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Civil Engineering, Liaoning Technical University, Fuxin 123000, China), AuthorCompanyExt(id=1276234658564444564, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, companyId=1276234658535084433, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=辽宁工程技术大学土木工程学院，辽宁阜新 123000)])]), Author(id=1276234658786742689, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, orderNo=1, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1276234658858045863, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, authorId=1276234658786742689, language=EN, stringName=Aopeng LIU, firstName=Aopeng, middleName=null, lastName=LIU, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Civil Engineering, Liaoning Technical University, Fuxin 123000, China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1276234658967097775, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, authorId=1276234658786742689, language=CN, stringName=刘澳鹏, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=辽宁工程技术大学土木工程学院，辽宁阜新 123000, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1276234658535084433, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, xref=null, ext=[AuthorCompanyExt(id=1276234658547667347, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, companyId=1276234658535084433, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Civil Engineering, Liaoning Technical University, Fuxin 123000, China), AuthorCompanyExt(id=1276234658564444564, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, companyId=1276234658535084433, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=辽宁工程技术大学土木工程学院，辽宁阜新 123000)])]), Author(id=1276234659042595251, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, orderNo=2, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1276234659118092725, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, authorId=1276234659042595251, language=EN, stringName=Changbo DU, firstName=Changbo, middleName=null, lastName=DU, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Civil Engineering, Liaoning Technical University, Fuxin 123000, China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1276234659172618679, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, authorId=1276234659042595251, language=CN, stringName=杜常博, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=辽宁工程技术大学土木工程学院，辽宁阜新 123000, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1276234658535084433, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, xref=null, ext=[AuthorCompanyExt(id=1276234658547667347, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, companyId=1276234658535084433, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Civil Engineering, Liaoning Technical University, Fuxin 123000, China), AuthorCompanyExt(id=1276234658564444564, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, companyId=1276234658535084433, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=辽宁工程技术大学土木工程学院，辽宁阜新 123000)])]), Author(id=1276234659227144634, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, orderNo=3, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1276234659386528189, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, authorId=1276234659227144634, language=EN, stringName=Qi SUN, firstName=Qi, middleName=null, lastName=SUN, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Civil Engineering, Liaoning Technical University, Fuxin 123000, China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1276234659445248446, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, authorId=1276234659227144634, language=CN, stringName=孙琦, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=辽宁工程技术大学土木工程学院，辽宁阜新 123000, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1276234658535084433, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, xref=null, ext=[AuthorCompanyExt(id=1276234658547667347, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, companyId=1276234658535084433, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Civil Engineering, Liaoning Technical University, Fuxin 123000, China), AuthorCompanyExt(id=1276234658564444564, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, companyId=1276234658535084433, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=辽宁工程技术大学土木工程学院，辽宁阜新 123000)])]), Author(id=1276234659499774404, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, orderNo=4, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1276234659562688971, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, authorId=1276234659499774404, language=EN, stringName=Jiahui KONG, firstName=Jiahui, middleName=null, lastName=KONG, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Civil Engineering, Liaoning Technical University, Fuxin 123000, China, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1276234659617214929, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, authorId=1276234659499774404, language=CN, stringName=孔佳慧, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=辽宁工程技术大学土木工程学院，辽宁阜新 123000, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1276234658535084433, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, xref=null, ext=[AuthorCompanyExt(id=1276234658547667347, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, companyId=1276234658535084433, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Civil Engineering, Liaoning Technical University, Fuxin 123000, China), AuthorCompanyExt(id=1276234658564444564, tenantId=1045748351789510663, journalId=1155139928303341707, articleId=1276234117806149781, companyId=1276234658535084433, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=辽宁工程技术大学土木工程学院，辽宁阜新 123000)])])] 赵文华,刘澳鹏,杜常博,孙琦,孔佳慧. 基于改进YOLOv8的混凝土裂缝检测算法[J]. 辽宁工程技术大学学报（自然科学版）, 2025, 44(05): 590-596 DOI:10.11956/j.issn.1008-0562.20250135

登录浏览全文

4963

注册一个新账户忘记密码

0 引言

随着城市化的不断推进，混凝土已经成为建筑工程中应用最广泛的材料之一^[1]。但随着时间的积累和天气等环境因素的影响，混凝土结构会出现多种缺陷^[2]。其中，裂缝影响建筑外观，更削弱结构的承载能力和耐久性，带来安全隐患。因此，如何及时、准确地检测裂缝，成为保障建筑安全和延长使用寿命的关键。

传统的裂缝检测方法有人工巡检、基于图像处理算法^[3-4]等，这些方法或者费时费力，或者对复杂环境的适应能力有限。近年来，随着深度学习技术的迅速发展，出现多种自动化的裂缝检测技术^[5-8]，其中最典型的是基于卷积神经网络（convolutional neural networks，CNN）的方法^[9-11]。这类方法依托CNN，通过学习大量数据自动提取裂缝特征，与传统方法相比，裂隙的检测精度和检测效率均有提升。但CNN的特征提取能力有限，在复杂环境下可能会出现边缘识别不清、误检率较高等问题。与CNN相比，单阶段目标检测算法YOLO（you only look once）系列对目标检测能力更强，在混凝土裂缝检测领域应用广泛。早期研究采用YOLOv2进行裂缝检测^[12]，验证了该算法在目标识别任务中的可行性。在此基础上，将YOLO与结构光技术相结合^[13]，不仅用于裂缝尺寸测量，还通过激光对齐校正算法提高测量精度。为了提升YOLO在裂缝检测中的精度和计算效率，学者提出多种优化方案。例如，在YOLOv4的基础上，引入轻量级主干网络MobileNetv1^[14]减少计算时间，同时结合卷积块注意力机制^[15]（convolutional block attention module，CBAM）进一步增强特征提取能力。用小感受野模块（receptive field block-small，RFB-s）替换空间金字塔池化（spatial pyramid pooling，SPP）模块，扩大模型的感受野，提高裂缝检测的准确率。这些优化策略在保持实时检测能力的同时，增强了模型的鲁棒性，能更好地适应复杂环境下的裂缝检测任务。

以上研究表明，在裂缝检测方面，使用YOLO算法效果较好，但仍存在不足。例如：裂缝的形态多变，细节特征较为微小，现有YOLO算法模型捕捉细节能力不足，导致检测效果不够理想；在提取特征时，深度网络产生大量冗余信息，增加了计算量，还有可能干扰检测结果。注意力机制^[16-17]的使用可以一定程度上缓解以上问题，但计算复杂度较高，限制了在实时检测任务中的应用。

针对这些问题，本文提出一种基于YOLOv8的轻量级裂缝检测算法（YOLO-CCD）。在算法中引入多尺度卷积模块（poly-scale convolution，PSConv），增强对不同尺度裂缝特征的学习能力，使算法对细节识别更加敏感。结合高效通道注意力机制（efficient channel attention，ECA），优化通道间的信息交互，提升算法的整体检测性能，缩短计算时间。算法中采用SIoU函数替换CIoU函数，减少对框形状的无效惩罚，提高模型的检测精度。

1 YOLO-CCD模型

YOLO-CCD整体框架见图 1。该模型包括三个部分：骨干网络（Backbone）、颈部网络（Neck）、检测头（Head）。骨干网络用于提取多尺度特征；颈部网络用于多尺度特征融合，确保模型在不同分辨率下都能准确检测目标；检测头用于最终的目标分类、定位和回归，输出检测框。

图1中，CBS模块是YOLOv8网络中的一种基础构建单元，由卷积层（Convolution）、归一化层（BatchNorm）、SiLU激活函数组成；C2f是一种特征提取和融合模块，应用于骨干网络和颈部网络部分以提高模型的特征捕获能力；SPPF模块是在YOLOv5的SPP结构基础上改进得到的一种特征提取模块，旨在通过多尺度特征融合提高模型检测性能。C₃、C₄、C₅表示YOLOv8网络中的第三、第四、第五个特征提取阶段；P₃、P₄、P₅分别表示在C₃、C₄、C₅阶段提取的特征图。Concat为拼接操作，用于将不同层的特征图拼接在一起；UpSample为上采样操作，通过复制最近邻的像素值以提高图像分辨率；L_box和L_cls分别为回归损失函数和分类损失函数。

1.1 多尺度卷积

由于裂缝形态、大小和分布存在较大差异，有效捕捉不同尺度的裂缝特征至关重要。CNN在特征提取方面能力较强，但对多尺度裂缝识别有局限性，难以精准识别复杂尺度的裂缝。这是因为普通卷积的感受野固定，无法针对大小不同的裂缝进行自适应调整，检测时容易出现漏检或误检。当裂缝形态复杂、背景干扰较强时，漏检、误检现象更突出。

为提升模型对不同尺度裂缝的适应能力，引入多尺度卷积（PSConv）增强网络的鲁棒性，使算法更好地应对裂缝特征的变化。PSConv 通过动态调整卷积核的扩张因子，使模型自适应地处理不同尺度的裂缝信息，提高检测精度。

对比分析标准卷积^[18]（standard convolution，Sconv）、扩张卷积^[19]（dilated convolution，DConv）、多尺度卷积（PSConv）方案的计算策略以及优缺点。

（1）标准卷积

标准卷积是CNN最基础的计算操作，核心思想是使用小尺寸的卷积核滑动地对输入特征图进行加权求和。对于输入特征图X和卷积核W，标准卷积的计算式为

Y i, j = ∑ m ∑ n W m, n ⋅ X i + m, j + n

，（1）

式中：X(i, j)为输入特征图的像素值；W(m,n) 为卷积核权重；Y(i, j) 为输出特征图；m、n为卷积核滑动时的位置偏移量。

标准卷积中，卷积核的大小固定，因此当裂缝尺寸变化较大时，模型的感受野难以完全覆盖裂缝的关键信息。在实际应用中，这种情况较为常见，尤其是裂缝尺寸和形态存在较大变异时，标准卷积的局限性会更明显。

（2）扩张卷积

扩张卷积通过引入扩张因子，在卷积核元素之间插入空隙，使其能够覆盖更大的感受野，而不会增加参数量。扩张卷积的计算式为

Y i, j = ∑ m ∑ n W m, n ⋅ X i + r m, j + r n

，（2）

式中，r为扩张因子，决定卷积核中的元素间隔。

扩张卷积扩大了感受野，但在特征提取时增加了采样间隔，导致信息稀疏，影响检测的精度。尤其是在裂缝细节较为复杂的场景下，易出现信息丢失或误差累积的现象。因此，仅依赖扩张卷积来解决多尺度问题，仍存在局限性。

（3）多尺度卷积

多尺度卷积（PSConv）引入动态扩张因子和周期性分布策略，增强了对多尺度裂缝的捕捉能力。如图2所示，假设输入为

F ∈ R C i n × H × W

，卷积核为

g ∈ R C o u t × C i n × k × k

，输出为

H ∈ R C o u t × H × W

，其中C_in为卷积输入深度；C_out为卷积输出深度；H×W为图像大小；k×k为卷积核大小。

与标准卷积不同，PSConv能根据输入的通道信息和特征分布，动态调整r，使模型精准适配不同尺度的裂缝结构。这种灵活设计允许网络在不同尺度下自主选择合适的感受野，确保模型在小尺度裂缝检测时能关注到细节信息，在大尺度裂缝检测时也有较强的全局感知能力。此外，与扩张卷积相比，PSConv通过周期性分布策略进一步优化特征提取过程，避免因过度扩张导致的信息丢失。

1.2 高效通道注意力机制

裂缝特征存在多维度不确定性，涵盖尺寸、形态、纹理等多方面。为增强网络对这些复杂特征的鲁棒性，需要在空间维度上提取有效的特征，同时捕捉通道间的依赖关系。

引入PSConv模块后，算法在多尺度特征融合方面表现良好，但通道间关系建模仍有不足。为此，在算法模型中引入高效通道注意力模块ECA，其核心思想是根据通道数自适应调整卷积核大小，确保不同类型裂缝特征（如细微裂纹与交叉裂缝）均能被有效捕获。与传统的通道注意力方法不同，ECA采用一维卷积构建通道间的局部依赖关系，摆脱全连接层或复杂矩阵计算，因此能在提升特征表达能力的同时，保持较低的计算量，实现检测性能和实时性之间的良好平衡。

在通道注意力机制中，挤压与激励注意力机制^[20]（squeeze-and-excitation，SE）和自注意力机制^[21]（self-attention，SA）较为常见，这两种方式在不同的任务中展现了良好的效果，但各自也存在一定局限。

SE模块先对输入特征图进行全局平均池化（global average pooling，GAP），获取每个通道的全局信息，再通过两层全连接网络计算通道注意力权重，最后利用权重调整输入特征的通道强度，计算流程如下。

给定输入特征图

X ∈ R C × H × W

，SE对每个通道进行池化，得到

z c = 1 H W ∑ i = 1 H ∑ j = 1 W X c, i, j

，（3）

式中：z_c 为池化后通道级特征；X_c_,_i_,_j 为输入特征图第c通道在(i,j)处的特征值。

接着，经过两层全连接层，得到每个通道的注意力权重系数为

s c = σ W 2 δ W 1 z c

，（4）

式中：

δ ⋅

为ReLU激活函数；W₁、W₂分别为两层全连接层的可学习权重。

最终，得到每个通道的权重s_c 作为通道的注意力系数，作用于输入特征图，即

X' = X ⋅ s i g m o i d s c

。（5）

尽管SE机制能够有效建模通道关系，但由于依赖全连接层，在高分辨率图像处理时计算量较大，容易增加推理时间。

SA通过计算输入特征之间的相似性，建立全局依赖关系。首先，将输入序列 X 通过线性变换生成查询矩阵 Q 、键矩阵 K 、值矩阵 V，分别为

Q = X W Q, K = X W K, V = X W V

，

其中， W_Q 、 W_K 、 W_V

∈ R C × C

为可学习矩阵。

随后，采用点积计算 Q 与 K 的相似度得分，经缩放和归一化后再与 V 相乘，生成最终的输出序列为

X S A = s o f t m a x Q K T d V

，（6）

式中：

d

为缩放因子；

s o f t m a x ⋅

为归一化函数。

SA 可以捕捉长距离的特征关系，但计算复杂度高，在高分辨率图像任务中，难以直接应用于对实时性有严格限制的下游任务中。

ECA采用一种更轻量级的方式对通道间的关系进行建模，核心思想是利用一维卷积来高效提取通道间的依赖信息，而不引入全连接层或矩阵运算，ECA计算流程见图3。

首先，对输入特征图进行全局平均池化，即

z c = 1 H W ∑ i = 1 H ∑ j = 1 W X c, i, j

。（7）

随后，通过一维卷积来学习通道间的依赖关系，即

ω c = σ C o n v 1 z c

，（8）

式中：Conv₁表示一维卷积操作；

σ ⋅

为激活函数。根据通道间的局部依赖性自适应调整卷积核大小，以更高效的方式学习通道注意力。

最后，采用ECA计算得到的通道注意力权重调整输入特征，增强重要通道的信息表达能力，降低无关通道的影响。

1.3 损失函数

在目标检测任务中，边界框回归（bounding box regression）的作用是让模型的预测框尽可能贴合真实框。YOLOv8采用CIoU边界框回归损失函数，其核心公式为

L C I o U = 1 - I o U + ρ 2 / c 2 + a v

，（9）

式中：

I o U

为交并比；

ρ

为两中心点的欧式距离；

c

为真实框和预测框最小闭包区域的对角线长度；

a

为动态权重；v为用于衡量真实框与预测框宽高比一致性的参数。

ρ = x g - x 2 + y g - y 2

，（10）

v = 4 π 2 a r c t a n w g / h g - a r c t a n w / h 2

，（11）

α = v 1 - I o U + v

，（12）

式（10）～式（12）中：(x_g,y_g )和(x,y)分别为真实框和预测框中心点的坐标；w_g 为真实框宽度；h_g 为真实框高度；w为预测框宽度；h为预测框高度。

混凝土裂缝有细长、狭窄、不规则等形态，在检测任务中，对边界框的预测精度要求较高。CIoU主要关注交并比、中心点距离、高宽比，无法调整预测框的旋转方向，导致预测框易偏离裂缝主方向，当计算高宽比合理性时，CIoU采用式（9）计算。当裂缝为细长形时，高宽比较大，梯度更新过慢，收敛减慢，导致裂缝检测框过大或过小，检测精度降低。

SIoU损失函数综合考虑几何特征，优化模型，提高检测准确度和稳定性，由以下损失组成。

角度损失衡量预测框与真实框中心连线的方向偏差，采用反三角函数量化角度误差，表示为

Λ = 1 - 2 s i n 2 a r c s i n χ

，（13）

其中，

χ

为反映方向对齐程度的参数，表示为

χ = y g - y x g - x 2 + y g - y 2

。（14）

距离损失结合两中心点欧式距离和角度损失，表示为

Δ = ∑ ρ 2 Λ / c 2

。（15）

距离损失项鼓励预测框的中心点向真实框靠拢，提高定位精度。

形状损失引入宽高差异的惩罚项，通过参数

γ

动态控制对形状敏感度，增强模型对目标尺寸变化的适应性，表示为

Ω = ∑ w - w g 2 + h - h g 2 w g + h g 2 ⋅ γ

。（16）

真实框与预测框的传统交并比损失计为

L I o U = 1 - B p ⋂ B g B p ⋃ B g

，（17）

式中，B_p 和B_g 分别表示预测框和真实框区域。

综合以上4项损失，SIoU损失函数表示为

L S I o U = L I o U + Δ + Ω 2

。（18）

式（18）在传统IoU损失的基础上，通过动态形状损失项增强对框尺寸变化的适应性，结合角度和距离损失联合优化，提升了模型检测精度。

2 实验结果与分析

2.1 数据集

采用3 051张混凝土裂缝图片构建数据集，按照4∶1将数据集分割为训练集和测试集。数据集包含不同类型的裂缝，如横向裂缝、纵向裂缝、网状裂缝和细小裂缝等，同时涵盖不同光照、噪声干扰下的裂缝，确保模型的泛化能力。通过标注工具LabelImg手工标注原始图像中的裂缝，生成.xml格式文件，再利用python脚本转换为.txt格式文件，用于YOLOv8改进模型的训练。

2.2 实验环境

实验环境参数见表1。采用评价指标mAP₅₀、mAP_50-95衡量模型检测框的精准度，F1分数综合衡量模型的召回率和查准率，计算量和参数规模衡量模型的计算效率和规模大小。

2.3 消融实验

为验证改进模型各模块的有效性，对引入的各个模块进行消融实验，各评价指标的计算结果见表2。表2中，模型A为基准模型YOLOv8s，在模型A的基础上依次加入PSConv、ECA和SIoU损失函数，得到模型B、模型C、模型D。

由表2可知，与模型A相比，引入PSConv模块后，模型B的mAP₅₀和F1分别提升了3.7%和1.5%，表明引入PSConv模块增强了跨尺度特征的学习能力，提高了模型的检测精度。PSConv模块的引入并没有明显增加计算复杂度，计算量仅增加了4.4 GFLOPs。引入ECA模块后，模型C的mAP₅₀和F1提升至86.4%和84.1%，计算量降低至28.2 GFLOPs，优于模型A，证明ECA模块的引入优化了通道间的信息交互，既降低了计算成本，又增强了模型的检测性能。同时引入ECA、PSConv和SIoU的模型D（YOLO-CCD模型），整体性能最佳，相较于模型A，其mAP₅₀和F1分别提升了7.9%和2.4%，计算量降低了4.5 GFLOPs。

YOLO-CCD模型未显著增加模型大小，参数量仅提高了1.5×10⁶，表明该模型在保持高精度和高效率的同时，依然满足轻量化要求，各模块引入阶段的性能递进也验证了模型设计的有效性。

2.4 与其他方法对比实验

为进一步评估YOLO-CCD模型在裂缝检测中的效果，在相同的数据集上，分别与主流的裂缝检测模型Faster-RCNN、SSD、YOLOv3-tiny、YOLOv5s、YOLOv8s进行对比实验，结果见表3。

由表3可知，YOLO-CCD模型的mAP₅₀和mAP_50-95分别达到89.8%和64.6%。与Faster R-CNN模型相比，YOLO-CCD模型的mAP₅₀和mAP_50-95分别提升了15.7个百分点和11.0个百分点。与SSD算法对比，YOLO-CCD模型的mAP₅₀和mAP_50-95分别提升了19.7个百分点和12.9个百分点。YOLO-CCD的计算效率和模型大小也均优于Faster R-CNN模型和SSD模型。与YOLOv3-tiny模型和YOLOv5s模型对比，YOLO-CCD模型的体积较高，YOLO-CCD模型的mAP₅₀分别提升了12.5个百分点、9.01个百分点，mAP_50-95分别提升了5.3个百分点、10.8个百分点，F1分别提升了7.3个百分点、8.2个百分点，计算复杂度分别降低了11 GFLOPs和28.2 GFLOPs。将YOLO-CCD模型与YOLOv8s模型对比可见，这两种模型的检查精度均较高，但从模型计算量、参数量等方面对比可见， YOLO-CCD模型更优。

2.5 可视化对比

为测试YOLO-CCD模型的检测效果，选取现场采集的典型裂缝图进行测试，结果见图4。

对比图4（a）、图4（b）、图4（c）中的第一个图片样本可知，在裂缝出现分叉时，YOLOv8容易产生多个检测框，一定程度上存在重复输出，影响模型计算效率。YOLO-CCD模型中引入了多尺度卷积，增强了模型的特征提取能力。对比图4（a）、图4（b）、图4（c）中第二个图片样本可知，YOLOv8模型在细小裂缝的检测上存在漏检，而YOLO-CCD模型能准确检测到细微裂缝，表明YOLO-CCD模型在引入了ECA模块后，能充分捕捉微小目标，增强了对细节的把握，更适应小尺寸目标检测。对比图4（a）、图4（b）、图4（c）中第三个图片样本可知，YOLOv8模型将图片上的深色污渍错误识别为裂缝，而YOLO-CCD能准确识别出裂缝，表明该模型抗干扰能力更优，检测精度更高。

3 结论

（1）提出一种改进的轻量级混凝土裂缝检测模型YOLO-CCD，该模型基于YOLOv8架构，引入PSConv多尺度卷积模块，结合ECA通道注意力机制，并改进损失函数，增强了模型对不同尺度裂缝的适应性和特征表达能力。

（2）通过消融实验和对比实验可知，YOLO-CCD模型的mAP₅₀、mAP_50-95和F1分数等检测精度指标均有提升，证明了YOLO-CCD模型的可行性。

（3）现场实验证明，与基准模型YOLOv8s相比，YOLO-CCD模型的检测精度更高，对复杂背景裂缝检测性能更优。

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	潘远, 周双喜, 杨丹. 基于改进Unet模型的混凝土裂缝分割研究[J]. 华东交通大学学报, 2024, 41(1): 11-19.

[2]	PAN Yuan, ZHOU Shuangxi, YANG Dan. Research on concrete crack segmentation based on improved unet model[J]. Journal of East China Jiaotong University, 2024, 41(1): 11-19.

[3]	ZHENG X C, LIU F, LUO T, et al. Study on durability and pore characteristics of concrete under salt freezing environment[J]. Materials, 2021, 14(23): 7228.

[4]	杨国俊,齐亚辉,石秀名.基于数字图像技术的桥梁裂缝检测综述[J].吉林大学学报(工学版),2024,54(2):313-332.

[5]	YANG Guojun, QI Yahui, SHI Xiuming.Review of bridge crack detection based on digital image technology[J]. Journal of Jilin University (Engineering and Technology Edition),2024,54(2):313-332.

[6]	张在岩,宋伟东,邬嘉晨.改进YOLOv5的复杂场景下水泥路面病害检测[J].辽宁工程技术大学学报(自然科学版),2025,44(1): 102-112.

[7]	ZHANG Zaiyan, SONG Weidong, WU Jiachen. Disease detection of cement pavement based on improved YOLOv5 in complex scenarios[J]. Journal of Liaoning Technical University (Natural Science),2025,44(1): 102-112.

[8]	曹锦纲, 杨国田, 杨锡运. 基于注意力机制的深度学习路面裂缝检测[J]. 计算机辅助设计与图形学学报, 2020, 32(8): 1324-1333.

[9]	CAO Jingang, YANG Guotian, YANG Xiyun. Pavement crack detection with deep learning based on attention mechanism[J]. Journal of Computer-Aided Design & Computer Graphics, 2020, 32(8): 1324-1333.

[10]	朱磊, 李东彪, 闫星志, 等. 基于改进Mask R-CNN深度学习算法的隧道裂缝智能检测方法[J]. 图学学报, 2023, 44(1): 177-183.

[11]	ZHU Lei, LI Dongbiao, YAN Xingzhi, et al. Intelligent detection method of tunnel cracks based on improved Mask R-CNN deep learning algorithm[J]. Journal of Graphics, 2023, 44(1): 177-183.

[12]	NGUYEN S D, TRAN T S, TRAN V P, et al. Deep learning-based crack detection: a survey[J]. International Journal of Pavement Research and Technology, 2023, 16(4): 943-967.

[13]	何兆益,常宝霞,吴逸飞,等.基于YOLO v5-IBX网络模型的公路隧道衬砌裂缝检测方法研究[J].沈阳建筑大学学报(自然科学版),2023,39(5):888-898.

[14]	HE Zhaoyi, CHANG Baoxia, WU Yifei,et al.Research on crack detection method of highway tunnel lining based on YOLO v5-IBX network model[J]. Journal of Shenyang Jianzhu University(Natural Science), 2023,39(5):888-898.

[15]	CHAIYASARN K, BUATIK A, MOHAMAD H, et al. Integrated pixel-level CNN-FCN crack detection via photogrammetric 3D texture mapping of concrete structures[J]. Automation in Construction, 2022, 140: 104388.

[16]	GOLDING V P, GHARINEIAT Z, MUNAWAR H S, et al. Crack detection in concrete structures using deep learning[J]. Sustainability, 2022, 14(13): 8117.

[17]	翟军治, 孙朝云, 裴莉莉, 等. 多尺度特征增强的路面裂缝检测方法[J]. 交通运输工程学报, 2023, 23(1): 291-308.

[18]	ZHAI Junzhi, SUN Zhaoyun, PEI Lili, et al. Pavement crack detection method based on multi-scale feature enhancement[J]. Journal of Traffic and Transportation Engineering, 2023, 23(1): 291-308.

[19]	DENG J H, LU Y, LEE V C. Imaging-based crack detection on concrete surfaces using You Only Look Once network[J]. Structural Health Monitoring, 2021, 20(2): 484-499.

[20]	PARK S E, EEM S H, JEON H. Concrete crack detection and quantification using deep learning and structured light[J]. Construction and Building Materials, 2020, 252: 119096.

[21]	谌婷婷, 魏怡. 基于改进YOLOv4的混凝土裂缝检测方法[J]. 激光杂志, 2024, 45(1): 80-85.

[22]	SHEN Tingting, WEI Yi. Improved YOLOv4-based concrete crack detection method[J]. Laser Journal, 2024, 45(1): 80-85.

[23]	MI N H, ZHANG X X, HE X, et al. CBMA: coded-backscatter multiple access[C]//2019 IEEE 39th International Conference on Distributed Computing Systems. July 7-10, 2019, Dallas, TX, USA. IEEE, 2019: 799-809.

[24]	HU J, SHEN L, SUN G. Squeeze-and-excitation networks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. June 18-23, 2018, Salt Lake City, UT, USA. IEEE, 2018: 7132-7141.

[25]	LEVINE Y, WIES N, SHARIR O, et al. Limits to depth-efficiencies of self-attention[J]. Advances in Neural Information Processing Systems, 2020, 33: 22640-22651.

[26]	GAO R. Rethinking dilated convolution for real-time semantic segmentation[C]//2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. June 17-24, 2023, Vancouver, BC, Canada. IEEE, 2023: 4675-4684.

[27]	PAN X R, GE C J, LU R, et al. On the integration of self-attention and convolution[C]//2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition. June 18-24, 2022, New Orleans, LA, USA. IEEE, 2022: 805-815.

[28]	令晓明, 陈鸿雁, 张小玉, 等. 基于ASP-SERes2Net的说话人识别算法[J]. 北京工业大学学报, 2025, 51(1): 42-50.

[29]	LING Xiaoming, CHEN Hongyan, ZHANG Xiaoyu, et al. Speaker recognition algorithm based on ASP-SERes2Net[J]. Journal of Beijing University of Technology, 2025, 51(1): 42-50.

[30]	ZHOU J L, ZHANG Y Y, WANG J P. RDE-YOLOv7: an improved model based on YOLOv7 for better performance in detecting dragon fruits[J]. Agronomy, 2023, 13: 1042.