PDF
摘要
为解决基于深度学习方法在苗族服饰图像分割任务中存在特征信息丢失的问题,设计了一种基于Deep Labv3+网络的苗族服饰识别网络Efficient-Deep Labv3+。该网络利用Mosaic数据增强,以增加训练时图像的背景复杂程度,使网络在不增加额外计算开销的情况下,能够提取到更多的图像特征信息;使用标签平滑,以减少真实标签训练时的损失权重,降低其在分割效果上因过拟合而产生的不良影响;再次,引入辅助分支结构,使损失函数能够计算所有网络层的损失值;提出联合损失函数计算损失值以预防梯度爆炸,使网络训练更加稳定;提出多级衰减余弦退火算法,使网络训练时能够找到全局最优学习率,加快网络的收敛速度。实验结果表明,在苗族服饰数据集上,平均交并比(MIo U)及类别平均像素准确率(MPA)分别达到了84.96%、93.7%,在PASCAL VOC2012数据集上,Efficient-Deep Labv3+网络的分割效果优于其他网络。
关键词
苗族服饰
/
深度学习
/
语义分割
/
卷积网络
/
Deep Labv3+
Key words
甘甜, 蒋华, 颜靖柯, 王慧娇
基于Deep Labv3+的苗族服饰识别网络[J].
桂林电子科技大学学报, 2022, 42(05): 412-422 DOI:10.16725/j.cnki.cn45-1351/tn.2022.05.006