基于ResNeSt和改进Transformer的多标签图像分类算法

王贺, 张震

测试技术学报 ›› 2024, Vol. 38 ›› Issue (01) : 48 -53.

PDF
测试技术学报 ›› 2024, Vol. 38 ›› Issue (01) : 48 -53.

基于ResNeSt和改进Transformer的多标签图像分类算法

    王贺, 张震
作者信息 +

Author information +
文章历史 +
PDF

摘要

目前,基于深度学习的多标签分类算法还存在一些问题,如标签之间的相关性有待提高,如何解决小目标分类等。为此提出了一种多标签图像分类算法,该算法使用分裂注意力网络ResNeSt进行特征提取,并使用BatchFormerV2与Transformer形成双分支网络对特征进行编码,解码阶段使用Transformer Decoder的交叉注意模块来自适应地处理特征以达到更好的分类效果。实验结果表明:该模型在COCO数据集上的mAP为88.4%,在VOC2007数据集上的平均精度为96.0%,一定程度上提高了多标签图像分类的准确率。

关键词

深度学习 / 多标签分类 / ResNeSt / Transformer

Key words

引用本文

引用格式 ▾
基于ResNeSt和改进Transformer的多标签图像分类算法[J]. 测试技术学报, 2024, 38(01): 48-53 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

44

访问

0

被引

详细

导航
相关文章

AI思维导图

/