关键区域鉴别联合多粒度知识蒸馏的细粒度图像分类

余鹰, 王景辉, 危伟, 钱进

小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (08) : 1960 -1967.

PDF
小型微型计算机系统 ›› 2025, Vol. 46 ›› Issue (08) : 1960 -1967. DOI: 10.20009/j.cnki.21-1106/TP.2024-0314

关键区域鉴别联合多粒度知识蒸馏的细粒度图像分类

    余鹰, 王景辉, 危伟, 钱进
作者信息 +

Author information +
文章历史 +
PDF

摘要

近年来,随着深度学习技术的飞速发展,研究人员开始尝试将Vision Transformer(ViT)应用于细粒度图像分类.然而,尽管ViT的多头自注意力机制赋予了模型强大的全局信息捕捉能力,但在关注局部微小且判别力强的区域上仍显不足,这在一定程度上限制了其在细粒度图像分类任务中的表现.为了解决这一问题,本文提出了一种高效且平滑地融合多层自注意力权重的方法,以深入挖掘图像的局部判别特征,从而弥补传统ViT模型在细节信息捕捉上的不足,增强模型对图像细微特征的敏感性.此外,本文构建了助理教师网络来指导学生网络学习多种粒度的特征信息,进一步提升其捕捉细微特征的能力.为了验证所提出模型的有效性,本文在多个基准数据集上进行了实验.结果表明,该模型显著优于传统ViT模型,展现了强大的局部特征捕捉能力和优异的分类性能.

关键词

细粒度图像分类 / 自注意力机制 / 知识蒸馏 / vision transformer / 关键区域鉴别

Key words

引用本文

引用格式 ▾
关键区域鉴别联合多粒度知识蒸馏的细粒度图像分类[J]. 小型微型计算机系统, 2025, 46(08): 1960-1967 DOI:10.20009/j.cnki.21-1106/TP.2024-0314

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

54

访问

0

被引

详细

导航
相关文章

AI思维导图

/