一种基于Informer模型的图像识别方法

赵绪成, 肖俊

桂林电子科技大学学报 ›› 2024, Vol. 44 ›› Issue (06) : 650 -656.

PDF
桂林电子科技大学学报 ›› 2024, Vol. 44 ›› Issue (06) : 650 -656. DOI: 10.16725/j.1673-808X.2024170

一种基于Informer模型的图像识别方法

作者信息 +

Author information +
文章历史 +
PDF

摘要

为提升图像识别效果,满足当前复杂的图像识别任务,利用Informer模型设计了一种图像识别方法。该模型通过引入稀疏自注意力机制,有效降低了模型的时间复杂度和内存使用率。此外,采用生成式的解码器结构获取图像序列的输出,有效避免了模型推理阶段的累积误差传播。为了验证模型的效果,采用了3种不同类型的细粒度图像识别数据集:Road Sign Detection数据集、Stanford Cars数据集和中国交通标志检测数据集。Road Sign Detection数据集被用于初步验证图像识别模型的效果,而Stanford Cars数据集和CCTSDB数据集则是为了验证设计的图像识别模型在车辆识别和复杂场景下的识别效果。识别结果表明,在背景信息非常复杂的情况下,注意力层难以快速定位到关键特征区域,在经过多轮特征提取后,编码器得到了大量的无关特征,导致解码器在推理生成阶段缺乏充足的优质信息,致使模型训练不充分,降低了图像识别的准确率,但该图像识别模型仍能克服噪声信息的干扰,能取得较高的图像识别准确率。

关键词

图像识别 / Transformer模型 / Informer模型 / 注意力 / 细粒度分类

Key words

引用本文

引用格式 ▾
赵绪成, 肖俊 一种基于Informer模型的图像识别方法[J]. 桂林电子科技大学学报, 2024, 44(06): 650-656 DOI:10.16725/j.1673-808X.2024170

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

21

访问

0

被引

详细

导航
相关文章

AI思维导图

/