基于渐进多粒度训练深度学习的矿物图像识别

万成舟 , 季晓慧 , 杨眉 , 何明跃 , 张招崇 , 曾姗 , 王玉柱

地学前缘 ›› 2024, Vol. 31 ›› Issue (4) : 112 -118.

PDF (2344KB)
地学前缘 ›› 2024, Vol. 31 ›› Issue (4) : 112 -118. DOI: 10.13745/j.esf.sf.2024.5.1
深度学习与图像识别

基于渐进多粒度训练深度学习的矿物图像识别

作者信息 +

Mineral image recognition based on progressive deep learning across different granularity levels

Author information +
文章历史 +
PDF (2399K)

摘要

近年来,随着深度学习在地学领域中的应用,矿物图像识别变得越来越重要。虽然已经有研究将深度学习应用于矿物图像识别,并取得了一定的成果,但在大规模矿物数据集上的识别准确率仍然有待进一步提高。不同矿物之间可能存在细微的形态、纹理和颜色差异,符合细粒度识别算法特征,但以往的研究中很少有人采用细粒度方法进行矿物识别。所以本文提出了一种基于Next-ViT模型的细粒度矿物识别方法,通过引入渐进式多粒度训练拼图技术,实现对矿物图像的精确分类。首先采用Next-ViT模型作为特征提取器,该模型结合了Transformer结构和卷积神经网络的优势,能够提取到丰富的图像特征;接下来利用随机拼图生成器创建不同粒度级别的矿物拼图,这些拼图包含从细节到整体的多种信息。训练过程中采用渐进式多粒度训练策略,在训练的早期阶段,模型主要关注细粒度的特征,通过学习拼图中的细节信息来区分不同的矿物,随着训练的深入,模型逐渐将注意力转移到更大粒度级别的特征上,学习更加抽象和全局的信息。通过这种方式,模型能够充分利用不同粒度级别的信息,提高矿物识别的准确性。实验结果表明,该模型在常见的36种矿物数据集上取得了86.5%的准确率,有效地提高了矿物识别的准确率。这表明,细粒度识别方法对于矿物识别是有效的。

关键词

矿物识别 / 深度学习 / Next-ViT / 细粒度识别 / 渐进式多粒度训练

Key words

mineral identification / deep learning / Next-ViT / fine-grained identification / progressive multi-granularity-level training

引用本文

引用格式 ▾
万成舟, 季晓慧, 杨眉, 何明跃, 张招崇, 曾姗, 王玉柱 基于渐进多粒度训练深度学习的矿物图像识别[J]. 地学前缘, 2024, 31(4): 112-118 DOI:10.13745/j.esf.sf.2024.5.1

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

基金资助

国家科技资源共享服务平台——国家岩矿化石标本资源库子项目(NCSTI-RMF20230107)

AI Summary AI Mindmap
PDF (2344KB)

22

访问

0

被引

详细

导航
相关文章

AI思维导图

/