基于单一视觉模型的长文本箱号识别算法

江苏海洋大学学报(自然科学版) ›› 2025, Vol. 34 ›› Issue (03) : 79 -84.

PDF
江苏海洋大学学报(自然科学版) ›› 2025, Vol. 34 ›› Issue (03) : 79 -84.

基于单一视觉模型的长文本箱号识别算法

作者信息 +

Author information +
文章历史 +
PDF

摘要

集装箱箱号多为水平和垂直排列,且受环境影响存在箱号模糊、遮挡问题,导致箱号识别效果较差。对此,提出一种基于单一视觉模型的长文本箱号识别算法。将箱号文本图像划分为多个字符块,基于Transformer和CNN构建局部和全局自注意力模块,分阶段地提取多尺度、长距离的文本图像特征,无需考虑字符的排列方向。局部自注意力模块通过计算局部区域内字符块之间的相关性以感知字符内部的细粒度笔画特征;全局自注意力模块则计算全局字符块之间的相关性,捕捉全局字符间的长距离依赖。该算法是一种基于字符块的图像标记化框架的文本识别模型,省略了序列特征建模阶段,从而显著减少了计算资源的消耗。为验证该算法的有效性,对收集的集装箱箱号文本数据集进行训练测试。实验结果表明,该算法在箱号文本数据集上的识别准确率为95.3%,参数量为3.8×10~6个,在硬件资源受限的场景中,对模糊的长文本箱号识别具有较好的效果。

关键词

集装箱箱号识别 / 字符块 / 单一视觉模型 / 局部自注意力模块 / 全局自注意力模块

Key words

引用本文

引用格式 ▾
基于单一视觉模型的长文本箱号识别算法[J]. 江苏海洋大学学报(自然科学版), 2025, 34(03): 79-84 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

41

访问

0

被引

详细

导航
相关文章

AI思维导图

/