基于链接关系预测的弯曲密集型商品文本检测

耿磊, 李嘉琛, 刘彦北, 李月龙, 李晓捷

天津工业大学学报 ›› 2024, Vol. 43 ›› Issue (04) : 50 -59+74.

PDF (2281KB)
天津工业大学学报 ›› 2024, Vol. 43 ›› Issue (04) : 50 -59+74.

基于链接关系预测的弯曲密集型商品文本检测

    耿磊, 李嘉琛, 刘彦北, 李月龙, 李晓捷
作者信息 +

Author information +
文章历史 +
PDF (2335K)

摘要

针对商品包装文本检测任务中弯曲密集型文本导致的错检、漏检问题,提出了一种由2个子网络组成的基于链接关系预测的文本检测框架(text detection network based on relational prediction,RPTNet)。在文本组件检测网络中,下采样采用卷积神经网络和自注意力并行的双分支结构提取局部和全局特征,并加入空洞特征增强模块(DFM)减少深层特征图在降维过程中信息的丢失;上采样采用特征金字塔与多级注意力融合模块(MAFM)相结合的方式进行多级特征融合以增强文本特征间的潜在联系,通过文本检测器从上采样输出的特征图中检测文本组件;在链接关系预测网络中,采用基于图卷积网络的关系推理框架预测文本组件间的深层相似度,采用双向长短时记忆网络将文本组件聚合为文本实例。为验证RRNet的检测性能,构建了一个由商品包装图片组成的文本检测数据集(text detection dataset composed of commodity packaging,CPTD1500)。实验结果表明:RPTNet不仅在公开文本数据集CTW-1500和Total-Text上取得了优异的性能,而且在CPTD1500数据集上的召回率和F值分别达到了85.4%和87.5%,均优于当前主流算法。

关键词

文本检测 / 卷积神经网络 / 自注意力 / 特征融合 / 图卷积网络 / 双向长短时记忆网络

Key words

引用本文

引用格式 ▾
基于链接关系预测的弯曲密集型商品文本检测[J]. 天津工业大学学报, 2024, 43(04): 50-59+74 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF (2281KB)

100

访问

0

被引

详细

导航
相关文章

AI思维导图

/