基于注意力融合的文本检测方法

薛冀杰, 高光勇, 高云龙

重庆邮电大学学报(自然科学版) ›› 2026, Vol. 38 ›› Issue (1) : 177 -186.

PDF
重庆邮电大学学报(自然科学版) ›› 2026, Vol. 38 ›› Issue (1) : 177 -186.

基于注意力融合的文本检测方法

    薛冀杰, 高光勇, 高云龙
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对复杂背景环境和多尺度文本片段所带来的文本检测精度与鲁棒性挑战,提出了一种基于融合注意力的改进文本检测方法。对传统的特征金字塔网络进行优化与调整,改进特征图之间的联合方式,设计了一个语义信息增强模块(semantic information enhancement module, SIEM),提升模型对文本语义信息的捕捉与理解能力。结合空洞注意力机制以及空间、通道注意力机制,设计一个全新的融合注意力模块(dilated attention module, DAM)。这一模块在特征提取阶段后引入,通过对特征图进行精细化的处理,获得更为全面且丰富的文本特征映射。在数据集ICDAR2015和MSRA-TD500的实验结果表明,无论是在检测精度、召回率还是F1值等关键评估指标上,模型都取得了显著的提升。

关键词

场景文本检测 / 融合注意力 / 注意力机制

Key words

引用本文

引用格式 ▾
基于注意力融合的文本检测方法[J]. 重庆邮电大学学报(自然科学版), 2026, 38(1): 177-186 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/