融合通道注意力机制的非规则文本识别模型

李正岩, 李嵩爽, 潘昱辰, 邓悦, 钱夔

南京工程学院学报(自然科学版) ›› 2024, Vol. 22 ›› Issue (2) : 7 -13.

南京工程学院学报(自然科学版) ›› 2024, Vol. 22 ›› Issue (2) : 7 -13. DOI: 10.13960/j.issn.1672-2558.2024.02.002

融合通道注意力机制的非规则文本识别模型

    李正岩, 李嵩爽, 潘昱辰, 邓悦, 钱夔
作者信息 +

Author information +
文章历史 +

摘要

针对自然场景下文本字体倾斜、背景复杂导致文本识别困难问题,本文提出一种融合通道注意力机制的非规则文本检测识别模型.首先,应用CRAFT算法与图像后处理技术以字符中心和相邻字符中心概率检测非规则文本区域,实现检测区域图像背景替换、倾斜文本旋转矫正以及文本行提取;然后构建融合通道注意力机制SENet的文本识别模型SE-CRNN,通过自适应学习通道权重与数据增强等手段实现复杂背景的文本识别.试验结果表明,该模型在文本倾斜和灰度不一致的情况下仍具有较高的文本识别精度,SE-CRNN模型在测试集上的识别准确率达到84.2%.

关键词

文本识别 / 图像处理 / 注意力机制 / 数据增强

Key words

引用本文

引用格式 ▾
李正岩, 李嵩爽, 潘昱辰, 邓悦, 钱夔. 融合通道注意力机制的非规则文本识别模型[J]. 南京工程学院学报(自然科学版), 2024, 22(2): 7-13 DOI:10.13960/j.issn.1672-2558.2024.02.002

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

基金资助

江苏省自然科学青年基金项目(BK20210931); 江苏省产学研合作项目(BY2021023); 南京工程学院大学生科技创新基金项目(TB202417016)

AI Summary AI Mindmap

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/