面向文本识别的CRNN模型的改进

吕艳辉, 刘明鑫

沈阳理工大学学报 ›› 2024, Vol. 43 ›› Issue (04) : 27 -31.

PDF (1479KB)
沈阳理工大学学报 ›› 2024, Vol. 43 ›› Issue (04) : 27 -31.

面向文本识别的CRNN模型的改进

    吕艳辉, 刘明鑫
作者信息 +

Author information +
文章历史 +
PDF (1514K)

摘要

复杂场景下文本识别因阴影、残缺、模糊、虚化等因素会出现识别精度下降问题。鉴于此,提出一种基于特征融合与双向简化门结构的CRNN模型。首先引入特征融合机制改进卷积神经网络(CNN)模型,利用特征金字塔结构,多加一条自底向上的路径,将低层特征与高层特征融合在一起,以保留更多低层细节特征,提高场景文本识别精度;其次通过合并遗忘门与输入门,得到结构更简单、计算量和参数量更少的简化门结构替换长短期记忆(LSTM)网络改进循环神经网络(RNN)模型部分;最后设计消融实验验证改进后模型的有效性。三个数据集的测试结果表明:在ResNet50做主干网络时,与原始模型相比,改进后模型准确率提升了1.5%以上;在MobileNetV3做主干网络时,准确率提升了1.4%以上。

关键词

特征融合 / 长短期记忆网络 / 简化门结构

Key words

引用本文

引用格式 ▾
面向文本识别的CRNN模型的改进[J]. 沈阳理工大学学报, 2024, 43(04): 27-31 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF (1479KB)

112

访问

0

被引

详细

导航
相关文章

AI思维导图

/