改进SLANet的OCR表结构识别方法

曹茂俊, 李悦

吉林大学学报(信息科学版) ›› 2025, Vol. 43 ›› Issue (01) : 98 -106.

PDF
吉林大学学报(信息科学版) ›› 2025, Vol. 43 ›› Issue (01) : 98 -106. DOI: 10.19292/j.cnki.jdxxp.2025.01.013

改进SLANet的OCR表结构识别方法

    曹茂俊, 李悦
作者信息 +

Author information +
文章历史 +
PDF

摘要

针对传统的识别表结构方法难以充分学习多行多列合并、空白、嵌套单元格等复杂表结构以及提取特征过程中容易出现信息缺失的问题,提出了一种改进SLANet(Structure Location Alignment Network)的OCR(Optical Character Recognition)表结构识别方法。首先,利用轻量级CPU(Central Processing Unit)卷积神经网络并引入注意力机制,增强网络泛化和解释能力,将训练得到信息向量输入轻量级高低层特征融合模块中提取特征,并将输出特征通过特征解码模块对齐结构与位置信息,得到预测标签。实验表明,与EDD(Encoder-Dual-Decoder)、 TableMaster等模型相比,该方法准确率有显著提升,达到76.95%, TEDS(Tree-Edit-Distance-based Similarity)达到95.57%,显著增强了模型识别非常规复杂表结构能力,为识别表结构提供了一种优化策略。

关键词

识别表结构 / 结构位置对齐网络 / 注意力机制 / 基于树编辑距离的相似度

Key words

引用本文

引用格式 ▾
改进SLANet的OCR表结构识别方法[J]. 吉林大学学报(信息科学版), 2025, 43(01): 98-106 DOI:10.19292/j.cnki.jdxxp.2025.01.013

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

76

访问

0

被引

详细

导航
相关文章

AI思维导图

/