基于两阶段深度学习的表格结构识别方法

孙寅生, 袁贞明

杭州师范大学学报(自然科学版) ›› 2024, Vol. 23 ›› Issue (3) : 255 -264.

PDF
杭州师范大学学报(自然科学版) ›› 2024, Vol. 23 ›› Issue (3) : 255 -264. DOI: 10.19926/j.cnki.issn.1674-232X.2023.02.141

基于两阶段深度学习的表格结构识别方法

    孙寅生, 袁贞明
作者信息 +

Author information +
文章历史 +
PDF

摘要

鉴于在图像中识别表格结构面临着表格样式众多、图像质量各异等难题,提出一种融合表格线与文字块信息的两阶段深度学习框架,以实现少线复杂表格结构的识别.首先,将残差结构引入U-Net语义分割网络中,增强网络传递表格线信息能力,完成表格线的识别;然后,加入文字块位置信息以提高模型识别无线或少线表格结构的能力.该方法在PubTabNet数据集上的树编辑距离(tree-edit-distance similarity, TEDS)评分达到95.95.实验证明,该方法在识别少线表或无线表时表现优秀,并能高效、准确地识别存在合并单元格的复杂结构表格.

关键词

表格识别 / 语义分割 / 深度学习

Key words

引用本文

引用格式 ▾
基于两阶段深度学习的表格结构识别方法[J]. 杭州师范大学学报(自然科学版), 2024, 23(3): 255-264 DOI:10.19926/j.cnki.issn.1674-232X.2023.02.141

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/