基于复合注意力机制的文档版面分析算法

谢海龙, 罗玮, 徐涛涛, 杨文青, 陈丹丹, 董前前

西安邮电大学学报 ›› 2025, Vol. 30 ›› Issue (03) : 103 -110.

PDF
西安邮电大学学报 ›› 2025, Vol. 30 ›› Issue (03) : 103 -110. DOI: 10.13682/j.issn.2095-6533.2025.03.012

基于复合注意力机制的文档版面分析算法

    谢海龙, 罗玮, 徐涛涛, 杨文青, 陈丹丹, 董前前
作者信息 +

Author information +
文章历史 +
PDF

摘要

为应对海量非结构化文档中关键信息快速提取的挑战,提出一种基于复合注意力机制的文档版面分析算法。该算法先在特征金字塔网络中添加空间注意力机制聚焦文档图像中信息密集的区域,引入可变性卷积解决偏移域的问题。然后通过连接通道注意力机制自适应调整特征通道的权重,以提升文档图像特征表征质量。最后,采用残差连接方式改善深层网络中的梯度消失问题,从而实现图像特征高效融合。实验结果表明,所提算法在PubLayNet英文数据集和CDLA中文数据集上的mAP分别为88.2%和94.3%,相比对比算法分别提升了0.6%和3.3%,对复杂文档中存在的多元化表格具有更好的检测效果。

关键词

文档版面分析 / 大语言模型 / 特征金字塔网络 / 空间注意力机制 / 通道注意力机制

Key words

引用本文

引用格式 ▾
基于复合注意力机制的文档版面分析算法[J]. 西安邮电大学学报, 2025, 30(03): 103-110 DOI:10.13682/j.issn.2095-6533.2025.03.012

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

103

访问

0

被引

详细

导航
相关文章

AI思维导图

/