结合关键字提取和图对比学习的文档版面分析

马晓松, 刘杰, 李晓辉, 郭颖

小型微型计算机系统 ›› 2026, Vol. 47 ›› Issue (1) : 150 -156.

PDF
小型微型计算机系统 ›› 2026, Vol. 47 ›› Issue (1) : 150 -156. DOI: 10.20009/j.cnki.21-1106/TP.2024-0567

结合关键字提取和图对比学习的文档版面分析

    马晓松, 刘杰, 李晓辉, 郭颖
作者信息 +

Author information +
文章历史 +
PDF

摘要

文档版面分析是信息检索和文档理解领域的重要任务和必要前提.传统的文档版面分析方法往往忽略了文本内容与结构之间的深度关联.本文提出了基于图神经网络结合大语言模型和图对比学习的方法,以提高文档版面分析的精确度.首先,通过大语言模型自动提取关键字并融合到图节点中,增强了图神经网络对文档内容与结构的理解.其次,采用图对比学习,通过视图间对比损失优化节点表示,使模型更有效地区分文档布局模式.实验结果表明,在DocLayNet数据集上的测试中,该方法显著提升了文档版面分析的准确率,优于现有的基准方法.本文的方法为文档理解与信息提取领域提供了一种新的技术路径,有望在更多实际应用中得到广泛应用.

关键词

图神经网络 / 大模型 / 多模态 / 图对比学习 / 文档版面分析

Key words

引用本文

引用格式 ▾
结合关键字提取和图对比学习的文档版面分析[J]. 小型微型计算机系统, 2026, 47(1): 150-156 DOI:10.20009/j.cnki.21-1106/TP.2024-0567

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/