基于多源数据融合的裁判文书说理生成方法

姚林波; 周裕林; 黄瑞章; 陈艳平; 秦永彬

doi:10.13624/j.cnki.issn.1001-7445.2025.1304

广西大学学报（自然科学版） ›› 2025, Vol. 50 ›› Issue (06) : 1304 -1319. DOI: 10.13624/j.cnki.issn.1001-7445.2025.1304

基于多源数据融合的裁判文书说理生成方法

姚林波, 周裕林, 黄瑞章, 陈艳平, 秦永彬

作者信息 +

Author information +

文章历史 +

PDF

摘要

为了解决传统大语言模型在裁判文书说理生成中存在的逻辑一致性和法律合规性问题，提出一种基于多源数据融合的裁判文书说理生成方法。该方法首先构建类案知识库，整合案件事实、法院说理、法律条文及司法解释等多源法律数据，以提升大模型在法律推理中的适用性和生成质量；其次，采用大语言模型微调，使其更精准地理解和分析案件事实；然后，结合检索增强生成技术，从类案知识库中检索出相似案例及其法院说理；最后，基于案件事实，动态构建半结构化提示词模板，优化提示学习过程，生成符合法律逻辑的高质量法院说理内容。结果表明该方法JRGD数据集上，ROUGE-1、ROUGE-2、ROUGE-L的F₁值和BERTScore指标分别提升了26.01%、24.19%、25.63%和14.45%,在CAIL2024数据集上，各指标分别提升了19.60%、10.96%、11.72%和8.71%。