基于多源数据融合的裁判文书说理生成方法

姚林波, 周裕林, 黄瑞章, 陈艳平, 秦永彬

广西大学学报(自然科学版) ›› 2025, Vol. 50 ›› Issue (06) : 1304 -1319.

PDF
广西大学学报(自然科学版) ›› 2025, Vol. 50 ›› Issue (06) : 1304 -1319. DOI: 10.13624/j.cnki.issn.1001-7445.2025.1304

基于多源数据融合的裁判文书说理生成方法

    姚林波, 周裕林, 黄瑞章, 陈艳平, 秦永彬
作者信息 +

Author information +
文章历史 +
PDF

摘要

为了解决传统大语言模型在裁判文书说理生成中存在的逻辑一致性和法律合规性问题,提出一种基于多源数据融合的裁判文书说理生成方法。该方法首先构建类案知识库,整合案件事实、法院说理、法律条文及司法解释等多源法律数据,以提升大模型在法律推理中的适用性和生成质量;其次,采用大语言模型微调,使其更精准地理解和分析案件事实;然后,结合检索增强生成技术,从类案知识库中检索出相似案例及其法院说理;最后,基于案件事实,动态构建半结构化提示词模板,优化提示学习过程,生成符合法律逻辑的高质量法院说理内容。结果表明该方法JRGD数据集上,ROUGE-1、ROUGE-2、ROUGE-L的F1值和BERTScore指标分别提升了26.01%、24.19%、25.63%和14.45%,在CAIL2024数据集上,各指标分别提升了19.60%、10.96%、11.72%和8.71%。

关键词

检索增强生成 / 大语言模型 / 微调 / 动态提示学习 / 裁判文书说理生成

Key words

引用本文

引用格式 ▾
基于多源数据融合的裁判文书说理生成方法[J]. 广西大学学报(自然科学版), 2025, 50(06): 1304-1319 DOI:10.13624/j.cnki.issn.1001-7445.2025.1304

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

24

访问

0

被引

详细

导航
相关文章

AI思维导图

/