面向文档的检索增强生成技术综述

黄天金, 朱兴动, 刘凯, 汪时交, 赵鹏

小型微型计算机系统 ›› 2026, Vol. 47 ›› Issue (2) : 282 -297.

PDF
小型微型计算机系统 ›› 2026, Vol. 47 ›› Issue (2) : 282 -297. DOI: 10.20009/j.cnki.21-1106/TP.2025-0249

面向文档的检索增强生成技术综述

    黄天金, 朱兴动, 刘凯, 汪时交, 赵鹏
作者信息 +

Author information +
文章历史 +
PDF

摘要

大语言模型(LLMs)的迅速发展正在全球范围内引发深刻的技术变革.检索增强生成(RAG)作为一种通过融合外部知识以提升模型输出准确性、时效性与可靠性的技术范式,已成为增强LLM应用效能的关键手段.从“文档”的视角,提出“文档全谱系”概念,构建一个包含文档处理、嵌入与索引、检索、生成四大组件的RAG基础框架,并进行形式化描述.围绕“文档特性-优化策略”映射关系,系统梳理各项技术的最新进展,涵盖复杂文档处理、领域适应性嵌入、高级检索策略、可信生成等关键环节.最后,分析当前挑战,并展望未来发展方向.为相关领域的研究者和实践者提供一个以解决真实世界文档问题为导向的系统性参考.

关键词

检索增强生成 / 大语言模型 / 文档理解 / 知识检索 / 模型上下文协议(MCP)

Key words

引用本文

引用格式 ▾
面向文档的检索增强生成技术综述[J]. 小型微型计算机系统, 2026, 47(2): 282-297 DOI:10.20009/j.cnki.21-1106/TP.2025-0249

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/