基于检索增强生成的化工领域大模型智能问答

宋凯, 陈泽华, 娄娟, 陈建, 董宇轩, 魏啸然

天津大学学报(自然科学与工程技术版) ›› 2026, Vol. 59 ›› Issue (2) : 212 -220.

PDF
天津大学学报(自然科学与工程技术版) ›› 2026, Vol. 59 ›› Issue (2) : 212 -220.

基于检索增强生成的化工领域大模型智能问答

    宋凯, 陈泽华, 娄娟, 陈建, 董宇轩, 魏啸然
作者信息 +

Author information +
文章历史 +
PDF

摘要

化工设备设计需要严格依照标准规范.然而标准规范数量多、内容上相互引用,设计人员面对非常规的设计要求或设计问题时很难准确、全面地查找到所有涉及的标准规范条目.利用检索增强生成(RAG)技术结合大语言模型(LLM)可以对设计要求或设计问题进行准确回答的同时分析并提供相应标准规范内容,从而避免遗漏相关的标准规范.然而,由于化工设备设计领域知识库中具有大量公式、图表等复杂数据,如何构建相应的结构化RAG数据库实现LLM在化工设备设计领域的智能问答尚不明确.针对上述问题,本文提出了一种垂直领域的复杂数据智能问答系统构建一体化框架,该框架结合提示工程方法与多个视觉语言模型以实现RAG数据库的构建,采用语义检索与重排序技术,并选取嵌入模型与大语言模型分别作为检索器与生成器,以实现基于RAG的智能问答.基于该框架,本文构建了化工设备设计领域的智能问答系统,并使用Qwen2.5-72b和Qwen2.5-7b模型在以GB/T 150—2011规范为主的压力容器设计问答数据集上进行实验.结果表明,本文所提出的框架在复杂数据提取的准确性上优于现有技术,并通过RAG技术显著提升了问答系统的性能.相比于未结合RAG的技术,Qwen2.5-72b和Qwen2.5-7b模型的准确率分别提高了19.3%和17.7%.此外还对生成器接受的文档块数量对问答系统准确性的影响与设备设计领域数据的泛化性能进行了研究.

关键词

大语言模型 / 检索增强生成 / 化工设备设计 / 智能问答 / 复杂数据信息提取

Key words

引用本文

引用格式 ▾
基于检索增强生成的化工领域大模型智能问答[J]. 天津大学学报(自然科学与工程技术版), 2026, 59(2): 212-220 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/